记录

记录

RAPTOR 深入解读

递归摘要树检索,不只是换一种 RAG 索引结构

项目信息 先说结论 RAPTOR 想解决的根问题是什么 1. 语义被切碎了 2. 没有文档层级感 3. top-k chunk 很难同时兼顾“全局”和“局部” 这个仓库的核心实现结构 1. Node / Tree:先定义统一树结构 建树过程:不是简单总结,而是递归压缩语义 ...

open-swe 深入解读

开源版企业内部 Coding Agent 架构,为什么值得认真看

项目信息 先说结论:open-swe 值不值得跟 它到底在解决什么问题 open-swe 最有价值的点,不是“会写代码”,而是“像系统一样工作” 1. 每个任务都跑在独立云沙箱里 2. 它把组织协作入口放在一线,而不是最后补一个 webhook 3. 它允许任务进行中接收新的输入 4. 它默认把 PR 闭环做进去 ...

TDAD: 用图式测试影响分析降低 AI Coding Agent 回归

"Tell the agent which tests to check, not just how to do TDD"

0. 论文信息 1. 先说结论 2. 它在解决什么问题? 3. 核心思路一句话 4. 方法拆解(按可复现视角写) 4.1 系统总览 阶段 A:离线建图 / 索引 阶段 B:在线影响分析 4.2 图谱 schema N...

deepagents 深入解读

LangChain 为什么开始认真做 Agent Harness

项目信息 先说结论:deepagents 值不值得跟 它到底在补什么坑 为什么说它不是“又一个 agent 框架” 1. 任务不是一次生成,而是一个过程 2. 文件系统不是附属品,而是任务记忆的一部分 3. 子代理不是为了酷,而是为了隔离复杂度 deepagents 最适合什么场景 1. 代...

Chronos: Temporal-Aware Conversational Agents with Structured Event Retrieval for Long-Term Memory

"Event calendar + turn calendar + dynamic prompting for long-term temporal memory"

0. 论文信息 1. 这篇在解决什么问题? 2. 核心思路(一句话) 3. 方法(可复现视角) 3.1 两个日历(两个索引) A) Turn Calendar(原始对话索引) B) Event Calendar(结构化事件索引) 3.2 Indexing:...

XSkill

"Continual Learning from Experience and Skills in Multimodal Agents"

论文信息 这篇论文在做什么 核心方法 1. 双流知识库:Skill + Experience Skill Library Experience Bank 2. 两阶段框架 Phase I:Accumulate(积累知识) ...

llama

"llama"

Llama 结构 加速训练 指令微调 Pre-normalization优势 其它 Llama2 数据清洗 改进点 SFT llama2-chat reward model ...

对齐

"对齐"

LIMA:Less Is More for Alignment

微调

"微调"

为什么需要高效微调 Adapter Tuning Prefix Tuning prompt tuning p-tuningv1 p-tuningv2 lora 基础 训练策略 qlora Quantize 4-bit NormalFloat Double Quanti...

matplotlib

"matplotlib"

中文乱码问题 中文乱码问题 删除缓存 1 2 3 import matplotlib as mpl print(mpl.get_cachedir()) # /Users/xiewenwen/.matplotlib 下载字体SimHei fc-cache -fv 刷新字体缓存 测试: ```python import matplotlib as ...