记录

记录

claude-hud 深入解读

Agent 时代的开发者可观测性补丁,为什么它值得认真看

项目信息 先说结论 README/公开描述里,它到底在做什么 我的工程判断:它解决的是 agent 使用里的一个真实痛点 为什么现在值得看 1. Agent 正在从“偶尔用一下”进入“长时间协作”阶段 2. 可观测性会成为 agent 工具的分水岭 3. 它的切入点很轻,但价值不轻 它具体解决了什么问题 ...

OS-Themis: 面向通用 GUI 奖励的可扩展 Critic 框架

"把 GUI trajectory 先拆成可验证里程碑,再用 reviewer/judge 压假阳性"

0. 论文信息 1. 先说结论 2. 它在解决什么问题? 3. 核心思路一句话 4. 方法拆解(按可复现视角写) 4.1 总体结构:两级 critic A) Milestone Verification Module(MVM) B) Verdict Calibration Module(VCM)...

obra/superpowers 深入解读:一个面向可落地的 Agent Skills 框架

把技能驱动的代理能力带入实际软件工程的落地路径

#obra/superpowers 深入解读 项目简述 obra/superpowers 是一个以代理能力为核心的技能框架,强调将可执行的技能模块化、可组合化,帮助 Agent/LLM 在实际软件开发中按任务流来组织能力、并实现端到端工作流的自动化。该框架强调“技能即服务”的理念,鼓励把复杂工作流拆解成可复用的能力块。 简评(3 个候选项) 项目名:obra/superpowers...

RAPTOR 深入解读

递归摘要树检索,不只是换一种 RAG 索引结构

项目信息 先说结论 RAPTOR 想解决的根问题是什么 1. 语义被切碎了 2. 没有文档层级感 3. top-k chunk 很难同时兼顾“全局”和“局部” 这个仓库的核心实现结构 1. Node / Tree:先定义统一树结构 建树过程:不是简单总结,而是递归压缩语义 ...

open-swe 深入解读

开源版企业内部 Coding Agent 架构,为什么值得认真看

项目信息 先说结论:open-swe 值不值得跟 它到底在解决什么问题 open-swe 最有价值的点,不是“会写代码”,而是“像系统一样工作” 1. 每个任务都跑在独立云沙箱里 2. 它把组织协作入口放在一线,而不是最后补一个 webhook 3. 它允许任务进行中接收新的输入 4. 它默认把 PR 闭环做进去 ...

TDAD: 用图式测试影响分析降低 AI Coding Agent 回归

"Tell the agent which tests to check, not just how to do TDD"

0. 论文信息 1. 先说结论 2. 它在解决什么问题? 3. 核心思路一句话 4. 方法拆解(按可复现视角写) 4.1 系统总览 阶段 A:离线建图 / 索引 阶段 B:在线影响分析 4.2 图谱 schema N...

deepagents 深入解读

LangChain 为什么开始认真做 Agent Harness

项目信息 先说结论:deepagents 值不值得跟 它到底在补什么坑 为什么说它不是“又一个 agent 框架” 1. 任务不是一次生成,而是一个过程 2. 文件系统不是附属品,而是任务记忆的一部分 3. 子代理不是为了酷,而是为了隔离复杂度 deepagents 最适合什么场景 1. 代...

Chronos: Temporal-Aware Conversational Agents with Structured Event Retrieval for Long-Term Memory

"Event calendar + turn calendar + dynamic prompting for long-term temporal memory"

0. 论文信息 1. 这篇在解决什么问题? 2. 核心思路(一句话) 3. 方法(可复现视角) 3.1 两个日历(两个索引) A) Turn Calendar(原始对话索引) B) Event Calendar(结构化事件索引) 3.2 Indexing:...

XSkill

"Continual Learning from Experience and Skills in Multimodal Agents"

论文信息 这篇论文在做什么 核心方法 1. 双流知识库:Skill + Experience Skill Library Experience Bank 2. 两阶段框架 Phase I:Accumulate(积累知识) ...

llama

"llama"

Llama 结构 加速训练 指令微调 Pre-normalization优势 其它 Llama2 数据清洗 改进点 SFT llama2-chat reward model ...