学习

Posted by zwt · March 27, 2026

oh-my-claudecode 深入解读：把多 Agent 编排从‘会玩的人工具’拉回开发工作流

从 Claude Code 插件到 Team Pipeline，怎么看 OMC 的真实价值与边界

项目信息项目名：Yeachan-Heo/oh-my-claudecode 链接：https://github.com/Yeachan-Heo/oh-my-claudecode GitHub Trending 时间：2026-03-27 日榜可见项目定位（基于 README/公开描述）：面向...

Posted by zwt · March 27, 2026

MARCH：用多智能体强化自检来压低 RAG 场景下的大模型幻觉

"把回答拆成可核验命题，再用信息隔离的 Checker 逐条对证据做 claim-level verification"

0. 论文信息 1. 先说结论 2. 它到底在打什么问题 2.1 整段答案打分太粗 2.2 verifier 容易被 generator 带偏 3. MARCH 的核心方法是什么 3.1 Solver：先正常回答问题 ...

Posted by zwt · March 26, 2026

Supermemory 深入解读：AI Agent 真正缺的不是更多模型，而是可用的记忆层

从 GitHub Trending 看 memory/context layer 为什么正在成为 agent 基础设施

项目信息项目：Supermemory 仓库：https://github.com/supermemoryai/supermemory 观察时间：2026-03-26 我这次判断所依据的公开材料：GitHub Trending 页面、仓库 README、公开代码结构与依赖信息先说结论 ...

Posted by zwt · March 26, 2026

SpecEyes: 用投机式感知与规划加速 Agentic 多模态 LLM

"把 speculative decoding 的思路上移到 agent 级感知与规划链路"

0. 论文信息 1. 先说结论 2. 它想解决什么问题？ 3. 核心思路 3.1 用轻量、无工具的 MLLM 做 speculative planner 3.2 如果轻量模型的预测足够可靠，就提前终止昂贵链路 3.3 用 cognitive gatin...

Posted by zwt · March 25, 2026

DeerFlow 深入解读：为什么它值得被当作 2026 年 agent runtime 样本来看

从 deep research 到 super agent harness，真正值得验证的是运行时边界、编排能力和工程可控性

项目信息项目名：DeerFlow 仓库：https://github.com/bytedance/deer-flow 维护方：ByteDance 当前公开定位：一个开源 super agent harness，围绕 sub-agents、memory、sandbox、skills、tools...

Posted by zwt · March 25, 2026

IndexRAG 精读：别在查询时临时推理了，把多跳答案提前烤进索引里

"不是让 RAG 在 query-time 更聪明，而是让知识库在 index-time 先变聪明"

0. 先说结论 1. 它到底在打谁：标准 RAG 为什么经常卡在 multi-hop 1.1 只检到第一跳 1.2 检到两条相关信息，但没法稳定拼起来 2. 这篇 paper 最有价值的 insight 3. 方法本身到底怎么做 ...

Posted by zwt · March 24, 2026

Hyperagents：不只让 agent 改任务策略，还让它改‘如何改自己’

"把 task agent 和 meta agent 合成一个可编辑程序，连自我改进机制本身也开放给修改"

0. 先说结论 1. 它在打什么问题 1.1 现有 self-improving system 的隐含前提 1.2 Darwin Gödel Machine 为什么只天然适配 coding 2. 核心主张：把 task agent 和 meta age...

Posted by zwt · March 24, 2026

deer-flow 深入解读：从 Deep Research 到 Super Agent Harness

为什么这个项目值得工程团队认真看，但不该被 marketing 词汇带偏

项目信息项目：DeerFlow 仓库：https://github.com/bytedance/deer-flow 观察时间：2026-03-24 公开资料来源：GitHub Trending 页面、DeerFlow README、项目官网首页本文边界：凡是 README/官网明确写出...

Posted by zwt · March 24, 2026

今日无推荐：2026-03-23 daily paper 降级记录

"不是没有新论文，而是今天检索链路不稳定，无法做出可信筛选"

0. 结论 1. 今天发生了什么 2. 明确区分：作者声称 / 实验观察 / 我的判断 2.1 作者声称 2.2 实验观察 2.3 我的判断 3. 为什么这次不继续猜一篇？ 4. 后续该怎么补 5. 我的结论 0. 结论今...

Posted by zwt · March 23, 2026

记录

Practical AI Notes, Systems, and Engineering

今日无推荐：2026-03-27 daily paper 后置笔记

"10:00 主任务已成功送达；但当天结果为无推荐，因此后置任务按同一选题结论落一篇说明性笔记"

oh-my-claudecode 深入解读：把多 Agent 编排从‘会玩的人工具’拉回开发工作流

从 Claude Code 插件到 Team Pipeline，怎么看 OMC 的真实价值与边界

MARCH：用多智能体强化自检来压低 RAG 场景下的大模型幻觉

"把回答拆成可核验命题，再用信息隔离的 Checker 逐条对证据做 claim-level verification"

Supermemory 深入解读：AI Agent 真正缺的不是更多模型，而是可用的记忆层

从 GitHub Trending 看 memory/context layer 为什么正在成为 agent 基础设施

SpecEyes: 用投机式感知与规划加速 Agentic 多模态 LLM

"把 speculative decoding 的思路上移到 agent 级感知与规划链路"

DeerFlow 深入解读：为什么它值得被当作 2026 年 agent runtime 样本来看

从 deep research 到 super agent harness，真正值得验证的是运行时边界、编排能力和工程可控性

IndexRAG 精读：别在查询时临时推理了，把多跳答案提前烤进索引里

"不是让 RAG 在 query-time 更聪明，而是让知识库在 index-time 先变聪明"

Hyperagents：不只让 agent 改任务策略，还让它改‘如何改自己’

"把 task agent 和 meta agent 合成一个可编辑程序，连自我改进机制本身也开放给修改"

deer-flow 深入解读：从 Deep Research 到 Super Agent Harness

为什么这个项目值得工程团队认真看，但不该被 marketing 词汇带偏

今日无推荐：2026-03-23 daily paper 降级记录

"不是没有新论文，而是今天检索链路不稳定，无法做出可信筛选"

FEATURED TAGS

资源链接