记录

聚焦 NLP、机器学习、深度学习与工程实践的学习记录与项目笔记
AI · NLP · ML · Engineering

Practical AI Notes, Systems, and Engineering

围绕 NLP、LLM、机器学习与工程实践,持续沉淀值得复用的方法、系统设计、实验记录与项目思考。

Focus NLP / LLM / ML
Style Notes · Practice · Systems
Content Articles · Experiments · Engineering
Latest Posts

今日无推荐:2026-03-27 daily paper 后置笔记

"10:00 主任务已成功送达;但当天结果为无推荐,因此后置任务按同一选题结论落一篇说明性笔记"

0. 结论 1. 今天发生了什么 2. 为什么后置任务不能偷偷改成“补推一篇” 2.1 一致性比事后补救更重要 2.2 主任务没有确认过的题,不应在后置任务里偷偷定稿 2.3 失败要被显式记录,而不是被掩盖 3. 今天这次“无推荐”到底...

oh-my-claudecode 深入解读:把多 Agent 编排从‘会玩的人工具’拉回开发工作流

从 Claude Code 插件到 Team Pipeline,怎么看 OMC 的真实价值与边界

项目信息 项目名:Yeachan-Heo/oh-my-claudecode 链接:https://github.com/Yeachan-Heo/oh-my-claudecode GitHub Trending 时间:2026-03-27 日榜可见 项目定位(基于 README/公开描述):面向...

MARCH:用多智能体强化自检来压低 RAG 场景下的大模型幻觉

"把回答拆成可核验命题,再用信息隔离的 Checker 逐条对证据做 claim-level verification"

0. 论文信息 1. 先说结论 2. 它到底在打什么问题 2.1 整段答案打分太粗 2.2 verifier 容易被 generator 带偏 3. MARCH 的核心方法是什么 3.1 Solver:先正常回答问题 ...

Supermemory 深入解读:AI Agent 真正缺的不是更多模型,而是可用的记忆层

从 GitHub Trending 看 memory/context layer 为什么正在成为 agent 基础设施

项目信息 项目:Supermemory 仓库:https://github.com/supermemoryai/supermemory 观察时间:2026-03-26 我这次判断所依据的公开材料:GitHub Trending 页面、仓库 README、公开代码结构与依赖信息 先说结论 ...

SpecEyes: 用投机式感知与规划加速 Agentic 多模态 LLM

"把 speculative decoding 的思路上移到 agent 级感知与规划链路"

0. 论文信息 1. 先说结论 2. 它想解决什么问题? 3. 核心思路 3.1 用轻量、无工具的 MLLM 做 speculative planner 3.2 如果轻量模型的预测足够可靠,就提前终止昂贵链路 3.3 用 cognitive gatin...

DeerFlow 深入解读:为什么它值得被当作 2026 年 agent runtime 样本来看

从 deep research 到 super agent harness,真正值得验证的是运行时边界、编排能力和工程可控性

项目信息 项目名:DeerFlow 仓库:https://github.com/bytedance/deer-flow 维护方:ByteDance 当前公开定位:一个开源 super agent harness,围绕 sub-agents、memory、sandbox、skills、tools...

IndexRAG 精读:别在查询时临时推理了,把多跳答案提前烤进索引里

"不是让 RAG 在 query-time 更聪明,而是让知识库在 index-time 先变聪明"

0. 先说结论 1. 它到底在打谁:标准 RAG 为什么经常卡在 multi-hop 1.1 只检到第一跳 1.2 检到两条相关信息,但没法稳定拼起来 2. 这篇 paper 最有价值的 insight 3. 方法本身到底怎么做 ...

Hyperagents:不只让 agent 改任务策略,还让它改‘如何改自己’

"把 task agent 和 meta agent 合成一个可编辑程序,连自我改进机制本身也开放给修改"

0. 先说结论 1. 它在打什么问题 1.1 现有 self-improving system 的隐含前提 1.2 Darwin Gödel Machine 为什么只天然适配 coding 2. 核心主张:把 task agent 和 meta age...

deer-flow 深入解读:从 Deep Research 到 Super Agent Harness

为什么这个项目值得工程团队认真看,但不该被 marketing 词汇带偏

项目信息 项目:DeerFlow 仓库:https://github.com/bytedance/deer-flow 观察时间:2026-03-24 公开资料来源:GitHub Trending 页面、DeerFlow README、项目官网首页 本文边界:凡是 README/官网明确写出...

今日无推荐:2026-03-23 daily paper 降级记录

"不是没有新论文,而是今天检索链路不稳定,无法做出可信筛选"

0. 结论 1. 今天发生了什么 2. 明确区分:作者声称 / 实验观察 / 我的判断 2.1 作者声称 2.2 实验观察 2.3 我的判断 3. 为什么这次不继续猜一篇? 4. 后续该怎么补 5. 我的结论 0. 结论 今...