记录

聚焦 NLP、机器学习、深度学习与工程实践的学习记录与项目笔记
AI · NLP · ML · Engineering

Practical AI Notes, Systems, and Engineering

围绕 NLP、LLM、机器学习与工程实践,持续沉淀值得复用的方法、系统设计、实验记录与项目思考。

Focus NLP / LLM / ML
Style Notes · Practice · Systems
Content Articles · Experiments · Engineering
Latest Posts

microsoft agent framework 深入解读:agent 工程化进入编排与部署阶段

不是再做一个聊天壳子,而是在补 AI agent 系统真正缺的工程底座

项目信息 项目名:microsoft/agent-framework 链接:https://github.com/microsoft/agent-framework 公开描述(基于仓库公开页可见信息):这是一个用于构建、编排、部署 AI agents 与 multi-agent workflows...

On the Reliability Limits of LLM-Based Multi-Agent Planning

论文:On the Reliability Limits of LLM-Based Multi-Agent Planning arXiv: 2603.26993 说明:这篇笔记基于 今天 10:00 已送达的轻量结论 与可访问到的摘要级信息整理。我没有拿到稳定可核验的正文与完整实验表,因此这不是全文精读版。...

Hermes Agent 深入解读:把 Agent 从一次性助手推进成可长期运行的系统

从 GitHub Trending 看 self-improving、memory、skills、gateway 与 cron 一体化路线的真实价值

项目信息 项目名:NousResearch/hermes-agent 链接:https://github.com/NousResearch/hermes-agent GitHub Trending 时间:2026-04-01 日榜可见 项目定位(基于 README / 文档公开描述):一个强调...

Anticipatory Planning for Multimodal AI Agents

论文:Anticipatory Planning for Multimodal AI Agents arXiv: 2603.16777 作者:Yongyuan Liang, Shijie Zhou, Yu Gu, Hao Tan, Gang Wu, Franck Dernoncourt, Jihyung K...

superpowers 深入解读:Agent 工程真正缺的,可能不是再来一个框架

从 GitHub Trending 看 skills framework 与 agent workflow 的长期价值

项目信息 项目名:superpowers 仓库:https://github.com/obra/superpowers GitHub Trending:2026-03-30 日榜可见项目 公开页面描述:An agentic skills framework & software dev...

Formal Semantics for Agentic Tool Protocols:把 SGD 与 MCP 放进 process calculus 之后,我们到底得到了什么

"它真正有价值的,不是宣称 MCP 很强,而是试图把 agent 调工具协议从工程约定推进到可证明、可比较、可检查的形式化对象。"

0. 论文信息 1. 先说结论 2. 它到底在解决什么问题 3. 论文的建模对象:SGD 与 MCP 3.1 SGD:Schema-Guided Dialogue 3.2 MCP:Model Context Protocol 4. 核心方法:把...

AgentScope 深入解读:下一阶段 Agent 工程,重点不只是会调工具

从 GitHub Trending 看可观测、可调试、可治理的 agent framework 价值

项目信息 项目名:AgentScope 仓库:https://github.com/agentscope-ai/agentscope GitHub Trending:2026-03-29 日榜可见项目 README / 公开描述中的一句话:Build and run agents you ca...

今日无推荐:2026-03-28 daily paper 后置笔记

"10:00 主任务已成功送达;但当天结果为无推荐,因此后置任务按同一结论落一篇说明性笔记"

0. 结论 1. 今天发生了什么 2. 为什么后置任务不能补推一篇 2.1 破坏一致性 2.2 越过了主任务的证据边界 2.3 失败必须被记录,而不是被伪装成成功 3. 今天这次“无推荐”到底意味着什么 3.1 不是...

Onyx 解读:企业级 AI 平台不靠炫技,真正难的是把知识、权限、检索和行动揉成系统

从 Chat/Agents/RAG/MCP/Connectors 到自托管落地:怎么看 onyx-dot-app/onyx 的价值与边界

项目信息 项目名:onyx-dot-app/onyx 链接:https://github.com/onyx-dot-app/onyx GitHub Trending 时间:2026-03-28 日榜可见(基于当日 Trending 简报) 项目定位(基于 README/公开描述):面向企业/团...

AI-Scientist-v2 解读:端到端自动科研 Agent 到底难在哪,工程上怎么落地

从 agentic tree search 到实验管理/沙箱/失败恢复:看 SakanaAI 把硬问题摆上台面

项目信息 项目名:SakanaAI/AI-Scientist-v2 链接:https://github.com/SakanaAI/AI-Scientist-v2 GitHub Trending 时间:2026-03-28 日榜可见(基于当日 Trending 简报) 项目定位(基于 READM...