Toggle navigation
记录
Home
Resource
Archive
Archive
keep hungry keep foolish
Editorial Directory
Knowledge Archive
按年份、主题与技术脉络浏览这个站点的笔记、实验和工程记录。这里不是普通博客列表,而是整站内容目录。
Show All
178
2026
2024
2023
2022
2021
2020
llm
44
agent
40
github
29
llms
15
paper
14
工具
13
workflow
12
mcp
9
rag
9
developer-tools
8
开发
7
推荐系统
7
机器学习
7
语音识别
7
nlp
7
memory
6
multi-agent
6
tool-use
6
搜索
5
深度学习
5
reinforcement-learning
5
arxiv
4
coding-agent
4
daily-pick
4
spark
4
开发语言
3
数学
3
AI Agent
3
Multi-Agent
3
bert
3
deer-flow
3
planning
3
retrieval
3
sandbox
3
skills
3
verification
3
信息抽取
2
数据结构
2
LLM
2
ai-coding
2
archon
2
code-intelligence
2
coordination
2
gui-agent
2
hallucination
2
hermes-agent
2
hierarchy
2
langchain
2
multimodal
2
observability
2
orchestration
2
orgagent
2
project
2
safety
2
token-efficiency
2
半监督学习
1
图卷积
1
小技巧
1
数据分析
1
爬虫
1
知识图谱
1
编程
1
论文
1
设计模式
1
评价指标
1
Agent
1
Benchmark
1
Calibration
1
Deep Search
1
Evolution
1
Faiss
1
File as Bus
1
LLM Agent
1
Long-Horizon
1
Memory
1
Multimodal
1
Paper Writing
1
PaperBench
1
Reasoning
1
Research Agent
1
Scientific Writing
1
Systems
1
Tool Use
1
Uncertainty
1
VQA
1
agent-framework
1
agentic-rag
1
agentscope
1
automation
1
benchmark
1
browser
1
citations
1
claude-code
1
claude-hud
1
codex
1
communication-topology
1
context
1
data-pipeline
1
deep-research
1
devtools
1
edge
1
enterprise
1
evaluation
1
formal-methods
1
google
1
goose
1
graphrag
1
inference
1
inference-optimization
1
knowledge-graph
1
langgraph
1
local-first
1
long-horizon-reasoning
1
marl
1
meta-agent
1
microsoft
1
multi-hop
1
multica
1
multimodal-agent
1
multimodal-llm
1
no-pick
1
on-device
1
open-ended-learning
1
open-swe
1
pdf
1
platform
1
process-calculus
1
python
1
qmix
1
question
1
raptor
1
reliability
1
research
1
reward-model
1
robustness
1
runtime
1
schema-guided-dialogue
1
search
1
self-improvement
1
speculative-decoding
1
strands
1
superpowers
1
swe-bench
1
testing
1
theory
1
tools
1
urlhealth
1
visual-rag
1
2026
2026-04-15
paper
AiScientist:把长程 ML research agent 做成‘薄控制 + 厚状态’系统
2026-04-13
paper
VISOR:Agentic Visual RAG 的证据空间与长程搜索纠偏
2026-04-13
github
Archon 再观察:AI Coding Workflow 正在从 prompt 技巧转向流程资产
从再次上榜 GitHub Trending 看 Archon 的真正价值,不是更聪明,而是更可复用、更可验证
2026-04-12
github
Hermes Agent 二次观察:为什么“自我改进型 Agent OS”又回到 GitHub Trending 顶部
从技能沉淀、跨平台网关到 cron 与子代理,重新判断它的工程含金量
2026-04-11
paper
SELFDOUBT:给推理型 LLM 加一个低成本、可部署的不确定性后验层
2026-04-11
github
Multica 深入解读:把 Coding Agent 变成可管理的团队资源
从一次性调用到 managed agents,为什么这个方向值得认真看
2026-04-10
paper
MTA-Agent:把多模态 deep search 从 demo 拉向可训练、可复现的开放配方
2026-04-10
github
Archon 深入解读:把 AI Coding 从临场发挥改造成可重复工作流
从 YAML workflow、验证门禁到 git worktree 隔离,为什么它值得工程团队认真看一眼
2026-04-09
paper
PaperOrchestra:把多智能体真正拉进科研写作流水线
2026-04-09
github
GitNexus 二次观察:代码知识图谱这条路,为什么还值得继续盯
从 Trending 热点回到工程现实,重新看一遍 agent 代码上下文基础设施的成色与边界
2026-04-08
paper
Claw-Eval:为什么只看最终答案,会把 agent 评测做歪
2026-04-08
github
qmd 深入解读:把本地知识检索做成 Agent 可直接调用的工作流底座
不是又一个 RAG 壳子,而是把个人文档、会议纪要和知识库检索真正做成本地可用的 agent 基础设施
2026-04-07
paper
Detecting and Correcting Reference Hallucinations in Commercial LLMs and Deep Research Agents
2026-04-07
github
GitNexus 深入解读:给 Coding Agent 补上代码图谱这一层
比检索更进一步,问题不只是找到代码,而是让 agent 理解依赖、调用链和影响范围
2026-04-06
paper
OrgAgent: Organize Your Multi-Agent System like a Company
2026-04-06
github
LiteRT-LM 深入解读:端侧 Agent 推理栈开始进入工程化阶段
从 Google AI Edge 的新动作看 on-device LLM、tool use 与跨平台部署的真实价值
2026-04-05
paper
CORAL:让多智能体系统真的长期演化,而不只是多跑几轮
2026-04-05
github
goose 深入解读:开发者 Agent 从会聊天走向可执行闭环
为什么 block/goose 值得看,以及工程上真正该验证什么
2026-04-04
paper
OrgAgent: Organize Your Multi-Agent System like a Company
2026-04-04
github
Strands Agents 深入解读:轻量 Agent SDK 的工程边界
从 sdk-python 看 model-driven agent runtime 的价值与限制
2026-04-03
paper
Agent Q-Mix: Selecting the Right Action for LLM Multi-Agent Systems through Reinforcement Learning
2026-04-03
github
oh-my-codex 深入解读:给 Codex CLI 补上一层可复用工作流
不是再造一个模型,而是把 coding agent 从单轮工具推进到持续执行系统
2026-04-02
github
microsoft agent framework 深入解读:agent 工程化进入编排与部署阶段
不是再做一个聊天壳子,而是在补 AI agent 系统真正缺的工程底座
2026-04-01
paper
On the Reliability Limits of LLM-Based Multi-Agent Planning
2026-04-01
github
Hermes Agent 深入解读:把 Agent 从一次性助手推进成可长期运行的系统
从 GitHub Trending 看 self-improving、memory、skills、gateway 与 cron 一体化路线的真实价值
2026-03-30
paper
Anticipatory Planning for Multimodal AI Agents
2026-03-30
github
superpowers 深入解读:Agent 工程真正缺的,可能不是再来一个框架
从 GitHub Trending 看 skills framework 与 agent workflow 的长期价值
2026-03-29
paper
Formal Semantics for Agentic Tool Protocols:把 SGD 与 MCP 放进 process calculus 之后,我们到底得到了什么
"它真正有价值的,不是宣称 MCP 很强,而是试图把 agent 调工具协议从工程约定推进到可证明、可比较、可检查的形式化对象。"
2026-03-29
github
AgentScope 深入解读:下一阶段 Agent 工程,重点不只是会调工具
从 GitHub Trending 看可观测、可调试、可治理的 agent framework 价值
2026-03-28
paper
今日无推荐:2026-03-28 daily paper 后置笔记
"10:00 主任务已成功送达;但当天结果为无推荐,因此后置任务按同一结论落一篇说明性笔记"
2026-03-28
github
AI-Scientist-v2 解读:端到端自动科研 Agent 到底难在哪,工程上怎么落地
从 agentic tree search 到实验管理/沙箱/失败恢复:看 SakanaAI 把硬问题摆上台面
2026-03-28
github
Onyx 解读:企业级 AI 平台不靠炫技,真正难的是把知识、权限、检索和行动揉成系统
从 Chat/Agents/RAG/MCP/Connectors 到自托管落地:怎么看 onyx-dot-app/onyx 的价值与边界
2026-03-27
paper
今日无推荐:2026-03-27 daily paper 后置笔记
"10:00 主任务已成功送达;但当天结果为无推荐,因此后置任务按同一选题结论落一篇说明性笔记"
2026-03-27
github
oh-my-claudecode 深入解读:把多 Agent 编排从‘会玩的人工具’拉回开发工作流
从 Claude Code 插件到 Team Pipeline,怎么看 OMC 的真实价值与边界
2026-03-26
paper
MARCH:用多智能体强化自检来压低 RAG 场景下的大模型幻觉
"把回答拆成可核验命题,再用信息隔离的 Checker 逐条对证据做 claim-level verification"
2026-03-26
github
Supermemory 深入解读:AI Agent 真正缺的不是更多模型,而是可用的记忆层
从 GitHub Trending 看 memory/context layer 为什么正在成为 agent 基础设施
2026-03-25
paper
SpecEyes: 用投机式感知与规划加速 Agentic 多模态 LLM
"把 speculative decoding 的思路上移到 agent 级感知与规划链路"
2026-03-25
github
DeerFlow 深入解读:为什么它值得被当作 2026 年 agent runtime 样本来看
从 deep research 到 super agent harness,真正值得验证的是运行时边界、编排能力和工程可控性
2026-03-24
paper
Hyperagents:不只让 agent 改任务策略,还让它改‘如何改自己’
"把 task agent 和 meta agent 合成一个可编辑程序,连自我改进机制本身也开放给修改"
2026-03-24
paper
IndexRAG 精读:别在查询时临时推理了,把多跳答案提前烤进索引里
"不是让 RAG 在 query-time 更聪明,而是让知识库在 index-time 先变聪明"
2026-03-24
github
deer-flow 深入解读:从 Deep Research 到 Super Agent Harness
为什么这个项目值得工程团队认真看,但不该被 marketing 词汇带偏
2026-03-23
paper
今日无推荐:2026-03-23 daily paper 降级记录
"不是没有新论文,而是今天检索链路不稳定,无法做出可信筛选"
2026-03-23
github
DeerFlow 深入解读:Agent Harness 正在从 Demo 走向工程系统
从 ByteDance deer-flow 看 2026 年 agent 工作流的真正竞争点
2026-03-22
github
Chrome DevTools MCP 深入解读:把浏览器调试能力真正接给 Coding Agent
不是再造一个浏览器 Agent,而是把 Chrome DevTools 变成 Agent 的可靠工具层
2026-03-21
paper
今日无推荐:2026-03-21 agent / LLM arXiv 日检结果
"近 1 天里有相关论文,但没有一篇同时满足新意、主线相关性和不与昨日重复"
2026-03-21
github
OpenDataLoader PDF 深入解读
不是又一个 PDF 解析器,而是把 PDF 变成 AI 可消费结构化数据的工程入口
2026-03-20
github
claude-hud 深入解读
Agent 时代的开发者可观测性补丁,为什么它值得认真看
2026-03-20
paper
OS-Themis: 面向通用 GUI 奖励的可扩展 Critic 框架
"把 GUI trajectory 先拆成可验证里程碑,再用 reviewer/judge 压假阳性"
2026-03-20
github
obra/superpowers 深入解读:一个面向可落地的 Agent Skills 框架
把技能驱动的代理能力带入实际软件工程的落地路径
2026-03-19
github
RAPTOR 深入解读
递归摘要树检索,不只是换一种 RAG 索引结构
2026-03-19
github
open-swe 深入解读
开源版企业内部 Coding Agent 架构,为什么值得认真看
2026-03-19
paper
TDAD: 用图式测试影响分析降低 AI Coding Agent 回归
"Tell the agent which tests to check, not just how to do TDD"
2026-03-18
github
deepagents 深入解读
LangChain 为什么开始认真做 Agent Harness
2026-03-18
paper
Chronos: Temporal-Aware Conversational Agents with Structured Event Retrieval for Long-Term Memory
"Event calendar + turn calendar + dynamic prompting for long-term temporal memory"
2026-03-17
paper
XSkill
"Continual Learning from Experience and Skills in Multimodal Agents"
2024
2024-04-21
llms
llama
"llama"
2024-03-22
llms
对齐
"对齐"
2024-03-18
llms
微调
"微调"
2024-03-14
工具
matplotlib
"matplotlib"
2024-03-13
llms
token
"token"
2024-03-13
小技巧
Github
"Hello World"
2024-03-11
nlp
softmax
"softmax"
2024-03-09
nlp
transformer
"transformer"
2024-03-04
llms
组件优化
"组件优化"
2024-03-04
llms
llama
"llama"
2024-03-04
llms
组件优化
"组件优化"
2024-03-04
note
Gpt
2024-03-04
note
Gpt系列
2023
2023-11-03
llms
huggingface
"huggingface"
2023-11-03
llms
huggingface
"huggingface"
2023-08-20
llms
deepspeed
"deepspeed"
2023-08-20
llms
多机免密登录
"多机免密登录"
2023-08-20
llms
deepspeed
"deepspeed"
2023-08-20
llms
多机免密登录
"多机免密登录"
2023-08-05
llms
大模型综述
"llms"
2023-08-05
llms
大模型综述
"llms"
2023-05-22
note
推荐系统概述
2023-03-14
note
动态权重
2022
2022-08-18
note
Sklearn
2022-08-16
note
Numpy
2022-08-16
note
Pandas
2022-08-15
note
Spark_lightgbm
2022-07-27
note
类别不平衡问题
2022-07-10
信息抽取
ner
"实体抽取"
2022-07-10
note
推荐系统bias Debias
2022-07-10
note
推荐系统多任务学习
2022-06-22
note
Bandit
2022-04-21
note
特征处理
2022-01-28
spark
实时数据测试
"实时数据测试"
2022-01-28
深度学习
优化方法
"优化方法"
2021
2021-11-17
深度学习
深度学习部署
"onnx"
2021-11-02
note
Trick
2021-09-07
搜索
搜索排序
"搜索排序"
2021-09-02
设计模式
工厂模式
"共产模式"
2021-08-30
深度学习
对抗训练
"对抗训练"
2021-08-30
机器学习
评价指标
"评测"
2021-08-03
spark
pyspark
"pyspark"
2021-07-15
spark
als
"als"
2021-07-13
工具
torch基础
"torch"
2021-07-07
开发
pdb调试
"调试"
2021-07-06
搜索
搜索召回
"搜索召回"
2021-05-26
spark
scala
"scala"
2021-05-25
开发语言
java
"java"
2021-05-25
开发语言
java
"java"
2021-05-24
工具
ES
"ES"
2021-03-28
nlp
fasttext
"fasttext"
2021-03-22
note
Hive
2021-02-13
机器学习
PCA
"降维"
2021-02-03
爬虫
数据抓取
"crawl"
2021-02-03
数据分析
房价数据分析
"数据"
2021-01-14
工具
Hanlp
"hanlp"
2021-01-07
工具
pytorch
"torch"
2021-01-05
编程
sqlalchemy
"ORM(Object-Relational Mapping)"
2021-01-03
评价指标
评价指标
"评价指标"
2020
2020-12-28
开发
intellign
"intellign"
2020-12-28
开发
jdk
"jdk"
2020-12-20
数学
KKT条件
"KKT条件"
2020-12-20
数学
拉格朗日乘子法
"math"
2020-12-19
工具
tf-serving
"tf"
2020-12-19
工具
tensorboard
"tf"
2020-12-17
工具
mybatisplus
"mybatisplus"
2020-12-17
工具
springboot学习中的一些问题
"springboot"
2020-12-12
工具
springboot
"spring boot"
2020-12-08
工具
mysql
"mysql"
2020-12-01
工具
tensorflow
"tf"
2020-11-30
note
Redis
2020-11-26
深度学习
focal-loss
"损失函数"
2020-11-19
开发语言
python
"python"
2020-11-19
note
Pandas
2020-11-11
语音识别
warpctc
"语音识别"
2020-11-06
数据结构
排序算法
"排序"
2020-11-04
开发
定时任务
"定时"
2020-10-28
开发
socket
"网络编程"
2020-10-28
note
Torch
2020-10-22
语音识别
kaldi
"语音识别工具"
2020-10-20
搜索
ABtest
"ABtest"
2020-10-20
搜索
ABtest
"ABtest"
2020-10-19
语音识别
语音数据增强
"语音识别"
2020-10-15
搜索
搜索
"搜索"
2020-10-12
语音识别
语音识别
"语音识别"
2020-10-10
深度学习
未登录词
"未登录词"
2020-09-30
开发
docker部署
"部署"
2020-09-29
开发
gunicorn部署
"部署"
2020-09-27
语音识别
错别字
"错别字"
2020-09-27
语音识别
kenlm
"统计语言模型"
2020-09-21
语音识别
CTCloss
"损失函数"
2020-09-16
note
一些工具
2020-09-04
推荐系统
FFM
"推荐"
2020-09-03
推荐系统
在线学习
"推荐"
2020-09-03
推荐系统
ctr
"推荐"
2020-09-02
推荐系统
lr+gdbt
"推荐"
2020-09-01
推荐系统
SVD
"推荐"
2020-08-29
机器学习
统计机器学习
"统计机器学习"
2020-08-12
project
flask+uwsgi
"nginx"
2020-08-11
project
vim
"vim"
2020-08-07
知识图谱
tigergraph
"知识图谱"
2020-08-07
机器学习
SVM
"支持向量机"
2020-08-05
图卷积
图卷积
"图卷积"
2020-07-13
nlp
编辑距离
"编辑距离"
2020-07-06
bert
Tinybert
"bert家族"
2020-07-06
bert
bert
"bert家族"
2020-07-01
nlp
classfication
"分类"
2020-07-01
bert
bert
"bert"
2020-06-23
nlp
词向量
"word embedding"
2020-06-23
note
文本相似度
2020-06-22
数据结构
二叉树
"数据结构"
2020-06-20
机器学习
集成学习
"集思广益"
2020-06-17
question
问题总结
"面试问题"
2020-06-03
推荐系统
协同过滤
"推荐"
2020-06-02
机器学习
异常值处理
"机器学习"
2020-05-29
工具
Pycharm
"工具"
2020-05-29
Faiss
Faiss
"搜索"
2020-05-27
推荐系统
推荐系统入门
"recommend"
2020-05-20
论文
综述论文
"paper"
2020-05-18
信息抽取
BILSTM+CRF
"信息抽取"
2020-05-18
机器学习
概率图模型
"probabilistic graphical model"
2020-05-15
数学
数学基础
"math"
2020-01-26
半监督学习
半监督学习
"半监督"