北航人工智能硕士在读,目前在上海做算法。聚焦 多智能体系统、Agent 工程化 与 AI for Research。
日常重度使用 Claude Code / Codex / Cursor。相信好的 agent 系统是被"用坏 100 次"试出来的,不是被"读源码 100 遍"读出来的。
这里写: 技术博文 · 论文与读书笔记 · 开源作品 · 偶尔随笔。
从 Building Effective Agents 到 Multi-Agent Research System 再到 Claude Code Harness Design,Anthropic 这三份公开文档基本定义了当下做 agent 的工程基本盘。
从 2022 年的 ReAct 论文到 2024 年的 MCP 协议,agent 的工具调用机制经历了三代演进。这不是简单的技术叠加,每一代都解决了上一代的根本性局限。
Agent 跑着跑着忘了自己是谁、要做什么、不能做什么。这篇讲 prompt drift 的五种典型表现、四种根本原因,以及生产环境里能用的五种防御手段。
一个面向长程任务的个人 agent harness。目标是支持月级别可稳定运行的研究助手——能自己读论文、做笔记、跑实验、写报告,不需要人盯着。当前在迭代核心循环。
March 1, 2026 → Present
我的 Claude Code / Codex / Cursor 真实使用配置 —— custom commands、system prompts、多工具协作脚本、MCP server 配置。每周更新一次,是这个博客所有"工具方法论"文章的代码副本。
November 1, 2025 → Present