我从 2025 年 11 月正式把 Claude Code 装进日常工作流,到现在大概六个月。订阅最贵的档,每天用,写代码、写文章、做 agent 实验、整理研究笔记,几乎每件事它都参与一脚。
这不是一篇好评文。我对它的态度比小红书上的”yyds”复杂得多。这篇是把这六个月真实踩过的坑、用过的爽、形成的判断写下来。
不打算给你一个”是否值得用”的结论——这种结论没意义,要看你做什么。我希望写完之后你能更清楚 它擅长什么、它绝对不擅长什么、跟 Codex / Cursor 各自适合什么。
它最强的三个场景
(展开待补)
- 多文件 refactor——比 Cursor 强一档
- 新项目脚手架 + 一次性任务——10 分钟出一个能跑的原型
- 配合 MCP 操作真实环境——这是它跟其他 IDE 助手的代差
它绝对不擅长的三件事
(展开待补)
- 超长上下文跨 session 协作——它的
/compact还很糙 - 跟你”打配合”而不是”做执行”——它倾向于一口气干完,不擅长来回讨论
- 设计决策类问题——它会给你三个方案让你选,但很少给出”我推荐 X,因为…”
跟 Codex / Cursor 的实际分工
我现在的工作流:
| 场景 | 主力工具 | 理由 |
|---|---|---|
| 写新代码 / 多文件改造 | Claude Code | 上下文掌握最好 |
| 单文件改 / 即时补全 | Cursor | 反应最快 |
| 长文档 / 论文阅读分析 | Codex GPT-5 | 200k context 真的够用 |
| 系统设计讨论 | Claude Web (Sonnet 4.6 thinking) | 不写代码时最深 |
| Agent 系统调试 | Claude Code + 自己的 harness | 闭环 |
(每条选择的具体理由待补)
一些反直觉的发现
(待补)
- 给它写 plan.md 比直接给 prompt 效果好 5 倍
- 让它”先复述一遍我的需求再开始”能减少 30% 的跑偏
- 长任务里它会”假装做完”——必须有 verifier
- system prompt 太长反而效果变差
一些我至今没解决的问题
(待补)
- 跨 session 知识沉淀
- 大型代码库的”全局理解”
- 它生成的 commit message 永远很糟
总结
(待补:一句话定位 Claude Code 在我工作流里的位置)
草稿。这是一篇会持续修订的文章——只要我在用它,就会一直更新。