两周1700星，这份AI Agent学习路线图凭什么这么猛

昨天刷GitHub Trending，随手点进一个新仓库，两天星标直接冲破1700。仔细一瞧，Datawhale搞的AI Agent学习路线图，名字叫Agent-Learning-Hub。

1700星搁GitHub上不算多么炸裂，但你要留意时间线，这仓库5月17号才建，满打满算两周。两周拿下1700星，中文开源圈子里这种增速，说实话，挺猛的。你要知道好多仓库运营了大半年也就几百星，能上千都算不错的成绩了。

我把README从头啃到尾，还真被震了一下。不是因为它收录了海量资源，收集链接这事谁都能干，了不起花点时间。震撼我的是它的态度，把废话全剔掉，只留真正值得干的事。

我见过太多路线图了。套路都一样，给你堆100个链接，每个甩一句「建议阅读」，点进去好嘛，40分钟的视频、300页的文档、密密麻麻的分类。光看完路线图本身就得耗两小时，更别提照着学了。那种路线图根本就是在帮你制造焦虑。你觉得自己在规划，其实只是在拖延，看着满满的收藏列表假装已经在行动了。

Agent-Learning-Hub完全不一样。它只维护一个核心展示面，也就是README。目的不是给你收藏一大堆链接，而是靠着社区分享加上官方博客、论文，还有真实的工程经验，捋出一份真能照着执行的todo list。

「可以照着执行」，这四个字比「建议收藏」重太多了。收藏是安慰剂，执行才是真本事。

路线分9个Stage，从Stage 0一直延展到Stage 8。Stage 0就让你先想清楚一件事，你到底需不需要Agent。它让你去区分chatbot、workflow、agent还有multi-agent这四种东西，读完Anthropic那篇Building effective agents加上OpenAI的practical guide to building agents，然后写一页笔记回答一个问题，我的场景凭啥需要agent而不是普通workflow？

我个人真的特别喜欢这个设计。大部分人学Agent之前压根没琢磨过，上来就调API、搭框架、跑demo，忙活一圈发现其实一个if-else脚本就能把手头的任务搞定。Agent反倒把不确定性给拉满了。你辛辛苦苦搞了个复杂系统，最后发现不如一行条件判断好使，这种事我见过不少人踩坑，包括我自己早期也是这么过来的。

Stage 1到2是基本功，LLM API对话、结构化输出、tool call解析、RAG、记忆。每个Stage结束有硬产出。Stage 1你得写一个50到150行的极简agent，能选工具、跑工具，最后返回答案。Stage 2要求做一个资料研究助手，输入主题后自动搜索筛选，总结出来还要带上引用链接。不是学完就算了，你得真搞出点东西来才行。

Stage 3开始变得有意思了。它让你挑一个现代agent系统深入去拆，不是学框架API怎么调，而是拆它怎么组织工具、上下文还有权限，怎么管状态和日志，子任务和反馈怎么处理。推荐系统列表里Claude Code直接排头名，紧跟其后的是OpenAI的Codex。你要做的不是抄它的代码，而是搞清楚它为什么这么设计，哪些设计决策是关键，哪些是历史包袱可以忽略掉。

这也引出了路线图另一个让我印象极深的地方，就是它的立场。What To Learn Now那个表格直接挑明了，当前更值得投入的不是老式角色扮演多agent框架，而是贴近真实生产力的方向。Claude Code和Codex这类coding agent排头号，紧接着是agent harness engineering，再往下是OpenClaw还有Hermes这类个人agent，最后才是Skills/MCP/A2A/ACP这些协议层，加上评测和安全兜底。随后补了一刀，不建议重押已经泛化成模板的老式crew/role-play框架，可以了解，绝不该当主线。

这话听着确实刺耳，但我自己的感受是，说得没毛病。

去年Agent圈子火的就数CrewAI、AutoGen这种多角色协作框架，各种「CEO Agent指挥CTO Agent指挥程序员Agent」的演示满天飞。今年呢？风向变了。真正在生产环境跑起来的agent，没一个靠角色扮演撑得住。Claude Code一个人把活全包了，写代码、调bug、跑测试提PR，没有CEO也没有CTO，就一个agent一条循环。OpenAI的Codex也是同样的路子。微软的研究也说了，大部分场景下单agent比多agent更可控也更靠谱。

多agent并非不能用，但核心问题是协调，绝不是什么魔法。Stage 4就叫Multi-Agent Is Coordination, Not Magic，教你用supervisor或graph管多agent，给每个agent划定职责范围、输入输出schema还有停止条件，处理循环和任务漂移这些烂摊子，还要判断什么时候单agent更好。这，才是真正的工程思维。

后面Stage 5讲Skills，Stage 6聊浏览器Agent，Stage 7评测和可观测性，Stage 8交付真实Agent。每个Stage都有硬产出要求，不是考试题，是你真切动手搞定一个东西。整个路线图还带了Project Ladder，从Level 1的Calculator Agent一路晋级到Level 11的Production Harness，11个阶梯项目，每一档得做出可运行的作品。这路线图硬生生把学Agent从「收藏链接」变成了「做项目晋级」，跟打游戏通关一模一样，每打完一关手里都有个实实在在的东西。

Datawhale是2018年成立的国内AI开源学习社区，GitHub上207个公开仓库。你可能听过他们的LeedL深度学习教程、Joyful-Pandas数据分析教程，还有那个54000多星的hello-agents，在中文社区里算得上数得上的Agent教程项目了。维护者陈思州，GitHub昵称jjyaoao，本身就是Datawhale成员，研究方向恰好是LLM Agent，小红书也有账号专门打理Agent相关内容。他专门标注了Legacy Or Optional Frameworks，把CrewAI、AutoGen、LangChain Agents这些名气大但已不适合当主线的框架单独拎出来，直言可以了解但不建议重押。这品味我相当认可，不好得罪人的话偏不说，很干脆。

市面上还有几个对标项目。微软ai-agents-for-beginners 65000多星偏入门教程风格，NirDiamant的GenAI_Agents 22000多星偏学术演示。它们都偏横向罗列，给你展示Agent各种实现方式。Agent-Learning-Hub走纵向路线，直接替你选了一条它认为目前靠谱的路，沿这条线往下做就是了。

有风险，万一方向判断失误呢？但我觉得这种风险比给你200个链接自己选小多了。Agent领域变化实在太快了，自己选的人大概率迷失在链接堆里，每个都看一点，最后一个没做出来。

我自己最近在折腾Hermes Agent，路线图恰好也收录了Hermes，排在个人/always-on agents那层。用了几个月的感受跟路线图说的完全一致，agent能力很大一部分其实在harness，工具协议权限也好，状态管理和反馈回放也好，这些看起来不起眼的工程组件，反而比模型本身更能决定agent能不能干活。模型是发动机，harness是整车，发动机再猛，没方向盘没刹车没仪表盘，你根本开不了。

最后说说我的判断。这个路线图真正值得学的其实是背后的方法论。先做再读，小而可靠的agent胜过花哨的demo；加评测比加agent重要；trace每一次运行；把多agent当协调问题别当魔法；危险操作必须有人确认才行。这些原则看着平淡，但在Agent这个满是噱头和demo的圈子里，坚持这些原则的人做出来的东西才是真跑得通的。

两周1700星，说明大伙儿还是看到了这份清醒。

两周1700星，这份AI Agent学习路线图凭什么这么猛

原文地址：https://github.com/datawhalechina/Agent-Learning-Hub