Agent Reach:给AI Agent一键装上互联网能力


原文地址:https://github.com/Panniantong/Agent-Reach


昨晚刷了一下GitHub趋势榜,一个叫Agent Reach的项目三天就涨了近两万Star。定位一句话就说完了,给你的AI Agent一键装上互联网能力。

头一回看到的时候我也就那样觉得,又一套壳工具?结果看了README才发现完全不是那回事,它压根不是框架,是一层能力。只管选型安装体检路由,碰都不碰底层读取本身。

装完之后什么意思呢,Agent读推特不经过它的代码,直接调twitter-cli,看YouTube字幕直接调yt-dlp,搜GitHub直接调gh CLI,Agent Reach只是帮你把这些上游工具选好配好检查好,运行时没有任何中间层。这个设计让我想起安卓的HAL层,硬件变了驱动换了,上面系统不用动。Agent Reach做的事情就是给互联网平台写驱动,平台封路就换一条驱动,Agent照常跑。

此前市面上给Agent加互联网能力的方案走浏览器自动化那条路的,Playwright和Selenium之类的,跑一个完整Chrome实例,能点能填能截图,但实例吃200到600兆内存,十个并行就把小服务器搞趴了,网站随便改个前端你就得修选择器。走搜索API那条路的,Tavily和Exa返回预处理好的摘要,便宜好用,但覆盖面有限,你想让它读一条具体推文或者看B站字幕,它就抓瞎了。

Agent Reach走的第三条路,CLI工具直连,每个平台准备一个有序的后端列表,首选挂了自动切备选。今年三月大批单平台CLI集体停更,它把路由换了,用户零操作。上个月yt-dlp被B站风控412彻底封死,切到bili-cli,一行代码都不用改。今年上半年我经历了三次这种事,先是Reddit爬虫工具被官方API审批制卡死,接着小红书反爬策略变了导致好几个MCP server返回空数据,再就是B站把yt-dlp拉黑。每次都得花一个下午找替代方案装新工具改配置文件。

后来翻了Reddit的官方公告才知道,匿名API的免费额度2024年就砍到了零,个人开发者想用得上走OAuth审批流程,填一堆表格说明你为什么需要数据,等两周才给你回复,我的申请到现在还在pending状态。Agent Reach把这个循环缩短成了零操作。

目前已覆盖网页、YouTube、RSS、GitHub、Twitter、Reddit、B站、小红书、LinkedIn、V2EX、雪球、小宇宙播客、全网搜索共十三个平台,其中六个无需设置即装即用。网页用Jina Reader,YouTube字幕用yt-dlp,GitHub用gh CLI,B站视频搜索用bili-cli。V2EX和雪球也直接能跑。B站和小红书这两个平台之前几乎没有好用的Agent读取方案,反爬更新导致小红书的MCP server频繁失效,B站的字幕提取工具也更新了又停更,Agent Reach把这些都整合进同一个框架里,至少省了来回切换工具的成本。其余像Twitter、Reddit、小红书需要登录态,用Cookie认证,浏览器里登录过就行,Cookie-Editor插件导出发给Agent它自己配好。

Cookie这块有个细节值得说,只存在本地~/.agent-reach/config.yaml里,文件权限600,不上传不外传,跟那些把用户数据往云端推的工具有本质区别。还有安全模式安装,agent-reach install --safe不会自动装系统包只列出让你决定,--dry-run更保守,预览所有操作不做任何改动,对于生产环境来说这两个选项很有用。代码全开源MIT协议,涉及Cookie的工具这一点很关键,把推特登录态交给闭源工具等于把密码给陌生人。

翻了翻channels目录的代码结构,每个平台就是一个独立的Python文件,twitter.py依次检测twitter-cli、OpenCLI、bird三个后端。结构清晰,看着舒服。安装方式是我见过比较骚的,不是跑什么安装脚本,是你跟Agent说一句「帮我安装Agent Reach」,然后把install.md的链接给它,Agent自己读完文档把所有东西装好。整个过程大概三到五分钟,除了需要确认几个系统包的安装权限之外其他全自动。

我同事上周装的,从零到跑通所有零配置平台不到十分钟,他之前连gh CLI都没装过,比我手动一个个配CLI快了至少三倍。装完跑agent-reach doctor,一条命令告诉你哪个平台通了哪个没通,没通的给你修复方案,比我自己踩坑强太多。以前每次配新CLI工具,报错就一句「authentication failed」,你得自己去搜到底哪一步出了问题。

我自己用AI Agent写稿的时候,经常遇到那种场面,让它去搜推特上大家对某个产品的评价,它显示需要付API费,或者返回一堆好几个月前的旧缓存数据。让它看B站视频的内容,也无能为力。让你搜小红书上某个护肤品的口碑,也进不了门。不久前我想让Agent帮我调研Reddit上关于某个SaaS产品的讨论热度,花了两个小时折腾,先是装了Reddit爬虫库直接跑403,又换了MCP server,匿名接口早就被封了,返回的数据全是空的。末了还是手动打开浏览器自己看的,一边翻帖子一边手动截图发给Agent让它帮我总结,那一刻我真是气笑了。再聪明的Agent,没眼睛就是没眼睛,互联网是现实世界的一面镜子,让Agent能读互联网等于给它打开一扇窗。Agent Reach解决了这个输入缺失的问题,Agent的核心能力是推理和决策,但如果输入只有给定的文本,那它永远是闭门造车的顾问。

当然也有边界,不是只做读不做操作。想让它帮你发推、提交表单,或多账号并行跑浏览器自动化,不在这个范围内,需要配合BrowserAct这类浏览器自动化工具。Agent Reach坚持只管选型安装体检路由这一层,反而能在不同Agent框架之间无缝切换,Claude Code、Cursor、Windsurf都行,你自己终端里手敲命令也行。

目前支持的后端列表还在持续增加,最近更新加了Discord和Telegram的CLI适配,说明社区需求在推动它往更多即时通讯平台扩展。

这个项目还有一个有趣的地方,作者Panniantong直接在README里写了,纯vibe coding出来的,可能有不完善的地方。vibe coding这个词今年特别火,没有专业背景的人用AI辅助编程,自己负责想清楚要什么,AI负责写代码。稍早前苹果报告App Store的提交量暴涨84%,创十年新高,挺夸张的数字。

原因之一就是vibe coding降低了整个开发门槛。一个vibe coder做的项目能到三万Star,这个需求的痛是真实的,痛到不管代码写得漂不漂亮能用就行。翻它的commit历史,四月份几乎每天都在提交,有时一天好几次,作者一直在边用边改边迭代,不是那种写完就扔着的开源项目,最近五月六月也有持续更新。

看完这个项目我有一个很直接的感受,AI基础设施的建设正在从「让模型更聪明」过渡到「让模型能看见」。过去两年很多人一直在卷参数和推理能力,但到2026年,越来越多的项目在做给Agent装眼睛装手脚的事。这个方向的确定性比模型本身的进步还要高,无论模型怎么改进都需要输入,而这个世界的输入在互联网上。

还有一点顺便说一下,Agent Reach的SKILL.md注册机制。安装完之后会在Agent的skills目录里放一份使用指南,Agent读到它就知道搜推特时调twitter-cli看视频时调yt-dlp,不必每次都指定工具名。比如你雇了个新实习生他什么都不懂,每次分配任务都得写操作手册说明用什么软件怎么操作。但如果他在这个岗位干了一年,看到任务就知道该开什么工具走什么流程。SKILL.md就是积累下来的经验,让Agent不用从头开始。

三万Star不是结束,这种基础设施项目一旦被更多人用起来网络效应会很快增强。很多人都遇到过Agent上网抓瞎的痛苦,如果解决方案实际上只需要一句话,传播门槛极低。作者自己在README里承诺说他每天都在用这个工具,会持续维护不断加新需求,平台变了也会想办法解决。这种用自己产品的开发者通常更靠谱,毕竟自己痛过才知道该改哪里,而不是靠用户反馈来驱动迭代。这周我打算在自己的开发环境里装一下试试,到时候写一篇实测体验。

阅读全文