AI 作为 Crypto 的代理人
艺术作品永远不会真正完成,只会被创作者放弃。
AI Agent这个概念近来被广泛讨论,但不同群体对其理解却大相径庭。我们关注的AI Agent与大众认知、AI从业者的理解都存在显著差异。
早在数月前,我曾在《Crypto 是 AI 的幻觉》一文中探讨过这个议题。从那时至今,Crypto与AI的结合始终像一场单相思——AI从业者鲜少提及Web3或区块链,而Crypto圈却对AI情有独钟。当看到连AI Agent框架都能被代币化的奇景时,我不禁思考:这能否真正将AI从业者引入我们的世界?
从加密本位视角来看,”AI是Crypto的代理人”这个论断完美诠释了我们对本轮AI热潮的独特理解。与其他行业不同,Crypto对AI的狂热特别体现在我们渴望将金融资产的发行和运作机制与之深度结合。
Agent的进化:技术营销背后的本质
追根溯源,AI Agent至少有三个源头。虽然OpenAI将AGI(通用人工智能)视为重要里程碑,使这个术语超越了技术范畴成为流行语,但本质上Agent并非全新概念。即便加上AI赋能,也很难说是革命性的技术突破。
OpenAI眼中的AI Agent,类似于自动驾驶分级中的L3级别——具备高阶辅助能力,但尚不能完全取代人类。在他们的规划中,Agent将成为继对话形式(ChatGPT)、推理形式(各类Bot)后的新阶段,其核心特征是”自主执行特定行为”。
图片说明:OpenAI 规划的 AGI 阶段
图片来源:https://www.bloomberg.com/
LangChain创始人Harrison Chase给出的定义更为精准:”AI Agent是一个用LLM来做程序控制流决策的系统。”这正是其精妙之处——在LLM出现前,Agent主要执行预设的自动化流程。以爬虫程序为例,程序员会设置User-Agent模拟真实用户行为,而AI Agent则能更细致地模仿人类操作。
这种演变中,AI Agent必须与现有场景结合,几乎不存在完全独创的领域。即便是Cursor、Github copilot等代码生成工具,也是在LSP(语言服务器协议)框架下的功能增强。
人机交互的演进历程同样印证这一点:从Web 1.0的CLI和TCP/IP协议,到Web 2.0的GUI/RestAPI/搜索引擎,再到如今Web 3.0可能出现的AI Agent与dapp结合,技术始终在降低使用门槛的方向上演进。
Crypto领域的”意图”(Intent)概念实际上是AI Agent热潮的先导。从功能有限的比特币脚本到以太坊智能合约,本质上都是Agent概念的延伸。随后出现的跨链桥、账户抽象等创新,都是这一思路的自然发展。因此当AI Agent”入侵”Crypto领域时,与DeFi场景的结合也就不足为奇了。
这种概念混淆正是问题的关键:在Crypto语境下,我们期待的是能”自动理财、自动打新Meme”的Agent;而OpenAI定义中的这类高风险场景可能需要L4/L5级才能实现。与此同时,大众使用的却是代码生成或文本总结等基础功能——双方根本不在同一维度对话。
理解了我们的真实需求后,接下来需要重点探讨AI Agent的组织逻辑。技术细节将退居幕后,因为正如浏览器对PC产业的革新,AI Agent的核心价值在于移除技术普及的障碍。我们将聚焦两个关键点:从人机交互视角理解AI Agent,以及AI Agent与LLM的区别与联系,进而引出第三部分:Crypto与AI Agent结合最终将留下什么。
AI_Agent = LLM + API
在ChatGPT这类对话式交互出现前,人机交互主要依靠GUI(图形界面)和CLI(命令行界面)。GUI衍生出浏览器、App等多种形态,而CLI与Shell的组合则相对稳定。
但这只是”前端”表象。随着互联网发展,数据交互的”后端”复杂度急剧提升。即便是简单的网页浏览,也需要前后端的协同配合。如果说浏览器、App是用户入口,那么API之间的连接则支撑着整个互联网的运行——这同样是Agent概念的一部分。
LLM的出现让交互方式再次进化。现在用户甚至不需要搜索,整个过程可以简化为:打开聊天窗口→用自然语言描述需求→LLM解析为操作步骤→返回结果。这种变革直接挑战了谷歌等搜索引擎的地位,也解释了为何有人认为LLM将颠覆搜索行业。
那么AI Agent在其中扮演什么角色?简而言之,AI Agent是LLM的特化版本。当前LLM远未达到AGI水平,其能力存在明显局限。例如,过度依赖用户输入可能导致”幻觉”——如果你反复告诉GPT”1+1=3″,它可能真的会给出错误答案。
解决这个问题的方法之一是让模型联网,通过多样化数据源降低错误概率。对于本地LLM,可以采用双模型验证机制,或引入用户协作来规范提问方式。更高级的解决方案是RAG(检索增强生成),通过数据重组来提高回答可靠性。
当多个LLM开始相互理解和协作时,我们就触及了AI Agent的核心模式——由代理调用各类资源,包括大模型和其他Agent。这就是LLM与AI Agent的关系:LLM是知识集合,而AI Agent则是针对特定任务流优化的子系统。
用一个等式表示就是:AI Agent = LLM + API。以调用X平台API为例的完整流程:用户发起请求→LLM解析为Agent任务→Agent获取凭证并与X平台通信→返回最终结果。在这个过程中,Web 1.0/2.0时代的技术依然存在,但用户只需与Agent对话即可,所有技术细节都被完美隐藏。
从人机交互角度看,这仿佛是用户在与自己对话。你只需表达需求,AI系统会不断猜测并完善理解。通过反馈机制和上下文记忆,AI Agent能保持任务的连贯性。这种人格化特征,正是AI Agent与传统自动化工具的本质区别。
AI框架货币化的启示
AI框架能够货币化,这是Crypto最令我着迷的现象之一。传统AI技术栈中,框架的重要性远不及数据和算力,且多数AI框架都是开源产品。这就好比”铁锅炖大鹅”中的铁锅——真正值钱的是鹅和烹饪技艺,而非锅本身。
但在Web3世界,情况截然不同。这里的AI产品大多基于现有框架改进,技术差异有限。当内在价值难以区分时,命名和场景的微调就成了代币差异化的关键,从而催生了Crypto AI Agent的框架泡沫。
某种意义上,这反映了Web3近期的普遍趋势——代币发行平台比代币本身更值钱。Pump.Fun和Hyperliquid等案例都印证了这一点。当各类Agent缺乏实质区分时,Agent发行框架反而成为最抢手的资产。
这种价值锚定思路正在催生Crypto与AI Agent结合的1.0版本。而2.0版本已初现端倪,典型代表是DeFi与AI Agent的结合。在DeFi生态变革的大背景下,AI正在重塑DeFi的构建逻辑——未来制造DeFi产品可能不再需要理解DeFi,这比链抽象更进一步。
当编程变得像说话一样简单,当复杂计算可以外包给AI Agent,每个人都能成为”程序员”的时代正在加速到来。
结语
本文刻意回避了具体Crypto AI Agent代币和框架的讨论,因为Cookie.Fun等平台已经做得足够好。在信息爆炸的当下,罗列项目清单已无意义。
但观察发现,市场仍缺乏对Crypto AI Agent本质的深入探讨。我们不应总是讨论指针,而应关注内存的实质变化。正是这种将各类标的持续资产化的能力,构成了Crypto的永恒魅力。
声明:
- 本文转载自【佐爷歪脖山】,著作权归属原作者【佐爷歪脖山】,如对转载有异议,请联系 Gate Learn,团队会根据相关流程尽速处理。
- 免责声明:本文所表达的观点和意见仅代表作者个人观点,不构成任何投资建议。
- 文章其他语言版本由 Gate Learn 团队翻译, 除非另有说明,否则不得复制、传播或抄袭经翻译文章。
声明:文章不代表CHAINTT观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险 自担!转载请注明出处:https://www.chaintt.cn/18311.html