AI Agent框架是补全拼图的最后一角?框架的“波粒二象性”如何解读?
原文作者: Kevin, the Researcher at BlockBooster
AI Agent 框架作为行业发展的关键拼图,可能蕴藏着推动技术落地与生态成熟的双重潜力。市场中热议的框架有:Eliza, Rig, Swarms, ZerePy 等等。这些框架通过 Github Repo 吸引开发者,建立声望。以“库”发币的形式让这些框架,和光同时具备波和粒子的特质类似,Agent 框架同时具备严肃外部性和 Memecoin 的特性。本文将重点解读框架的“波粒二象性”以及 Agent 框架为什么能成为最后一角。
Launchpad:资产发型平台。Base 链上的 Virtuals Protocol 和 clanker,Solana 链的 Dasha。
AI Agent 应用:游离于 Agent 和 Memecoin 之间,在记忆内存的配置上有出彩的地方,比如 GOAT,aixbt 等。这些应用一般来说是单向输出的,输入条件非常有限。
AI Agent 引擎:Solana 链的 griffain 以及 base 链的 Spectre AI。griffain 可以做到从读写模式进化到读、写、行动的模式;Spectre AI 是 RAG 引擎,链上搜索。
AI Agent 框架:对于框架平台来说,Agent 本身就是资产,所以 Agent 框架是 Agent 的资产发行平台,是 Agent 的 Launchpad。目前具有代表性的项目有 ai 16 ,Zerebro , ARC 和这两天热议的 Swarms。
其他小方向:综合型 Agent Simmi;AgentFi 协议 Mode;证伪类 Agent Seraph;实时 API Agent Creator.Bid。
进一步讨论 Agent 框架,可以看出它具有充分的外部性。不同于各大公链和协议的开发者只能在不同开发语言环境中选择,而行业内总的开发者规模并没有呈现对应市值增速的增长。Github Repo 是Web2和Web3开发者建立共识的之所,在这里建立开发者社区,比任何一个协议单独开发出来的“一插即用”包对Web2开发者的吸引力和影响力更强大。
本文提到的 4 种框架都已开源:ai16z的 Eliza 框架获得 6200 颗星;Zerebro 的 ZerePy 框架获得 191 颗星;ARC 的 RIG 框架获得 1700 颗星;Swarms 的 Swarms 框架获得 2100 颗星。目前,Eliza 框架被广泛用于各种 Agent 应用,是覆盖面最广的框架。ZerePy 的开发程度不算高,发展方向主要在 X 上,尚且不支持本地 LLM 和集成内存。 RIG 的相对开发难度最高,但是能给开发者最大限度实现性能优化的自由。Swarms 除了团队推出 mcs 之外还没有其他用例,但是 Swarms 可以集成不同框架,有较大想象空间。
此外,上述分类中,把 Agent 引擎和框架分割开来,或许或造成疑惑。但我认为二者是有区别的。首先,为什么是引擎?联想现实生活中的搜索引擎来类比是相对契合的。不同于同质化的 Agent 应用,Agent 引擎的性能在其之上,但同时是完全封装的,通过 api 接口来调整的黑盒。用户可以以 fork 的形式来体验 Agent 引擎的性能,但是又不能像基础框架那样掌握全貌和定制自由。每个用户的引擎就像在调教好的 Agent 上生成一个镜像,是对镜像做交互。而框架本质上是为了适配链,因为在 Agent 做 Agent 框架,最终目的都是和对应的链有整合,怎样定义数据交互方式,怎样定义数据验证方式,怎样定义区块大小,怎样平衡共识和性能,这些是框架需要考虑的事情。而引擎呢?只需要在某一个方向,充分微调模型和设置数据交互还有内存之间的关系就行,性能是唯一评价标准,而框架则不然。
来源:@SuhailKakar
2.安装 Eliza
来源:@SuhailKakar
3.配置文件
来源:@SuhailKakar
Eliza 的框架相对来说,易于上手。它是基于 TypeScript,这是大多数 Web 和 Web3 开发者都熟悉的语言。框架简洁,没有过度抽象,让开发者能够轻松地添加自己想要的功能。通过步骤 3 ,看到 Eliza 可以多客户端集成,可以将其理解为多客户端集成的组装器。Eliza 支持 DC, TG 和 X 等平台,还支持多种大语言模型,可以通过上述社交媒体实现输入,LLM 模型来输出,并且支持内置记忆管理,可以让任意习惯的开发者快速部署 AI Agent。
由于框架的简洁性和接口的丰富性,Eliza 大大降低了接入的门槛,实现了相对统一的接口标准。
https://replit.com/@blormdev/ZerePy?v=1
2.配置 X 和 GPT
https://replit.com/@blormdev/ZerePy?v=1
3.设置 Agent 性格
来源: https://replit.com/@blormdev/ZerePy?v=1
https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
2.设置 OpenAI 客户端并使用 Chunking 进行 PDF 处理
https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
3.设置文档结构和嵌入
https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
4.创建向量存储和 RAG agent
https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig(ARC)是一个基于 Rust 语言面向 LLM 工作流引擎的 AI 系统构建框架,它要解决更底层的性能优化问题,换句话说,ARC 是一个 AI 引擎「工具箱」,提供 AI 调用、性能优化、数据存储、异常处理等后台支撑服务。
Rig 要解决的是「调用」问题,以帮助开发者更好选择 LLM,更好优化提示词,更有效管理 token,以及如何处理并发处理、管理资源、降低延迟等,其侧重点在于 AI LLM 模型和 AI Agent 系统协作过程中如何「用好它」。
Rig是一个开源 Rust 库,旨在简化 LLM 驱动的应用(包括 RAG Agent)的开发。因为 Rig 开放的程度更深,因此对开发者要求更高,对 Rust 和 Agent 的理解要求也更高。 这里的教程是最基础的 RAG Agent 的配置流程,RAG 通过将 LLM 与外部知识检索相结合来增强 LLM。在官网的其他 DEMO 中,可以看到 Rig 具备以下特征:
LLM 接口统一:支持不同 LLM provider 的一致 api,简化集成。
抽象工作流:预构建的模块化组件让 Rig 可以承接复杂 AI 系统的设计。
集成向量存储:内置对裁体存储的支持,在 RAG Agent 等相似的搜索类 Agent 中提供高效性能。
嵌入灵活:提供易于使用的 API,用于处理嵌入,在 RAG Agent 等相似的搜索类 Agent 开发时,降低语义理解的难度。
可以看出相比 Eliza,Rig 为开发者提供了额外的性能优化的空间,帮助开发者更好地调试 LLM 和 Agent 的调用和协作优化。Rig 以 Rust 驱动性的性能、利用 Rust 优势零成本抽象和内存安全、高性能、低延迟的 LLM 操作。能够在底层层面上,提供更丰富的自由度。
https://docs.swarms.world
顺序 Swarm 架构以线性顺序处理任务。每个 Agent 在将结果传递给链中的下一个 Agent 之前完成其任务。此架构可确保有序处理,并且在任务具有依赖关系时非常有用。
用例:
工作流程中的每个步骤都依赖于前一个步骤,例如装配线或顺序数据处理。
需要严格按照操作顺序的场景。
层次化架构:
https://docs.swarms.world
实现自上而下的控制,由上级 Agent 协调各下级 Agent 之间的任务。其中 Agent 同时执行任务,然后将其结果反馈到循环中进行最终聚合。这对于高度可并行化的任务非常有用。
电子表格式架构:
来源:https://docs.swarms.world
用于管理同时工作的多个代理的大规模群体架构。可同时管理数千个代理,每个代理都在自己的线程上运行。它是监督大规模代理输出的理想选择。
Swarms 不仅是 Agent 框架,还可以兼容上述 Eliza, ZerePy 和 Rig 框架,以模块化的思想,在不同工作流和架构中最大化释放 Agent 性能,以解决对应问题。Swarms 的构思和开发者社区进展都没问题。
Eliza:易用性最强,适合初学者和快速原型开发,尤其适合社交媒体平台的 AI 交互。框架简洁,便于快速集成和修改,适合不需要过度性能优化的场景。
ZerePy:一键式部署,适合快速开发Web3和社交平台的 AI Agent 应用。适合轻量级 AI 应用,框架简单,配置灵活,适用于快速搭建和迭代。
Rig:侧重性能优化,尤其在高并发和高性能任务中表现出色,适用于需要细致控制和优化的开发者。框架较为复杂,需要一定的 Rust 知识,适合更有经验的开发者。
Swarms:适合企业级应用,支持多 Agent 协作和复杂任务管理。框架灵活,支持大规模并行处理,并提供多种架构配置,但由于其复杂性,可能需要更强的技术背景来有效应用。
总体来说,Eliza 和 ZerePy 在易用性和快速开发方面具有优势,而 Rig 和 Swarms 更适合需要高性能和大规模处理的专业开发者或企业应用。
这就是 Agent 框架具有“行业希望”特性的原因,上述框架还处于早期阶段,当务之急是抢占先发优势并建立活跃的开发者社区。框架本身的性能高低以及相对Web2流行应用来说是否落后都不是主要矛盾。只有源源不断涌入开发者的框架才能最终胜出,因为Web3行业始终需要吸引市场的注意力,框架性能再强,基本面再雄厚,如果难以上手导致无人问津,则本末倒置。在能够框架自身能够吸引开发者的前提,具有更成熟和更完整的代币经济模型的框架会脱颖而出。
而 Agent 框架有着“Memecoin”特性这一点,则非常好理解。上述框架代币都没有合理的代币经济设计,代币没有用例或者用例非常单一,没有经过验证的商业模式,也没有行之有效的代币飞轮,框架仅仅是框架,和代币之间没有完成有机结合,代币价格的增长除了 FOMO 之外,难以获得基本面上的助力,没有足够的护城河来确保稳定且持久的价值增长。同时,上述的框架自身也显得比较粗糙,其实际价值和当前市值并不匹配,因此有着强烈的“Memecoin”的特性。
值得注意的是,Agent 框架的“波粒二象性”并不是缺点,不能将其粗暴的理解为既不是纯粹的 Memecoin,又没有代币用例的半罐水。正如我在上一篇文章中提到的观点:轻量化的 Agent 覆盖着模棱两可的 Memecoin 面纱,社区文化和基本面不会再成为矛盾,一种新的资产发展路径在逐渐浮出水面;尽管 Agent 框架初期存在泡沫与不确定性,但其吸引开发者和推动应用落地的潜力不容忽视。未来,具备完善代币经济模型和强大开发者生态的框架,或将成为这一赛道的关键支柱。
免责声明
本文/博客仅供参考,代表作者的个人观点,并不代表 BlockBooster 的立场。本文无意提供:(i) 投资建议或投资推荐;(ii) 购买、出售或持有数字资产的要约或招揽;或 (iii) 财务、会计、法律或税务建议。持有数字资产,包括稳定币和 NFT,风险极高,价格波动较大,甚至可能变得一文不值。您应根据自身的财务状况,仔细考虑交易或持有数字资产是否适合您。如有具体情况方面的问题,请咨询您的法律、税务或投资顾问。本文中提供的信息(包括市场数据和统计信息,若有)仅供一般参考。在编写这些数据和图表时已尽合理注意,但对其中所表达的任何事实性错误或遗漏概不负责。