首页 资讯 正文

数据淘金热:数据智能网络DIN全解

金色财经 2024年11月08日 03:46

作者:Teng Yan,Chain of Thought;翻译:金色财经xiaozou

1、数据淘金热

19世纪中期的加州淘金热期间,成千上万人在新边疆追逐未财富希望。

穷人们突然发现自己发了财,白手起家的故事变得司空见惯,这股热潮带动着更多行业和城市的出现。基础设施以惊人的速度发展,重塑了美国的面貌。

Crypto AI与淘金热的相似之处难以忽视。

如今,大多数Crypto AI产品仍处于开发阶段,要么就是在测试网上运行,表明我们正处于基础设施建设阶段。

投资者和建设者正在为迎接潜在的增长激增做准备。现在正在创建的工具、网络和协议可能会成为支持庞大的去中心化人工智能生态的基础。

我们正在见证一场数字淘金热的早期阶段——这场淘金热可能与19世纪的淘金热具有同样的变革性。

所以可以想象,当我偶然发现一个自称日活跃用户超过70万的Crypto AI项目时,我是有多惊讶。不是月活跃用户,而是日活跃用户哦。在这样一个新兴领域,这样的用户指标可以说是闻所未闻的。所以,我必须进行深入研究,弄清楚幕后到底发生了什么。

这是什么项目?DIN,即“数据智能网络”。

2、加密数据网络

3izRuUpBE7N7EfViyUnnhGVc9RbwFJiQdSUsbsyH.jpeg

我一直在密切关注Crypto AI领域里的数据网络,很明显,它们正在解决AI领域的一个关键痛点:价值性数据集的访问。

如今,许多最具价值的数据源都被集中实体严格控制着,这些实体收取高昂的访问费用。

例如:

  • Reddit与OpenAI签署了一份每年6000万美元的授权协议,提供对其用户生成内容的访问权。

  • X(以前的Twitter)不再向开发者提供免费的API访问,现在Twitter数据的收费在每月100美元到4.2万美元之间(不是开玩笑)。

其中传达的信息很明确:企业认识到数据是新的战场,他们正在锁定控制权以实现利润最大化。

Crypto提供了一个潜在解决方案——一种摆脱对价值性数据集的集中控制的方法。

加密数据网络采用了一种完全不同的方法,旨在构建高质量的去中心化数据集,不存在传统模型带来的瓶颈。通过代币的使用,这些网络可以激励大规模的数据标注工作,激励个人为大规模数据收集做出贡献,甚至组织训练数据的网络抓取。

而区块链具有透明性,创建了一个跟踪数据的所有权和来源的框架。这便确保了每当贡献者的数据被使用时,他们都能得到公平的补偿,从而建立了一个新范式,在这个范式下,数据价值是共享的,而不是垄断的。

3、DIN愿景

DIN是迎难而上正面处理数据问题的一个团队。

DIN的核心是一个数据层,它收集并验证链上链下数据,使用区块链作为结算层。

主要理念是什么?那就是将数据的所有权交还给用户,让他们因为为系统所做的贡献而获得奖励。

DIN工作原理:

IvkiOmojOZvKoA3KCJfngJKiltvDWVqZJxqVfVGp.png

这个图表可能乍看很复杂,让我们来拆分一下。

DIN网络有三方主要参与者:

  • 数据收集者

  • 数据验证者

  • 计算节点

为了更好地理解数据收集者和验证者是如何工作的,我们来深入了解一下xData,也就是DIN目前的主产品。

(1)xData:数据收集

xData是DIN的旗舰平台,主要用来收集、组织和存储来自X等社交媒体平台的数据,而不必依赖于API。它运行在一个去中心化网络上,确保用户的所有权和隐私。它于2024年4月在opBNB (BNB链的一个L2)上推出。

57obi8Cu1gmaBsPvAwfZNJH7W6KZ1DoEFuoq2Rdy.jpeg

xData通过游戏化机制让用户的数据收集变得具有趣味性和盈利性。下面让我们快速了解一下它是如何工作的:

  • 用户安装一个浏览器插件,用钱包登录并关联他们的X账户。

  • 用户可以通过回复推文和tag帐户来tag有趣的推文。

  • 用户在tweet上tag可以获得“wafers”积分,这些积分可以在TGE时转换成代币。

  • 这里有几种游戏化机制。每个用户可以tag(存储)的推文数量有限,但他们可以通过消费wafers积分来增加存储空间。用户还必须每24小时消费一次wafers,以保持账户的“解锁”状态,才能赚取更多wafers。

  • DIN围绕特定的关键词或标签发布任务,社区成员实时搜索推文并根据特定标签进行tag。

xData无需许可的特性意味着世界各地的任何一个用户都可以参与数据收集和注释来获得奖励/收入,不受国籍的限制。目前,数据收集是在链下进行的,被tag的推文存储在BNB green field上,这是BNB Chain上的一个去中心化数据层。

(2)Chipper Nodes:数据验证

下一个问题自然就是:如何确保用户所提交数据的质量和完整性?毕竟,有人可以为了获取最大利益而运行一个人工智能机器人,随机tag与指定标签不匹配的推文。

数据标签也不总是直截了当的。推文通常包含昵称、俚语和文化因素——例如,比特币在中文推文中经常被称为“大饼”。

这就是数据验证的用武之地。

Chipper nodes是DIN的人工智能驱动的数据验证和处理节点,负责验证和向量化数据,同时也让用户能够赚取代币(xDIN和DIN)。

在幕后,每个用户操作的节点实际上是本地运行一个小型AI模型来验证推文的内容是否与附加标签匹配,然后将其存储在去中心化数据层中。用户可以在标准PC上操作这些节点,不需要昂贵的硬件设置。

随着处理的经验证数据的数量越来越多,验证者使用的人工智能模型不断改进,使网络随着时间的推移变得更智能、更准确。

目前,DIN可内部处理所有数据验证,但目标是分散验证过程。目前正在对节点进行主动测试。用户可以在他们的本地设备上运行节点软件来测试网络,DIN准备在未来几周内发布其主网和代币,bug奖励已就位。

(3)计算节点

虽然计算节点还没有投入使用,但它们却是 DIN未来安全存储数据的隐私计划。以下是计算节点的工作原理:

  • 向量转换:计算节点将经验证的数据转换为向量。

  • 隐私处理:向量通过ZK(零知识)处理器处理,确保隐私。

  • 数据最终确定性:最终确定的数据集和向量存储在IPFS中供第三方访问。

BNB链上的一个新L2?

IKxU1AkQ29SkU5eFDaNkecGVscqJnstqLYZ675mJ.jpeg

官方尚未发布公告,但在我们的研究中,我们在BNB链测试网上发现了一个DIN代币。这暗示了未来区块链的发展——可能是BNB链上的侧链或L2解决方案。

DIN简介:

DIN给人的感觉像是一个新玩家,但该项目的起源可以追溯到2021年底。它最初以“Web3Go”的名义推出,是Polkadot生态中的一个链上数据分析平台,获得了Web3基金会的资助,并与Moonbeam和Oak Network等客户合作。

2022年,该团队将业务范围扩展到BNB链生态,加入了币安实验室的MVB孵化器,并获得了开发“多链开源数据分析平台”所需的投资。

到2023年7月,他们看到了征兆:生成式人工智能正在蓬勃发展,对强大数据基础设施的需求比以往任何时候都更加迫切。于是该团队转向构建一个全面的“人工智能数据智能层”,使他们的使命与人工智能创新的数据需求保持一致。这一演变在2024年5月达到高潮,届时,Web3Go正式更名为DIN,标志着对数据的大胆关注,预示着数据层将成为下一波人工智能进步的关键。

4、DIN的牵引力——目前为止势头良好

opBNB的日用户数约为70万。

k36Y8TS0njCUuzl0OKSec5ZjuRS2rkbsopPjHUFE.png

opBNB上的DIN日交易量约为120万。

97CPvqyX1fbXqUGqbk0GpuoWZCLlftSf2Y5k5i5K.png

根据DappBay的数据,DIN在10月份表现稳定,平均日用户数超过70万,日交易量超过120万。大多数交易是因为xData用户必须每24小时进行一次链上交易,以激活他们的xData app赚取积分。

KT89fWJqMLtpR0bSXnhNSyPi6Fx4ThgVQNlTAkAt.jpeg

DIN一直是BNB链上排名前十的dApp之一,并且在很多时候,它还是网络上用户数排名第一的应用程序。虽然我没有像密切关注Solana和Base这样密切跟踪BNB链生态,但这不是一个小成绩,特别是考虑到BNB链的推出时间和币安的强大支持。

为了更好地理解,我分析了BNB链上其他一些排名靠前的应用,看看究竟是什么塑造了用户粘性:

  • Vooi (DeFi)是一个perp DEX聚合器。

  • Particle网络(基础设施)是测试网中的全链协议。

  • Revox (基础设施)是一个模块化链上网络,拥有一个流行的内容app——ReadON。

  • SERAPH(游戏)是一款类似Souls的RPG游戏。

  • MyShell是一个无代码的AI应用商店生态。

据该团队称,到目前为止,DIN已经收集并标注了超1亿条推文,在opBNB和Mantle上的用户群超过3千万。

这里需要注意的是,DIN能够利用其庞大的用户群,快速生成大量相关推文的实时数据集。这个过程完全不依赖于X API。

虽然xData目前的重心是Twitter,但该团队计划将数据收集和标注平台扩展到Reddit、Facebook、Instagram等其他数据源,以及任何具有高价值信息的用户数据平台。对我来说,这才是真正的黄金所在。

Reiki:

GWf5fTYf5XgCxDksq981gZQlWwc0Vk4mByBDIIh5.jpeg

Reiki是DIN的另一款产品,它与正在进行的AI智能体meta紧密相连。事实上,考虑到最近几周我们在Truth Terminal和GOAT身上看到的消费者对AI智能体的潜在兴趣,DIN可能已经走在了时代的前沿。

2024年1月,DIN推出了Reiki平台,用户可以在没有编码经验的情况下创建AI智能体(主要是聊天机器人)。用户还可以整合他们自己的知识库,建立引人入胜的、个性化的聊天机器人,这让人想起了MyShell。

该平台一经发布便迅速获得关注,成为Product Hunt上排名第一的产品。

Reiki还为创作者提供了多种方法,让他们能够将自己的机器人货币化,参与奖励计划,甚至将他们的机器人变成NFT——为游戏体验添加了有趣的一层——所有权。值得注意的是,BNB Chain的Discord知识支持机器人是由Reiki驱动的。

虽然该平台目前基本已经被弃用,但DIN团队并不排除在他们发布代币后将其迎回的可能性。如果重新启用,Reiki可以为代币提供额外效用,并为AI智能体创建者提供一种方法利用xData所收集的数据。

5、代币设计:xDINDIN和节点销售

Wq8kttLyRdNY1eHndlzU8t7w6vxvdU5PyMX0Gn04.jpeg

2024年8月至9月,DIN举行了Chipper节点销售并从中筹集了250万美元。这些chipper节点将允许用户在他们的本地设备上运行验证软件,使用模型来确保数据被准确标注。这次销售非常成功,25,112个二级节点(每个售价99美元)全部售罄。

供应端:

在TGE之前,xData用户可以将他们的wafers积分兑换为xDIN——空投前代币。然而,会有5-30%的兑换费,这些费用将分配给Chipper节点所有者。这种兑换机制还没有上线,但预计在本月晚些时候节点“预挖”上线后就会立即启动。

在TGE期间,用户将根据其持有的xDIN比例获得DIN(可交易代币)空投,完全释放,没有复杂的锁定机制。

在TGE之后,DIN代币总供应的25%将保留给Chipper节点奖励。这一配额的一半将在第一年释放,余下的每年减半释放。

需要注意的是,与其他进行节点销售的项目相比,该销售的解锁速度是相对较快的,其他项目的节点奖励是在3-4年内逐步分配的。

需求端:

验证者节点可能需要质押DIN代币才能参与网络。作为回报,他们将因验证数据而获得奖励,但如果他们的输出不准确,他们将面临罚没惩罚。

在另一端,数据使用者必须使用DIN代币才能访问网络数据。由于大多数Web2企业仍对使用加密货币犹豫不决,该公司将需要促进这些交易,以架起传统企业与去中心化网络之间的桥梁。

我们仍在等待详细的DIN代币经济学的公布,应该会在临近TGE时发布。

团队与融资:

DIN的核心团队聚集了来自哥伦比亚大学、伦敦大学学院和斯图加特大学的人才,他们在人工智能和区块链领域拥有长达十年的专业知识。

DIN的创始人Hao Ding拥有斯图加特大学信息技术硕士学位。在深入研究加密货币之前,他曾担任中国苏州人工智能研究所的研发主任,随后担任身份认证oracle网络Litentry的副总裁,后来创立了Web3Go。

我很高兴见到Hao本人,我们畅聊了人工智能的未来。如果你问我他的信念是什么?那就是:数据将是一切的核心。DIN团队目前有16名成员,大部分都是工程师。

DIN参与了币安实验室的MVB 5加速器计划,并于2023年7月在种子轮融资中筹集了400万美元,领投的是由币安实验室、HashKey、NGC和Shima Capital。2024年8月,DIN获得了另外400万美元的融资,参投的有Manta Network, Moonbeam Network、Ankr和Maxx Capital,使其总融资额达到800万美元。

6、我们的想法

想法1:创建一个去中心化Scale AI是件趣事

vfQtCW2nrXFcYFthWqyhNqpjXWYwTH4CU9RPn8X1.jpeg

数据收集和标注是一笔大生意。

Scale AI是这一领域最知名的参与者,每年的经常性收入约为10亿美元。这是由OpenAI、Anthropic和Cohere等基础人工智能模型公司的大量需求推动的,它们是Scale的主要客户。截至2024年5月,该公司的估值高达140亿美元。

让我们仔细看一下Scale AI的商业模式。

Scale的数据标注任务依赖于庞大的分布式劳动力,包括手动tag视频、分类照片和转录音频。

该公司在多个国家雇佣了约24万名工作者,并在失业率高、生活成本较低的地区积极招聘。例如,肯尼亚已成为非洲重要的招聘中心,在内罗毕设有面授培训的“新兵训练营”,并有针对性地发布付费广告吸引工作者。

标注过程通常有两层:第一层是注释者,他们从头开始标注数据;第二层是质量控制者,他们检查工作,添加缺失的标注并纠正错误。这是一项人力密集型工作,但却很有效,因为人力成本很低,而且客户愿意支付大笔资金。

现在,想象一下通过去中心化网络扩展这个模型。受代币激励的全球范围内无需许可的工作者,可以允许任何人参与,同时,分布式验证网络可以确保数据的准确性和质量。去中心化可以为扩展数据标注开辟新的可能性,将其变成一个真正的全球民主化过程。

想法2:庞大的用户基群=好事

DIN今天的主要优势在于其规模庞大的粘性社区,这些社区是通过两年多的专注于社区建设的努力建立起来的。有了这样的网络,DIN可以根据特定标准快速调动数据收集。然而,挑战在于确定真正的数据需求在哪里,指导用户收集和标注正确的数据集,并建立可持续的收入流以支持长期增长。

想法3:激励是一把双刃剑

现在,大部分用户粘性都是由代币发布后对代币奖励的预期驱动的。但如果团队不能在代币发布之后为代币带来足够的需求,那么随着最初的兴趣消退,代币使用率可能会下降。创造这种需求需要投机兴趣,并建立一个由渴望购买这些数据集的消费者组成的数据消费者市场。

想法4:数据标注是一个竞争激烈的领域

DIN并不是唯一一个争夺这一市场份额的加密团队——像Sapiens、Grass和Masa这样的项目也在竞争之中。但这块蛋糕是巨大的。以GRASS为例,该公司目前的市值为25亿美元,突显出该行业的机会之大之多。

DIN与竞对区分并脱颖而出的一个途径可能是训练和部署专有人工智能模型进行数据验证,减少对人力的依赖。这种自动化优先的方法可以简化操作,增强可扩展性,并使DIN比仍然严重依赖手动操作的竞争对手更具优势。

7、结语

数据网络是人工智能和加密交叉领域最令人兴奋的一个阵地。与传统的集中式模型不同,Crypto驱动的数据网络利用去中心化参与和激励机制来大规模构建高质量数据集。

DIN将自己定位为该领域的先行者,见证这个项目的发展过程将是一件令人着迷的事。这是DIN需要抓住的机会。我经常告诉人们:数据网络是目前最明智的建设领域之一。

Crypto正在重塑数据的收集、验证和货币化方式,为新型去中心化数据经济奠定基础。