launchpool之家
锁仓赚币

Vana:第一个 AI 数据主权开放协议

个人数据已成为互联网经济的基础。二十年来,我们接受了一个简单的交易:平台提供免费服务,以换取收集我们的数据并从中获利。这种安排——“如果你不付钱,你就是产品”——塑造了从定向广告到数据经纪人的方方面面。

AI 的兴起大大提高了风险。平台现在以数亿美元的价格出售用户数据来训练 AI 模型——将个人信息从定向广告的资源转化为人工智能的基本组成部分。然而,创建这些数据的用户仍然被剥夺了它的价值。

这并不是最初的愿景。互联网的架构师设想的是用户 – 而不是平台 – 保持对他们信息的直接控制。Tim Berners-Lee 本人多年来一直在努力恢复这些数据主权。但云基础设施和免费服务的便利性占了上风,平台成为我们数字生活的守护者。

但两个变革性转变已经融合在一起:AI 使个人数据的价值呈指数级增长,而去中心化技术的进步最终为个人提供了控制数据的工具。

Vana 是第一个数据主权的开放协议。它使用户能够从平台导出他们的数据,并加入直接与 AI 公司和开发人员谈判的数据集合。通过加密的个人存储和客户端计算,用户可以保持完全控制,同时实现以前只能通过集中式平台实现的网络效果。它提供了一个双方共赢的自主互联网:开发人员可以使用他们梦想的数据集构建变革性应用程序,而用户则保持对他们最宝贵资产的完全控制。

今天,我们将在主网启动之前发布 Vana 白皮书。在这篇文章中,我们将探讨 Vana 如何将要提取的资源中的个人数据转换为由其创建者控制的资产类别。

克服数据的双花问题

数据金融化的核心挑战在于,与其他数字资产不同,数据的经济价值取决于受控访问——一旦数据公开,它就会失去其市场价值。传统的区块链强调公共可验证性,不太适合处理私有数据。Vana 通过一种将私有数据托管与公共所有权相结合的架构来解决这个问题。

Vana 网络维护一个全局状态,包括:

  • 数据所有权记录:数据所有权的加密证明
  • 访问权限:谁可以在什么条件下访问哪些数据
  • 验证证明:数据质量、真实性和元数据的证明
  • 链上数据集合合约和代币余额:经济权利和治理

虽然数据本身在个人服务器或安全飞地中保持加密状态,但该网络支持对谁可以访问数据、在什么条件下以及价值如何流回数据创建者进行编程控制。

在实践中,用户可以导出他们的私有数据,将他们的数据托管在由私有加密密钥保护的个人服务器中,并加入 Vana 上的数据集合,该集合将类似类别的用户数据汇集在一起。这些被称为 DataDAO 的集体可以与训练 AI 模型的研究人员或应用程序开发人员协商,以支付池化数据的使用费用。当外部开发人员购买数据时,数据池的贡献者将获得报酬。

DataDAO 和数据代币

数据流动性池作为一种协调机制,将个人数据转化为新的资产类别,将不可替代的数据映射到可替代的数据代币。数据流动性池是指实例化 DataDAO 的智能合约,而 DataDAO 又是指围绕特定数据生态系统发展的数据贡献者、开发人员和研究人员的更大生态系统。当用户向 DataDAO 贡献数据时,他们将根据 DataDAO 独特的贡献证明获得特定于 DLP 的代币。

每个 DataDAO 都实施了自己的贡献证明功能,以适应它处理的特定数据类型,因为不同形式的数据本质上具有不同的质量和价值衡量标准。例如,专注于财务数据的 DLP 可能会在其评分机制中优先考虑交易准确性、记录完整性和报告一致性等因素。相比之下,以社交媒体为中心的 DLP 可能会更重视用户参与度、账户有效期和内容交互指标等因素。对于运行状况数据,DLP 可能会强调数据新鲜度、测量频率和设备准确性评级。

Vana 协议定义了一个标准化的证明架构,以包括链上的证明和元数据,同时保持数据的私密性。数据验证通过称为 Satya 网络的可信执行环境 (TEE) 网络进行。这些节点提供有关数据质量的可验证证明,同时保护底层数据的隐私。每个 DLP 都定义了自己的验证标准,从而实现了市场驱动的数据质量评估方法。一些 DLP 还利用基于 zk 的证明,包括 zk email 和 zktls

DLP 是 Vana 网络中集合数据资产的基本协调机制。与 DeFi 中协调同质化代币对的传统流动性池不同,DLP 协调不可替代的个人数据贡献,同时维护隐私和主权。

Vana 基金会与 12 个领先的 DataDAO 一起运行一个加速器计划,并为下一批申请了 300 份申请。目前的 DataDAO 团队有 2-5 人全职工作,围绕特定数据源构建 DLP,包括 Twitter 数据合成数据遗传数据和浏览器数据。每个 DataDAO 都发行自己的数据集特定代币。您可以在此处了解有关活跃 DataDAO 的更多信息

DLP 的强大之处在于其无需许可的性质 – 任何人都可以创建一个 DLP,而无需寻求数据来源平台的批准。这是可能的,因为 DLP 利用现有的数据隐私法规来保证个人用户有权导出和控制其个人数据。

当 AI 研究人员和模型开发人员想要访问这些池化数据时,他们会与 DataDAO 的治理系统互动,而不是与成千上万的个人用户谈判。这种集体谈判方法是变革性的:数据贡献者获得与其贡献成正比的治理代币,从而赋予他们经济权利和对数据使用方式的决策权。结果是一个良性循环,高质量的数据贡献得到奖励,市场力量决定公平访问定价,持续的数据维护得到激励。

例如,AI 研究人员可能会提出一个对 DataDAO 的分阶段访问计划,从访问 10% 数据集的质量控制阶段开始,然后是用于模型训练的完全数据集访问——同时保持底层数据的加密和安全。作为交换,他们将销毁指定数量的 DLP 令牌,从而有效地将价值分配给所有数据贡献者。这种简单但强大的机制可确保随着数据集价值的增长,收益会直接回馈给贡献数据的人。

DataDAO 和 VANA 代币

当 Vana 主网启动时,它将建立第一个大规模替代方案,以取代大型科技公司的数据垄断。到目前为止,寻求训练数据的 AI 公司只有一个真正的选择:与控制大量用户数据集的 Meta 和 Google 等中心化平台进行谈判。开发人员被迫在围墙花园内工作,限制了他们访问最佳数据集的机会。在此之前,它甚至可能是理性的:与数百万个人用户协调数据访问是一项技术和社会挑战。

Mainnet 通过为大规模的真正数据主权创建基础设施,从根本上改变了这种动态。数百万用户第一次可以将他们的数据汇集到一个流动性市场中,该市场在规模和价值上可与大型科技公司的数据存储库相媲美,同时保持对其信息的加密控制。Vana 主网通过真实的价格发现创建了一个统一的数据经济,其中市场力量而不是平台垄断决定了数据的价值。

在此过程中,我们铺设了一条用户数据真正拥有主权的道路:由用户通过非托管钱包控制,并在整个互联网上随身携带。

VANA 代币通过几个关键功能实现这一愿景:

  • 通过验证者质押实现网络安全
  • 网络运营的交易费用支付
  • DLP 质押,它决定了不同 DataDAO 的排放奖励
  • 购买所有 DLP 数据访问权限所需的货币

当 AI 公司想要从 DLP 访问数据时,他们必须使用 VANA 购买和销毁 DLP 的代币。这在网络使用和代币价值之间建立了直接的经济联系——随着越来越多的 AI 公司寻求访问用户数据,它们推动了对 VANA 和 DLP 代币的需求。销毁机制确保价值流回网络和数据贡献者。

排名前 16 位的 DataDAO 将获得一部分排放量,旨在奖励将数据引入网络的早期贡献者。前 16 名是在每个 epoch(3 周)根据谁拥有最多的 VANA 赌注选出的。奖励根据 Vana DAO 管理的一组性能指标在前 16 名之间分配。您可以在此处了解有关 DataDAO 奖励的更多信息:https://www.vana.org/posts/datdao-rewards

通过这种方式,VANA 既是数据交易的经济基础,也是网络中数据资产总价值的有效代理。随着越来越多的 AI 公司寻求通过 DLP 访问用户数据,购买 VANA 来销毁 DLP 代币的机制创造了一个可持续的经济,对数据贡献者和网络参与者都有回报。

数据经济的开放新时代

Vana 主网的推出标志着 AI 经济根本性权力转移的开始。用户第一次可以集体挑战大型科技公司的数据垄断,将个人数据从要提取的资源转化为我们控制的资产类别。这不仅仅是关于薪酬,而是关于重塑谁来构建、控制 AI 并从中受益。

机会是直接而巨大的。AI 公司正在撞上数据墙,拼命寻找新的训练数据,而不是从公共互联网上抓取的数据。通过 Vana,用户现在可以将他们的数据汇集到与主要平台相媲美甚至优于主要平台的数据集中,同时保持加密控制。Vana 作为一个网络,随着每个增量用户而变得更强大,使数据集能够跨平台,组合不同的数据类型,并赋予用户对其数据的真正自主权。

我们正在构建一个适用于用户和开源构建者而不是 web2 巨头的 AI 经济。一个数据自由流动但主权仍然是绝对的。在这里,下一代 AI 模型在用户拥有的数据上进行训练,并将好处回馈给贡献者 – 世界上最好的 AI 开发人员可以访问他们梦想的数据集。加入我们,与社区一起为新的开放数据经济奠定基础。

赞(0)
未经允许不得转载:Launchpool » Vana:第一个 AI 数据主权开放协议