为什么区块链无法直接运行AI？

成本过高。矩阵1000x1000乘法需要30亿gas，而区块限制仅3000万。区块链计算能力与AI需求相差100万倍。

什么是推理Rollup？

借鉴以太坊扩容技术，将AI计算转移到链下执行，同时通过密码学证明或欺诈证明在链上验证结果的正确性。

zkML和opML有什么区别？

zkML生成密码学证明，提供即时最终性但计算开销大（1000倍）。opML假设结果正确，仅在争议时验证，更快但有等待期。

哪些项目在做推理Rollup？

EZKL（开源zkML）、Giza（StarkNet原生）、ORA Protocol（opML）、Ritual（灵活验证）、Inference Labs（推理证明协议）。

推理Rollup：驱动链上AI的隐形基础设施 | 今天什么在趋势？| AI 发现趋势资产

Q: zkML真的有必要吗？

仅在高风险场景（DeFi清算、链上游戏）有价值。大多数AI应用不需要密码学验证，用户按输出有用性判断而非验证模型。

在区块链上运行AI非常昂贵。昂贵到离谱。一个简单的1000x1000矩阵乘法在以太坊上需要超过30亿gas。这超出了整个区块gas限制好几个数量级。作为参考，当前以太坊的区块gas限制大约在3000万左右。如果不采用某种变通方案，你根本无法在链上执行基本的AI操作。

这个根本性的约束困扰了加密AI项目多年。大多数"链上AI"项目悄悄地在中心化服务器上运行模型，然后只把结果发布到区块链上。那不是去中心化AI，那只是带有营销问题的普通AI。

推理Rollup通过借鉴以太坊扩容方案的技术来解决这个问题。将计算转移到链下，保持验证在链上。同样的逻辑让Optimism和Arbitrum能够处理交易，也能让AI推理在不烧爆GPU预算的情况下实现去信任化。

核心问题：区块链无法运行AI

让我们具体说明为什么这很重要。

一个GPT风格的语言模型每次推理需要执行数十亿次浮点运算。即使是像Llama 7B这样的小模型，每生成一个token也需要大约140亿次乘累加运算。以太坊上的智能合约在达到gas限制之前，可能只能处理几千次运算。

区块链能计算的和AI模型所需的之间存在六个数量级的差距。再怎么优化gas也无法弥合这个差距。你需要一个根本不同的架构。

当前的"AI区块链"项目用三种方式处理这个问题。第一种方法是纯粹的中心化。在AWS上运行模型，把结果发到链上。用户信任运营方。这违背了区块链的初衷，但能快速上线。

第二种方法是委员会验证。多个独立方运行相同的推理并比较结果。如果结果匹配，那结果可能是正确的。这能工作，但需要冗余计算，而且仍然依赖于信任委员会成员不会串通。

第三种方法是密码学验证。生成数学证明来证实计算正确执行了。任何人都可以验证证明而无需重新运行计算。这就是推理Rollup发挥作用的地方。

两种流派：zkML和opML

推理Rollup根据验证机制分为两个阵营。零知识机器学习(zkML)在推理过程中生成密码学证明。乐观机器学习(opML)假设结果正确，在出现争议时依靠欺诈证明。

这种权衡与以太坊扩容中ZK Rollup和乐观Rollup的区别如出一辙。

zkML提供即时最终性。一旦证明生成并验证通过，结果就获得了密码学保证的正确性。没有等待期，没有被挑战的可能。缺点是证明生成需要的计算量是原始推理的1000倍或更多。一个100毫秒的模型推理可能需要2分钟来生成其ZK证明。内存消耗也会同样爆炸。

opML以延迟最终性为代价提供速度。推理以原生速度运行，结果立即发布。一个挑战期允许验证者对不正确的结果提出异议。如果在窗口期内没有人提出异议，结果就最终确定。这与Optimism和Arbitrum的工作方式相似。

实际影响决定了哪种方法适合哪种用例。zkML适用于需要即时结算的应用。想象一下DeFi协议，一个错误的AI输出可能会抽空流动性池。证明生成的延迟发生在结果上链之前，所以用户在交易确认后看到的是即时最终性。

opML适用于能容忍延迟最终性的应用。社交评分、内容审核、推荐系统。这些可以等待挑战期，因为临时错误结果的后果是可控的。

opML的实际工作原理

ORA Protocol开创了opML并发布了详细的技术规范。该系统结合了四个组件。

首先是确定性机器学习引擎。标准ML框架通过浮点运算、随机初始化和硬件差异引入随机性。同一个模型在不同GPU上运行可能产生略有不同的输出。opML通过使用定点算术和基于软件的浮点库来消除这种情况。每个运行相同模型和相同输入的节点都会产生相同的输出。

其次是欺诈证明虚拟机。当出现争议时，系统需要在链上验证计算。但你无法在链上运行完整的神经网络。FPVM逐步追踪执行，允许争议方将分歧缩小到单条指令。只有那条指令在链上得到验证。

第三是交互式争议博弈。如果验证者认为结果有误，他们质押代币并发起挑战。双方都提交执行轨迹。二分搜索找出第一个分歧点。有争议的指令由链上FPVM验证。输的一方损失其质押。

第四是多阶段协议，避免预先将整个计算编译成VM指令。这种优化允许半原生执行和延迟加载，与朴素的欺诈证明系统相比大大提高了性能。

经济安全模型假设参与者是理性的。提交者在发布结果前质押代币。验证者在发起挑战前质押代币。不正确的提交者会将其质押输给成功的挑战者。错误的挑战会将其质押输给提交者。在均衡状态下，没有人会提交错误结果，因为被发现的成本超过了任何潜在收益。

如果验证者与提交者串通、质押金额相对于利用价值太小、或验证者缺乏监控的经济激励，这个假设就会失效。这些都是生产系统需要通过精心设计的代币经济学和验证者选择来解决的真实问题。

zkML：技术前沿

自2022年以来，零知识机器学习取得了显著进展。Modulus Labs在不同模型规模上对ZK证明系统进行了基准测试，并在"The Cost of Intelligence"论文中发布了研究结果。

结果表明，你可以在高端AWS硬件上用大约50秒为最多1800万参数的模型生成证明。按现代标准来看这很小。GPT-2 Small有1.17亿参数。Llama 7B有70亿参数。但1800万参数涵盖了分类、异常检测和基本推理任务的实用模型。

EZKL成为最易用的zkML框架。它接受ONNX格式的模型，这是PyTorch和TensorFlow模型的标准导出格式。任何ML工程师都可以导出他们的模型并生成ZK证明，而不需要密码学专业知识。开发者体验很重要，因为采用率取决于可访问性。

Giza采取了不同的方法，专门针对StarkNet。他们的技术栈将ONNX模型转换为Cairo，StarkNet的原生语言，实现与StarkNet合约的直接集成。这为StarkNet上的DeFi应用提供了一条自然的路径来整合可验证AI。

Worldcoin使用zkML用于他们的虹膜码系统。用户在手机上本地生成证明，证明他们的虹膜码是从有效模型正确计算出来的。这让Worldcoin可以升级他们的生物特征算法而无需用户在物理设备处重新验证。ZK证明的隐私属性也意味着原始虹膜图像永远不会离开用户的设备。

真正的瓶颈：证明生成成本

这是需要对zkML保持冷静的地方。证明生成的1000倍开销不是一个常数。它随着模型复杂度增加。更大的模型、更多的层、更大的激活值都会非线性地增加证明时间。

当前的zkML系统在大约1亿参数时遇到实际限制。超过这个规模，证明生成时间会延长到数小时，内存消耗会超出消费级硬件。为GPT级别的模型运行zkML需要专门的证明基础设施，这恰恰把本应实现去中心化的过程中心化了。

研究前沿聚焦于三个优化方向。专门为神经网络操作而非通用计算设计的定制ZK电路。使用GPU和FPGA进行证明生成的硬件加速。将较小证明组合成大证明而不会二次爆炸的递归证明。

Modulus Labs声称他们优化后的证明器比朴素实现快1000倍。这是有意义的进展，但仍然让大模型无法实现去信任化操作。

当前的zkML最适合小型专用模型。分类、异常检测、简单回归。大型语言模型和扩散模型仍然牢牢属于opML领域或需要可信设置。

房间里的大象：zkML真的有必要吗？

这是一个在zkML圈子里问得不够多的问题：现实世界真的需要密码学证明来证明AI模型正确运行了吗？

标准的zkML推销是这样的。我有一个模型。我用ZK证明它正确运行了。现在你可以信任结果了。但大多数AI用例根本不需要这种信任模型。

考虑一下今天AI被部署的场景。推荐系统推荐产品。没有人要求密码学证明推荐算法确实运行了。情感分析对文本进行分类。用户在接受输出之前不会验证模型权重。图像分类识别对象。结果要么有用要么没用。

zkML的价值主张只有在三个条件同时满足时才会发挥作用。首先，AI输出具有高风险后果。其次，运营者有动机谎报运行了什么模型。第三，用户既有能力又有动机来验证证明。这个交集很窄。

DeFi清算可能符合条件。一个借贷协议使用AI来评估抵押品风险。如果协议运营者可以用一个低估风险的更便宜的模型来替代，他们就能把计算节省装进口袋，同时把损失社会化。在这里，验证很重要。

有真金白银赌注的游戏可能符合条件。如果加密游戏中的AI对手可以被秘密替换成一个更弱的模型来让某些玩家获胜，验证可以防止这种作弊。

但大多数AI应用呢？信任模型已经是"试试看它是否有效"。只要响应有用，用户不在乎是GPT-4还是GPT-3.5生成了他们的响应。他们不验证模型权重。他们评估输出。

Inference Labs创始人Colin Gagich捕捉到了这种张力："zkML的广泛采用不会从证明开始，而是从可用性开始。"这个洞察是，密码学验证是基本功，不是产品本身。如果zkML只提供验证，采用率将仅限于验证能创造价值的狭窄应用场景。

获得牵引力的项目专注于更广泛的基础设施。Inference Labs开发了用于模型切片的DSperse和用于高效证明的JSTprove。架构创新比密码学本身更重要。让AI推理在链上可组合、可审计、高效，这创造的价值独立于是否有人验证证明。

这并不意味着zkML没有价值。这意味着这项技术需要嵌入到令人信服的应用中，而不是作为独立功能来营销。理解这种区别的项目将捕获价值。那些把"我们有ZK证明"作为主要价值主张来推销的项目将陷入困境。

正在涌现的实际应用

尽管存在局限性，推理Rollup今天已经为真实应用提供动力。

Modulus Labs构建了RockyBot，这是一个使用ZK证明验证其策略执行的链上交易机器人。用户可以确认机器人确实运行了它声称运行的模型，使用了它声称使用的参数。这很重要，因为交易机器人以声称使用复杂AI而实际运行简单启发式规则而臭名昭著。

Giza与Yearn Finance合作，为v3金库构建自动风险评估。该系统使用ML模型评估金库策略并提供可验证的风险评分。金库存款人可以验证风险评估确实来自声称的模型，而不是随意的数字。

Lyra Finance使用ML来增强其期权协议AMM。机器学习通过纳入波动率预测来提供更好的期权定价。zkML验证确保定价模型按文档运行。

ORA Protocol的Onchain AI Oracle (OAO)将Llama 3和Stable Diffusion推理带到多条链上，包括以太坊主网、Optimism、Arbitrum和Manta。开发者可以直接从智能合约请求AI推理。预言机透明地处理执行和验证。

Spectral Labs构建了一个zkML市场，开发者可以交易AI代理。ZK验证确保代理按广告表现。这在一个充斥着夸大AI声明的市场中创造了问责制。

AI Arena使用zkML进行链上游戏。玩家使用在链上得到验证的模型训练AI战士。战斗使用经过验证的模型执行，确保公平竞争。这款游戏以一种没有推理Rollup就不可能实现的方式，将NFT所有权与经过验证的AI性能结合在一起。

Ritual的替代方案

Ritual采取了一种值得一提的不同方法。他们没有走纯zkML或opML的路线，而是为区块链构建了他们所谓的"AI协处理器"。

他们的第一个产品Infernet让开发者将推理请求发送到链下并接收经过验证的结果。验证可以使用ZK证明、TEE证明或经济承诺，取决于应用的安全要求。

这种灵活性很重要，因为不是每个应用都需要相同的安全保证。社交评分系统可以容忍与DeFi清算引擎不同的风险。Ritual的架构让开发者选择适合其威胁模型的验证机制。

Ritual在种子轮融资中筹集了2500万美元，Polychain随后又追加了数百万美元。投资论点聚焦于Ritual处于web2和web3的交汇处，既服务于整合区块链的传统企业，也服务于整合AI的加密原生应用。

他们的路线图包括一个"Ritual Superchain"，聚合类似计划的基础设施。这将他们定位为综合提供商而非单点解决方案。这种整合策略能否成功取决于执行和生态系统采用。

这对交易者意味着什么

如果你在交易加密货币，推理Rollup以两种方式影响你。

首先，它们实现了新的交易工具。可验证的AI信号证明了其方法论。链上交易机器人具有可审计的策略。风险评估无法被操纵。这些应用需要推理Rollup提供的去信任化验证。

其次，推理Rollup项目的代币本身成为可交易资产。Inference Labs、ORA、Ritual和类似项目都有或将有代币。理解这项技术有助于评估哪些项目解决了真正的问题，哪些只是用AI热词重新包装现有解决方案。

EKX.AI Trending Scanner监控链上活动，寻找先于价格变动的模式。当推理Rollup项目显示异常交易模式、聪明钱动向或流动性变化时，扫描器可以在更广泛的市场反应之前提醒你。

这很重要，因为AI x Crypto仍然是最热门的叙事之一。这个领域的项目在公告、合作伙伴关系和技术里程碑周围会出现大幅波动。早于这些变动需要能捕捉人眼观察遗漏的信号的监控工具。

安全模型审视

让我们批判性地审视安全假设。

zkML的安全性取决于底层ZK证明系统的可靠性。如果证明系统有bug，证明可以被伪造。这在其他ZK应用中已经发生过。zkML系统的密码学复杂性使其比传统智能合约更难审计。

opML的安全性取决于验证者的警惕性。如果在挑战期内没有验证者检查结果，不正确的结果就会最终确定。这造成了搭便车问题。个别验证者承担验证成本，但与所有人分享正确结果的好处。

两种方法都假设确定性执行。如果模型可以根据硬件或软件环境对相同输入产生不同输出，争议就无法解决。在异构计算环境中实现真正的确定性并非易事。

质押经济学需要仔细校准。质押太少，攻击者就能从偶尔未被发现的欺诈中获利。质押太多，诚实参与者就负担不起加入。均衡取决于关于攻击成本和验证者参与度的假设，这些假设在实践中可能不成立。

证明者和验证者之间的串通是一个未被充分探索的攻击向量。在opML中，如果提交者控制了大多数验证者质押，他们可以提交错误结果并压制挑战。在zkML中，如果少数实体运营所有证明基础设施，他们可以串通决定生成哪些证明。

推理Rollup不是一个已解决的问题。这项技术在受控环境中有效。大规模的生产部署仍未经证实。尽管有令人信服的技术叙事，也要把AI代币视为高风险资产。

竞争格局

构建推理Rollup基础设施的竞赛已经吸引了大量资本。

Inference Labs从28个投资者那里融资630万美元，分两轮完成。他们专注于"推理证明"和与Bittensor的集成，将自己定位在去中心化AI计算网络中。

Ritual的2500万美元以上使其成为资金最充足的玩家。他们的企业焦点和灵活的验证方法可能会占领进入web3的传统公司市场。

Modulus Labs融资630万美元继续开发优化的ZK证明器。他们研究优先的方法可能会产生改变竞争格局的突破。

ORA Protocol（前身HyperOracle）已部署到多条链并在生产中运行。他们的opML方法以理论安全性换取实用性。

Giza在StarkNet生态系统中开辟了一个利基市场。他们与Yearn等主要DeFi协议的集成展示了市场牵引力。

EZKL维护着许多项目构建于其上的开源工具。他们对zkML基础设施的商品化使生态系统受益，即使这限制了他们的价值捕获。

市场有多个赢家的空间，因为不同的方法适合不同的应用。zkML用于高风险金融应用。opML用于大模型推理。混合方法用于有细微要求的应用。

接下来会发生什么

三个趋势将在未来一年塑造推理Rollup。

首先，证明生成将变得更快。硬件加速、更好的算法和递归证明将推动可验证模型的边界。1800万参数的限制将增加，为更多应用打开zkML。

其次，标准化将出现。现在，每个项目都有自己的模型格式、证明系统和验证接口。标准API和可互操作的基础设施将减少开发者摩擦并实现跨项目组合。

第三，混合方法将主导。纯zkML或纯opML各有局限。生产系统将根据每次推理的具体要求组合多种验证机制。单个应用可能对关键金融逻辑使用zkML，对大模型推理使用opML，对延迟敏感的操作使用TEE证明。

更大的图景与更广泛的加密AI叙事相连。随着AI变得更加强大，谁控制AI系统的问题变得更加重要。中心化AI提供商可以随心所欲地审查、操纵和变现AI输出。带有密码学验证的去中心化AI将这种权力转移给用户和社区。

推理Rollup是这种转移的技术基础。没有对AI计算的去信任化验证，"去中心化AI"仍然只是营销。有了它，一类新的应用就成为可能。

开始使用

如果你想在实践中探索推理Rollup，从这里开始。

对于开发者，EZKL提供了最易上手的入口。将你的PyTorch模型导出为ONNX。使用EZKL CLI生成证明。部署验证合约。你可以在一个下午内拥有一个可工作的zkML演示。

对于交易者，监控主要推理Rollup项目的代币。使用EKX.AI的扫描器等工具在新闻发布前捕捉积累模式。这个赛道仍然足够小，以至于单个催化剂会显著影响价格。

对于研究者，ZKML的学术文献已经爆发。GitHub上的awesome-zkml仓库聚合了论文、实现和讨论。Worldcoin的技术博客提供了关于应用zkML的通俗解释。

对于每个人，请理解这项技术还很早期。第一波推理Rollup应用将有bug、局限性和只有在生产中才会显现的经济漏洞。在认识到变革潜力的同时保持适当的谨慎。

区块链行业花了数年时间解决交易的可扩展性。推理Rollup解决的是计算的可扩展性。那是一个更大的可寻址市场，有更难的技术挑战。破解它的项目将定义加密AI的下一个时代。