零知识机器学习（ZKML）介绍

作者：手机用户2502938557 | 来源：互联网 | 2023-08-26 13:32

关于 Worldcoin：Worldcoin 是一个去中心化的开源协议，旨在帮助每个个体进入全球经济。它最终的监督和决策将取决于它的用户社区。Worldcoin 的联合创始人 Sam Altman 同

关于 Worldcoin：
Worldcoin 是一个去中心化的开源协议，旨在帮助每个个体进入全球经济。它最终的监督和决策将取决于它的用户社区。Worldcoin 的联合创始人 Sam Altman 同时也是 OpenAI 的创始人兼 CEO。

作者：Worldcoin

翻译：F.F

零知识机器学习（ZKML）是最近在密码学界掀起波澜的一个研究领域。那么它是什么，为什么会有用？首先，让我们将该术语分解为两个部分并解释它们是什么。

ZK 是什么

———

零知识证明是一种密码协议，其中一方（证明者）可以向另一方（验证者）证明给定的声明是真实的，而无需透露除了声明是真实的事实之外的任何其他信息。这是一个在各个方面都取得了长足进展的研究领域，从研究到协议实现和应用。

零知识带来的两个主要“原语”（或基础模块）是为一组给定计算创建计算完整性证明的能力，其中证明比执行计算本身更容易验证（我们称该属性为“简洁性”），零知识证明还提供了隐藏部分计算的选项，同时保持计算的正确性（我们称该属性为“零知识”）。

生成零知识证明的计算量非常大，大约是原始计算的 100 倍。这意味着有些计算无法计算零知识证明，因为即使在目前可用的最佳硬件上创建它们的证明，从时长看也十分不切实际。然而，近年来密码学、硬件和分布式系统领域的进步，使得零知识证明对于更密集的计算变得可行。这些进步使得可以构建使用密集计算证明的协议，从而扩展了新的应用程序的设计空间。

ZK 用例

———

零知识密码学是 Web3 领域中最流行的技术之一，因为它允许开发者构建扩容和 / 或隐私的应用程序。以下是它在实践中的几个用例（但请注意，其中许多项目正在开发当中）：

通过 ZK rollups 扩容以太坊

Starknet
Scroll
Polygon Zero, Polygon Miden, Polygon zkEVM
zkSync

构建隐私保护应用

Semaphore
MACI
Penumbra
Aztec Network

身份和数据证明

WorldID
Sismo
Clique
Axiom

Layer 1 protocols

Zcash
Mina

随着零知识技术的成熟，我们相信将会出现新应用程序的寒武纪爆炸，因为用于构建它们的工具所需专业领域知识会更少，并且对开发者来说会更易用。

———

机器学习是人工智能（“AI”）的一个领域，它使计算机在无需明确编程下，能够自动学习并从经验中改进。它涉及使用算法和统计模型来分析和识别数据中的模式，然后根据这些模式做出预测或决策。机器学习的最终目标是开发能够自适应和学习、无需人工干预的智能系统，解决医疗、金融、交通等各个领域的复杂问题。最近，你可能已经看到大型语言模型（如 chatGPT 和 Bard）或文本到图像生成模型（如 DALL-E 2、Midjourney 或 Stable Diffusion）的进步。随着这些模型变得越来越好并且能够执行更广泛的任务，了解谁执行了这些操作变得很重要。该操作时是否是由特定的模型执行还是由其他模型执行，或者是由人执行。我们将在接下来的部分中探索这个思路。

ZKML 的推动和当前进展

———

我们生活在一个人工智能 / 机器学习生成的内容与人类生成的内容变得难以区分的世界中。零知识密码学将使我们能够做出如下声明：“给定的内容 C，是由模型 M 在某些输入 X 下的输出。”我们将能够验证给定的输出是由大型语言模型（如 chatGPT），或文本到图像生成模型（如 DALL-E 2），或任何其他构建了零知识电路表示的模型所创建。这些证明的零知识属性还允许我们在需要时隐藏部分输入或模型。一个很好的例子是在一些敏感数据上应用机器学习模型，用户可以在不向任何第三方透露他们的输入的情况下，知道模型对其数据的推断结果（例如医疗行业）。

注意：当我们谈论 ZKML 时，我们谈论的是创建机器学习模型的推理步骤的零知识证明，而不是机器学习模型训练（因为就其本身而言，计算量已经非常庞大）。当前零知识系统的技术水平与高性能硬件结合时，仍然无法证明当前可用的大型语言模型（“LLM”）这样庞大的计算，这中间仍然差几个数量级，但目前在创建较小模型的证明上已经取得了一些进展。

我们在为机器学习模型创建证明的背景下，对零知识密码学的最新技术进行了一些研究，并创建了该领域的相关研究、文章、应用程序和代码库的集合。ZKML 上的资源可以在 ZKML 社区 GitHub 的 awesome-zkml 仓库中找到。

Modulus Labs 团队最近发布了一篇题为“智能的代价 (The cost of intelligence)”的论文，其中他们将现有的零知识证明系统对各种不同规模的模型进行了基准测试。目前，使用 plonky2 等证明系统，在功能强大的 AWS 机器上，为约 18M 大小参数的模型创建证明，大约需要 50 秒。论文中的图表如下：

来源: “The Cost of Intelligence: Proving Machine Learning Inference with Zero-Knowledge.” Modulus Labs. Fig. 2, pp. 12. January 20,

另一个致力于改进 ZKML 系统技术水平的是 Zkonduit 的 ezkl 库，它允许你使用 ONNX 创建机器学习模型的零知识证明。这使得任何机器学习工程师都可以为其模型的推断步骤创建零知识证明，并向任何正确实现的验证器证明其输出。

有几个团队致力于改进零知识技术，为零知识证明中的操作优化硬件，并针对特定用例构建优化的协议实现。随着技术的成熟，更大的模型将可以在更短的时间内在功能较弱的机器上进行零知识证明。我们希望这些进步会推动新的 ZKML 应用程序和用例出现。

潜在的用例

———

为了确定 ZKML 是否可以用于给定的应用程序，我们可以检验零知识密码学的属性如何来解决机器学习中的问题。这可以用维恩图来说明：

维恩图如何结合 ZK 和 ML 的原语和技术

定义：

启发式优化 (Heuristic optimization) — 一种根据经验或“启发式”方法来找到问题的解决方案，而这些问题本身使用传统优化方法难以解决。考虑到问题对整个系统的相对重要性以及优化它的难度，启发式优化方法不是试图找到问题的最佳解决方案，而是旨在在合理的时间内找到一个好的或“足够好”的解决方案。
全同态加密机器学习 (FHE ML, Fully Homomorphic Encryption) — 全同态加密机器学习允许开发者以保护隐私的方式训练和评估模型；但是无法像零知识证明那样以加密方式证明所执行计算的正确性。

像 Zama.ai 这样的团队正在研究这个领域

零知识与有效性 (ZK vs. Validity) — 这些术语在行业中经常互换使用，因为有效性证明是不隐藏部分计算或其结果的零知识证明。在 ZKML 的背景中，当前大多数应用程序都在利用零知识证明的有效性证明形式。
机器学习有效性 (Validity ML) — 计算或结果没有被隐私化的机器学习模型的零知识证明。他们证明了计算的正确性。

如下是一些潜在的 ZKML 用例：

计算正确性（机器学习有效性）

Modulus Labs

链上可验证的机器学习交易机器人 - RockyBot
自我改进的区块链愿景（示例）：

使用人工智能功能增强 Lyra Finance 期权协议 AMM
为 Astraly (ZK oracle) 创建一个基于 AI 的公开透明的信誉系统
在 Aztec Protocol（具有隐私功能的 zk-rollup）上使用机器学习，致力于合约级别的合规工具所需的技术突破

机器学习即服务 (MLaaS) 透明度
零知识异常 / 欺诈检测

允许为漏洞 / 欺诈创建零知识证明。异常检测模型可以在智能合约数据上进行训练，并由 DAO 商定为相关的指标，以便能够以更主动、更预防性的方式自动执行安全程序，例如暂停合约。已经有初创公司考虑在智能合约背景合约中使用机器学习模型以实现安全目的，因此后续使用零知识异常检测证明是自然而然的。

机器学习推断的通用有效性证明：能够轻松证明和验证输出是给定模型和输入对的结果。
隐私 (ZKML)
去中心化的 Kaggle：证明模型在某些测试数据上的准确率大于 x%，而不会披露权重。
隐私保护的诊断：将患者的隐私数据输入模型进行医学诊断，并将敏感的诊断（例如癌症检测结果）发送给患者。（来源：vCNN 论文，第 2 / 16 页）

Worldcoin

虹膜特征码 ( IrisCode ) 可升级性：World ID 用户将能够在他们的移动设备的加密存储中，自托管他们的生物特征，下载用于生成虹膜特征码的机器学习模型，并在本地创建一个零知识证明，证明他们的虹膜特征码已成功创建。然后可以将该虹膜特征码无许可地插入到已注册的 Worldcoin 用户集中，因为负责接收的智能合约能够验证零知识证明，从而验证虹膜特征码的创建。这意味着，如果 Worldcoin 升级创建虹膜特征码的机器学习模型，破坏了其先前版本的兼容性，用户将不必再次访问 Orb，可以在本地设备上创建零知识证明。
Orb 安全性：目前 Orb 在其可信环境中实现了多种欺诈和篡改检测机制。我们可以创建一个零知识证明，证明这些机制在拍照和生成虹膜特征码时是活跃的，以便为 Worldcoin 协议提供更好的活性保障，因为我们完全确定这些机制在虹膜特征码生成过程中始终运行。

了解更多并参与贡献

———

在 2022 年下半年，在 ZKML 领域工作的几个不同团队和个人聚在一起创建了 ZKML 社区。这是一个开放的社区，成员可以在这里讨论 ZKML 领域的最新研究和实验并分享他们的发现。如果你想了解有关 ZKML 的更多信息并开始与该领域的从业者交流，那么这里将是提问和了解该主题的好地方。另外，请查看 awesome-zkml 资源仓库！

awesome-zkml: https://github.com/zkml-community/awesome-zkml

推荐阅读

chat
2017年软件开发领域的七大变革

随着技术的不断进步，2017年对软件开发人员而言将充满挑战与机遇。本文探讨了开发人员需要适应的七个关键变化，包括人工智能、聊天机器人、容器技术、应用程序版本控制、云测试环境、大众开发者崛起以及系统管理的云迁移。 ... [详细]

蜡笔小新 2024-11-19 20:17:20
sum
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
int
OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战

OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战 ... [详细]

蜡笔小新 2024-11-11 09:47:50
go
吴石访谈：腾讯安全科恩实验室如何引领物联网安全研究

腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统，并远程控制汽车，展示了其在汽车安全领域的强大实力。近日，该实验室负责人吴石接受了InfoQ的专访，详细介绍了团队未来的重点方向——物联网安全。 ... [详细]

蜡笔小新 2024-11-22 13:27:32
go
本周三大青年学术分享会即将开启

由雷锋网旗下的AI研习社主办，旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享，活动致力于搭建一个连接理论与实践的平台。 ... [详细]

蜡笔小新 2024-11-21 17:13:10
go
Python 领跑！2019年2月编程语言排名更新

根据最新的编程语言流行指数（PYPL）排行榜，Python 在2019年2月的份额达到了26.42%，稳坐榜首位置。 ... [详细]

蜡笔小新 2024-11-21 09:18:39
go
实践指南：使用Express、Create React App与MongoDB搭建React开发环境

本文详细介绍了如何利用Express、Create React App和MongoDB构建一个高效的React应用开发环境，旨在为开发者提供一套完整的解决方案，包括环境搭建、数据模拟及前后端交互。 ... [详细]

蜡笔小新 2024-11-20 10:05:15
merge
教你从写一个迷你koarouter到阅读koarouter源码

本打算教一步步实现koa-router，因为要解释的太多了，所以先简化成mini版本，从实现部分功能到阅读源码，希望能让你好理解一些。希望你之前有读过koa源码，没有的话，给你链接 ... [详细]

蜡笔小新 2024-11-17 13:09:46
int
英特尔推出第三代至强可扩展处理器及傲腾持久内存，AI性能显著提升

英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存，全面增强AI能力和系统性能。 ... [详细]

蜡笔小新 2024-11-17 13:07:14
int
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
int
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
go
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
process
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
header
阿里云 Aliplayer高级功能介绍(八)：安全播放

如何保障视频内容的安全，不被盗链、非法下载和传播，阿里云视频点播已经有一套完善的机 ... [详细]

蜡笔小新 2024-11-15 18:04:15
header
TypeScript: 泛型的力量与价值

本文探讨了 TypeScript 中泛型的重要性和应用场景，通过多个实例详细解析了泛型如何提升代码的复用性和类型安全性。 ... [详细]

蜡笔小新 2024-11-15 12:12:42

手机用户2502938557

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章