机器学习模型的内核级证明机制

Odaily星球日报Опубликовано 2025-06-11Обновлено 2025-06-11

Введение

zkCuda将持续向高效、高扩展性、高适配性的通用证明框架迈进。

原文作者：Zhiyong Fang

"如何吃掉一头大象？一口一口地吃。"

近年来，机器学习模型以惊人的速度实现跨越式发展。随着模型能力的提升，其复杂性亦同步激增——当今先进模型往往包含数百万乃至数十亿参数。为应对此等规模挑战，多种零知识证明系统应运而生，这些系统始终致力于在证明时间、验证时间与证明大小三者间实现动态平衡。

表 1 ：模型参数规模的指数级增长

机器学习模型的内核级证明机制

尽管当前零知识证明领域的大部分工作集中在优化证明系统本身，但一个关键维度却常常被忽视——如何将大规模模型合理拆分为更小、更易于处理的子模块以进行证明。你可能会问，这一点为什么如此重要？

下面我们来详细解释：

现代机器学习模型的参数数量往往以十亿计，即便在不涉及任何密码学处理的情况下，也已占用极高的内存资源。而在零知识证明（Zero-Knowledge Proof, ZKP）的场景下，这一挑战被进一步放大。

每一个浮点数参数都必须被转换为代数域（Arithmetic Field）中的元素，这一转换过程本身会导致内存占用增加约 5 至 10 倍。此外，为了在代数域中精确模拟浮点运算，还需额外引入操作开销，通常也在 5 倍左右。

综合来看，模型整体内存需求可能提升至原始规模的 25 至 50 倍。例如，一个拥有 10 亿个 32 位浮点参数的模型，仅存储转换后的参数就可能需要 100 至 200 GB 内存。再考虑中间计算值与证明系统本身的开销，整体内存占用轻易突破 TB 级别。

当前主流的证明系统，如 Groth 16 和 Plonk，在未经优化的实现中，通常假设所有相关数据可同时加载至内存中。这种假设虽然在技术上可行，但在实际硬件条件下极具挑战性，极大限制了可用的证明计算资源。

Polyhedra 的解决方案：zkCuda

什么是 zkCuda？

如我们在《zkCUDA 技术文档》中所述：
Polyhedra 推出的 zkCUDA 是一个面向高性能电路开发的零知识计算环境，专为提升证明生成效率而设计。在不牺牲电路表达能力的前提下，zkCUDA 可充分利用底层证明器和硬件并行能力，实现快速的 ZK 证明生成。

zkCUDA 语言在语法和语义上与 CUDA 高度相似，对已有 CUDA 经验的开发者十分友好，且其底层以 Rust 实现，确保安全性与性能兼备。

借助 zkCUDA，开发者可以：

快速构建高性能 ZK 电路；
高效调度并利用分布式硬件资源，如 GPU 或支持 MPI 的集群环境，实现大规模并行计算。

为什么选择 zkCUDA？

zkCuda 是一套受 GPU 计算启发设计的高性能零知识计算框架，能够将超大规模的机器学习模型拆分为更小、更易管理的计算单元（kernels），并通过类似 CUDA 的前端语言实现高效控制。这一设计带来了以下关键优势：

1. 精准匹配的证明系统选择

zkCUDA 支持对每个计算 kernel 进行细粒度分析，并为其匹配最适合的零知识证明系统。例如：

对于高度并行的计算任务，可选用如 GKR 等擅长处理结构化并行度的协议；
对于规模较小或结构不规则的任务，则更适合使用如 Groth 16 这类在紧凑计算场景下具有低开销的证明系统。

通过定制化选择后端，zkCUDA 能最大化发挥各类 ZK 协议的性能优势。

2. 更智能的资源调度与并行优化

不同的证明 kernel 对 CPU、内存和 I/O 的资源需求差异显著。zkCUDA 可准确评估每个任务的资源消耗，并智能排程，最大化整体吞吐能力。

更重要的是，zkCUDA 支持在异构计算平台之间进行任务分发——包括 CPU、GPU 和 FPGA——从而实现硬件资源的最优利用，显著提升系统级性能。

zkCuda 与 GKR 协议的天然契合

尽管 zkCuda 被设计为一个兼容多种零知识证明系统的通用计算框架，但它与 GKR（Goldwasser-Kalai-Rothblum）协议在架构上具有天然的高度契合性。

机器学习模型的内核级证明机制

在架构设计上，zkCUDA 通过引入多项式承诺机制，将各个子计算内核连接起来，确保所有子计算基于一致的共享数据运行。这一机制对于保持系统完备性至关重要，但也带来了显著的计算成本。

相比之下，GKR 协议提供了一种更高效的替代路径。与传统零知识系统要求每个内核完整证明其内部约束的方式不同，GKR 允许将计算正确性的验证从内核输出递归回溯至输入。这一机制使得跨内核的正确性得以传递，而非在每个模块中完全展开验证。其核心思想类似于机器学习中的梯度反向传播，通过计算图追踪和传导正确性主张。

虽然在多路径中合并这类“证明梯度”带来了一定复杂性，但正是这一机制，构成了 zkCUDA 与 GKR 之间的深度协同基础。通过对齐机器学习训练流程中的结构特性，zkCUDA 有望实现更紧密的系统集成和大模型场景下更高效的零知识证明生成。

初步成果与未来方向

我们已完成 zkCuda 框架的初始开发，并在多个场景中成功进行了测试，包括 Keccak 和 SHA-256 等密码学哈希函数，以及小规模的机器学习模型。

展望未来，我们希望进一步引入现代机器学习训练中的一系列成熟工程技术，如内存优化调度（memory-efficient scheduling）与计算图级优化（graph-level optimization）。我们相信，将这些策略融合进零知识证明生成流程，将极大提升系统的性能边界与适配灵活性。

这只是一个起点，zkCuda 将持续向高效、高扩展性、高适配性的通用证明框架迈进。

原文链接

Похожее

Эфириум упал на 45% с начала года – так почему же SharpLink и киты продолжают покупать?

Несмотря на падение Ethereum (ETH) на 20-45% с начала года, интерес крупных игроков сохраняется. SharpLink возобновил покупки после восьмимесячной паузы, приобретя 5000 ETH на сумму около $7,88 млн. Вскоре после этого казначейство добавило еще 26,324 тыс. LSETH на $45,54 млн, доведя общие активы до 876 285 ETH. Такое накопление, несмотря на нереализованные убытки, указывает на уверенность в долгосрочной полезности Ethereum и доходах от стейкинга. Крупные инвесторы (киты) также увеличивают свое присутствие, накапливая ETH, что говорит о стратегии, ориентированной на будущий рост, а не на краткосрочные колебания. Однако переводы активов BlackRock на Coinbase, вероятно, связаны с операционными нуждами ETF, а не с прямой продажей. Восстановлению ETH мешают оттоки из спотовых ETF, которые зафиксировали чистый вывод средств на $12,85 млн 26 июня. Это создает расхождение: прямые покупки казначейств идут вопреки общей слабости ETF-сегмента. Тем не менее, значительные остатки средств у эмитентов ETF ($8,38 млрд) и высокий дневной объем торгов ($491,73 млн) показывают, что институциональные инвесторы корректируют позиции, а не уходят с рынка полностью. Для устойчивого восстановления Ethereum необходимы более сильные притоки в ETF, чтобы компенсировать текущий отток.

ambcrypto1 ч. назад

Эфириум упал на 45% с начала года – так почему же SharpLink и киты продолжают покупать?

ambcrypto1 ч. назад

Только что, DeepSeek V4 обновил DSpark, скорость вывода повысилась на 80%

DeepSeek выпустил фреймворк спекулятивного декодирования DSpark, который увеличивает скорость вывода DeepSeek-V4 на 80%. DSpark, развернутый в онлайн-трафике DeepSeek-V4 (Flash и Pro), сочетает высокопроизводительную «параллельную генерацию» с адаптивной «проверкой с учетом нагрузки». Он использует архитектуру полуавторегрессивной генерации для моделирования зависимостей внутри блоков токенов и аппаратно-ориентированное планирование проверки по уверенности для динамического определения оптимальной длины проверки для каждого запроса. В тестах DSpark превзошел современные авторегрессивные (Eagle3) и параллельные (DFlash) модели-черновики, повысив среднюю длину принятия на 26.7%-30.9% и 16.3%-18.4% соответственно. Вместе с DSpark был открыт исходный код DeepSpec — полного стека для обучения и оценки моделей-черновиков спекулятивного декодирования.

marsbit2 ч. назад

Только что, DeepSeek V4 обновил DSpark, скорость вывода повысилась на 80%

marsbit2 ч. назад

Сможет ли Aavenomics 3.0 поддержать восстановительный рост AAVE на фоне переговоров о выкупе Kraken?

Генеральный директор Aave Labs Стани Кулечов опроверг слухи о возможном выкупе доли в протоколе криптобиржей Kraken, отметив, что компания не будет продавать токены AAVE с дисконтом в 70%. Он также анонсировал планы по запуску Aavenomics 3.0, который включит новый механизм автоматического выкупа токенов. На фоне этой новости цена токена AAVE выросла на 12%, продолжив июньский восстановительный ралли, которое составило более 50% (до $88), несмотря на то, что токен все еще значительно ниже своего исторического максимума. Росту способствовало снижение продажного давления на рынке. Ранее цена падала из-за конфликтов в управлении и макроэкономических факторов. Вопрос о том, сможет ли Aavenomics 3.0 поддержать текущее восстановление, остается открытым.

ambcrypto3 ч. назад

Сможет ли Aavenomics 3.0 поддержать восстановительный рост AAVE на фоне переговоров о выкупе Kraken?

ambcrypto3 ч. назад

Оказывается, вот так гений Карпати использует Claude?

Андрей Карпати, известный специалист в области ИИ, после перехода в Anthropic стал менее активен в открытых сообществах. В сети появился файл CLAUDE.md, который, как утверждается, является его личной инструкцией для работы с ИИ-ассистентом Claude при программировании. Хотя подлинность документа не подтверждена, его содержание точно отражает принципы Карпати. Основные правила из файла: 1. **Сначала изучите код**: Прежде чем писать новый код, внимательно прочитайте существующую кодобазу, чтобы соблюдать её стиль и использовать имеющиеся инструменты. 2. **Продумайте решение заранее**: Чётко формулируйте предположения, обсуждайте компромиссы и варианты реализации, не угадывайте требования. 3. **Будьте проще**: Избегайте преждевременных абстракций, избыточной обработки ошибок и ненужной настройки. Пишите минимальный код, решающий конкретную задачу. 4. **Вносите точечные изменения**: Не меняйте код, не связанный с задачей, строго соблюдайте стиль проекта, не рефакторите «заодно». 5. **Проверяйте код**: Пишите тесты для воспроизведения ошибок, проверяйте их до и после изменений, тестируйте поведение, а не реализацию. 6. **Действуйте целенаправленно**: Чётко определяйте критерии успеха, составляйте план для сложных задач. 7. **Отлаживайте системно**: Внимательно читайте сообщения об ошибках, воспроизводите проблему, вносите изменения пошагово, ищите первопричину. 8. **Осмотрительно добавляйте зависимости**: Используйте стандартные библиотеки и существующие в проекте инструменты, оценивайте необходимость, размер и поддержку новых пакетов. 9. **Эффективно коммуницируйте**: Объясняйте свои действия и причины, указывайте на потенциальные проблемы, точно выражайте неуверенность, пишите информативные сообщения о коммитах. Также перечислены типичные ошибки: массовый рефакторинг, ошибочные абстракции, скрытые архитектурные решения, игнорирование нестандартных сценариев, иллюзия знаний и отклонение от стиля проекта. Сообщество отмечает, что эти принципы, основанные на идеях Карпати (например, проект «andrej-karpathy-skills» на GitHub), значительно повышают качество кода, генерируемого ИИ. Ключ — адаптировать правила под свой стек и стиль, а не слепо копировать.

marsbit3 ч. назад

Оказывается, вот так гений Карпати использует Claude?

marsbit3 ч. назад

Исследование BIT: Халвинг 2028 года — не конец, настоящая перестройка в майнинге биткоина только начинается

Текущая биткоин-индустрия переживает наиболее сложную структурную перестройку с момента создания протокола. Несмотря на то, что цена биткоина сохраняется на уровне около 61 000 долларов, а общая хешрейт сети приближается к 1 ZH/s, находясь вблизи исторических максимумов, рентабельность майнеров продолжает ухудшаться. Различные показатели, включая производственные затраты, доход от комиссий, расширение вычислительных мощностей и отраслевой бюджет безопасности, свидетельствуют о том, что майнинг сейчас работает на грани безубыточности, а халвинг 2028 года может ускорить отраслевую консолидацию. Основная проблема заключается не только в снижении вознаграждения за блок из-за халвинга, но и в незавершённом переходе к модели доходов, основанной на комиссиях. В то же время всё больше майнинговых компаний трансформируются из простых производителей биткоинов в операторов инфраструктуры, энергооператоров и провайдеров вычислительных мощностей для ИИ и высокопроизводительных вычислений. Конкуренция в отрасли смещается от наращивания хешрейта к модернизации бизнес-моделей. Данные показывают, что при цене биткоина около 61 000 долларов теоретический ежедневный доход майнеров должен составлять около 78 миллионов долларов, в то время как фактический доход составляет лишь около 33 миллионов долларов. Ежедневный доход от комиссий составляет всего около 220 тысяч долларов. При этом общая точка безубыточности для отрасли оценивается примерно в 65 000 долларов. Ожидается, что после халвинга 2028 года нижняя граница себестоимости производства биткоина вырастет примерно до 93 289 долларов, что ускорит концентрацию отрасли в руках крупных, хорошо капитализированных компаний с диверсифицированными источниками дохода. В целом, биткоин-майнинг переживает глубокую трансформацию от «добывающего бизнеса» к «инфраструктурному бизнесу». В будущем отрасль будет всё больше зависеть от таких источников дохода, как управление энергией и хостинг вычислительных мощностей для ИИ. Для инвесторов ключевым вопросом является не сам халвинг, а то, какие компании смогут осуществить трансформацию бизнес-модели и создать устойчивое конкурентное преимущество в новых условиях.

marsbit3 ч. назад

Исследование BIT: Халвинг 2028 года — не конец, настоящая перестройка в майнинге биткоина только начинается

marsbit3 ч. назад

Торговля

Спот

机器学习模型的内核级证明机制

Введение

Polyhedra 的解决方案：zkCuda

什么是 zkCuda？

为什么选择 zkCUDA？

1. 精准匹配的证明系统选择

2. 更智能的资源调度与并行优化

zkCuda 与 GKR 协议的天然契合

初步成果与未来方向

Похожее

Эфириум упал на 45% с начала года – так почему же SharpLink и киты продолжают покупать?

Только что, DeepSeek V4 обновил DSpark, скорость вывода повысилась на 80%

Сможет ли Aavenomics 3.0 поддержать восстановительный рост AAVE на фоне переговоров о выкупе Kraken?

Оказывается, вот так гений Карпати использует Claude?

Исследование BIT: Халвинг 2028 года — не конец, настоящая перестройка в майнинге биткоина только начинается

Торговля

Популярные категории

Популярные теги

​机器学习模型的内核级证明机制

Введение

Polyhedra 的解决方案：zkCuda

什么是 zkCuda？

为什么选择 zkCUDA？

1. 精准匹配的证明系统选择

2. 更智能的资源调度与并行优化

zkCuda 与 GKR 协议的天然契合

初步成果与未来方向

Похожее

Эфириум упал на 45% с начала года – так почему же SharpLink и киты продолжают покупать?

Только что, DeepSeek V4 обновил DSpark, скорость вывода повысилась на 80%

Сможет ли Aavenomics 3.0 поддержать восстановительный рост AAVE на фоне переговоров о выкупе Kraken?

Оказывается, вот так гений Карпати использует Claude?

Исследование BIT: Халвинг 2028 года — не конец, настоящая перестройка в майнинге биткоина только начинается

Торговля

Популярные категории

Популярные теги

机器学习模型的内核级证明机制