Tether представила кроссплатформенную систему для локального дообучения LLM

cryptonews.ru发布于2025-02-02更新于2025-12-03

Tether Data интегрировала полноценную LoRA-тренировку в llama.cpp с кроссплатформенной поддержкой.
QVAC-fabric-llm работает благодаря Vulkan, Metal и LoRA.
Новая ИИ-система Tether позволяет дообучать Qwen3 и Gemma3 на любом устройстве — от смартфона до сервера.

Исследовательское подразделение искусственного интеллекта (ИИ) компании Tether — Tether Data AI — представило QVAC-fabric-llm. Это новая инфраструктура для Low-Rank Adaptation (LoRA)-дообучения больших языковых моделей (LLM) непосредственно в рамках экосистемы llama.cpp.

Как отмечает компания, это первое решение, позволяющее проводить параметро-эффективное обучение LLM на всем спектре потребительского оборудования — от мобильных графических процессоров (GPU) до десктопных видеокарт.

В Tether говорят, что проект является «значительным шагом в миссии QVAC», ведь система обеспечивает настоящую аппаратно-независимую совместимость и устраняет зависимость от конкретных вендоров.

Разработчики отметили, что технология позволяет выполнять дообучение «на любом современном устройстве — от мобильного до серверного».

Одной из ключевых инноваций является возможность запускать LoRA-дообучение на мобильных графических процессорах, что до этого считалось недоступным. В Tether заявили:

«Мы демонстрируем первые успешные результаты точной настройки на мобильных GPU, ранее недоступные возможности, которые открывают путь к настоящей персонализации на устройстве».

Поддержка охватывает GPU Adreno, Mali и Apple, а также настольные графические решения AMD, Intel, NVIDIA и Apple.

QVAC-fabric-llm также добавляет первую кроссплатформенную поддержку LoRA-обучения для моделей Qwen3 и Gemma3, что существенно расширяет функциональность llama.cpp.

Чтобы ускорить развитие экосистемы, Tether Data AI открывает доступ к:

мультиплатформенным бинарным файлам;
LoRA-адаптерам, дообученным непосредственно на устройствах;
исходному коду новых модулей.

Компания подчеркивает:

«Все взносы являются безопасными для высших уровней: мы не меняли публичные API llama.cpp и добавляли только новые модули».

Код опубликовали под лицензией Apache 2.0.

Зачем это криптовалютной индустрии и Tether

Для Tether, крупнейшего эмитента стейблкоинов, развитие собственного ИИ-направления направлено на:

создание автономных систем, которые могут работать локально в регионах с высокой задержкой или нестабильной инфраструктурой;
защиту приватности, ведь чувствительные данные пользователей не нужно передавать в облако;
масштабируемость, которая не зависит от вендора GPU.

В Tether Data подчеркнули важность локального дообучения:

«Способность к точной настройке LLM на персональных данных пользователя является критической для персонализации и более широкого принятия технологии».

Среди ключевых технических решений:

перенос полного LoRA-workflow в llama.cpp с API для инициализации, тренировки, чекпойнтинга и слияния адаптеров;
использование Vulkan для универсальной GPU-совместимости (NVIDIA, AMD, Intel, Adreno, Mali);
поддержка Apple Metal для M-серии и мобильных A-серий;
поддержка инструкционного дообучения благодаря маскированным потерям (обучение только на токенах ассистента);
добавление обратных проходов для современных архитектур, включая GEGLU;
динамический алгоритм разбиения на блоки для обхода жестких ограничений драйверов Adreno и выполнения больших матричных операций.

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Проект показал жизнеспособность LoRA-тренировки на самых разных устройствах — от RTX 4090 до мобильных Mali.

Согласно тестам, качество моделей после дообучения в QVAC-fabric-llm сопоставимо с PyTorch-HuggingFace:

процент побед LLM-судей: 45-48% (против 52-55% в PyTorch);
биомедицинская точность: 79-94% (против 78-86%);
косинусное сходство: 0.82 против 0.77.

В Tether отметили, что технология особенно полезна для сфер со строгими требованиями к приватности — медицины, науки, регулируемых финансовых сервисов.

Дальнейшие планы

Среди следующих шагов команда назвала расширение поддержки количественных форматов (GPTQ-INT8, Q5_K_M), оптимизацию GPU-операторов и улучшение управления памятью.

Представив QVAC-fabric-llm, Tether сделала попытку перенести ИИ-возможности, которые обычно доступны только в дата-центрах, непосредственно на потребительские устройства.

Компания заявила, что эта технология «разрушает давние аппаратные ограничения» и открывает путь к эпохе частных, локальных, устойчивых ИИ-решений.

Напомним, что недавно Tether подписала арендное соглашение на 20 000 GPU для поддержки ИИ-сферы на фоне партнерства видеоплатформы Rumble и немецкой майнинговой компании Northern Data.

你可能也喜欢

Bitmine 增持至 570 万枚 ETH，纳入罗素 1000 指数，Tom Lee 称离「5% 目标」只差一步

全球最大的以太坊企业金库Bitmine近期增持27,084枚ETH，总持仓达570万枚，占ETH总供应量的4.7%，正接近其“持有5% ETH流通供应”的目标。尽管上周ETH价格下跌8%，公司股价亦大幅回落，但董事长Tom Lee将其归因于季末调仓，并强调公司将在2026年保持稳定买入节奏。同期，Bitmine被纳入罗素1000大盘股指数，Lee预计此举将吸引大量被动机构资金流入。公司持有的ETH大部分处于质押状态，预计年化质押收入可观。Bitmine目前是全球最大的企业以太坊金库，在整体企业加密资产持仓中排名第二。

marsbit21分钟前

Bitmine 增持至 570 万枚 ETH，纳入罗素 1000 指数，Tom Lee 称离「5% 目标」只差一步

marsbit21分钟前

AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口“很小”

OpenAI首席研究官Mark Chen近日表示，通用人工智能（AGI）即将到来，人类面临的窗口期“很小”。他认为，AI模型正快速接近能够自主进行“自我维持研究”的阶段，届时创新和进化或将由AI主导。 Chen指出，如今在各个领域都已出现AI的“神之一手”——做出超越人类直觉的突破。他坚信，扩展定律（Scaling Laws）尚未失效，技术进步仍处在指数曲线上。此前OpenAI在内部大力押注的推理模型o1的成功，也增强了这一信心。随着AI执行能力的大幅提升，人类在研究中的角色可能演变为“氛围研究员”（Vibe Researcher），即主要负责提出关键问题和凭借“品味”判断成果价值，而将具体的实施、编排工作交给AI。OpenAI的路线图目标正是实现端到端的AI自主研究。然而，通往AGI之路仍充满挑战。一是评估危机（Benchmaxxing），现有评测方法易被钻空子，缺乏真正有效的评估标准；二是“参差的前沿”问题，AI可能在复杂任务上表现出色，却在需要常识或持续学习的简单任务上失败。Chen承认这些难题，但相信正在被攻克。最后，Chen谈及一个温馨的隐喻：当AGI实现后，他个人的愿望是开一家面馆。这暗示在AI主导认知与创新的未来，人类独有的体验、情感与故事，可能成为最宝贵的价值。

marsbit36分钟前

marsbit36分钟前

中国第一，直逼OpenAI，神秘“扫地僧”冲到全球前七

一款名为“扫地僧”（MopMonk）的神秘AI在权威网络安全基准测试平台CyberGym上，以73.1%的胜率位列全球第七、中国第一，成绩紧追OpenAI。该测试基于超过1500个真实历史漏洞，要求AI在隔离环境中通过多轮推理和工具调用，生成能触发漏洞的有效攻击代码，难度极高。 “扫地僧”未公开团队信息，仅知其基于上海MiniMax公司的开源模型M3构建。M3拥有出色的编程能力、超长上下文理解和多模态处理能力。其成功关键在于一套专为漏洞挖掘设计的智能体框架，核心是结构化的“漏洞记忆”系统：它将任务过程中的代码路径、失败证据、下一步约束等信息有序组织并持续更新，使AI能基于历史经验高效调整策略，避免重复试错。同时，系统支持多智能体并行探索并共享记忆，提升了搜索效率。这一成绩表明，在复杂任务中，将强大基座模型与精心设计的智能体执行框架深度结合，比单纯追求模型参数规模更为重要。其技术路径展示了如何通过工程优化，将模型的理论能力转化为实际解决问题的能力。

marsbit1小时前

marsbit1小时前

历史会重演吗？富达列出结束加密熊市的五大催化剂

富达在一份新报告中指出，比特币当前的加密寒冬可能即将结束，并列出五大可能推动市场复苏的催化剂：比特币的四年周期、更清晰的监管、美联储宽松政策、新兴突破性应用场景，以及新一轮机构采用浪潮。报告回顾，比特币自2011年起大致每四年形成一个周期，近期减半事件减少了新供应，若需求稳定或增长可能推动价格上涨。监管方面，美国SEC此前批准比特币现货ETF曾助推市场创新高，而正在推进的CLARITY法案若通过，可为行业提供明确框架，释放潜在活力。货币政策上，降息环境历来有助于加密资产价格上涨，市场往往提前反应预期。应用场景中，真实世界资产代币化、AI相关加密基础设施及稳定币是当前关注焦点，但历史表明最大的催化剂常出乎意料。机构采用虽非新叙事，但若有科技巨头或国家层面意外的大规模持仓，仍可能扭转局面。富达总结，尽管市场处于低迷，但历史转折多由类似催化剂叠加引发，下一步发展或取决于这些因素中何者率先发力。

Foresight News1小时前

Foresight News1小时前

印度USDT溢价突破8.5%，监管压力收紧供应

印度国内USDT（泰达币）溢价率已飙升至8.5%以上，主要原因是监管压力导致稳定币供应收紧。目前，监管机构通过执法行动和加强监督，抑制了资本流入。供应紧张使得USDT对印度卢比的价格升至102.88卢比，而官方美元/卢比汇率约为94.65，溢价远超通常的3-4%范围。这表明套利效率降低，合规风险阻碍了资本流入。交易员、跨境用户和企业持续争夺有限的稳定币供应。若监管不确定性持续，高溢价可能维持，并促使市场更多依赖非正式交易渠道。监管压力正深刻改变印度稳定币市场的结构，而不仅是造成暂时性价格波动。近几个月，监管执法减缓了新的USDT流入，降低了P2P市场、场外交易柜和交易所订单簿的流动性。尽管供应下降，但活跃钱包地址数和交易量保持相对强劲，显示出跨境支付、贸易结算和美元价值存储等需求依然坚挺。当前，市场效率因监管不确定性而降低，获取美元流动性的成本增加。数据显示，尽管单日交易笔数超过14万，但成交金额因流动性不足而较低，买单量远低于卖单量，做市能力受限。长期来看，若现状持续，交易者可能寻求替代途径或离岸美元流动性。总之，印度市场对USDT的需求保持韧性，但持续的供应限制可能使国内溢价居高不下。USDT流动性的恢复依赖于更明确的监管框架，需要更强的合规路径来重建高效的市场定价。

ambcrypto2小时前

ambcrypto2小时前

交易

现货

Tether представила кроссплатформенную систему для локального дообучения LLM

Зачем это криптовалютной индустрии и Tether

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Дальнейшие планы

你可能也喜欢

Bitmine 增持至 570 万枚 ETH，纳入罗素 1000 指数，Tom Lee 称离「5% 目标」只差一步

AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口“很小”

中国第一，直逼OpenAI，神秘“扫地僧”冲到全球前七

历史会重演吗？富达列出结束加密熊市的五大催化剂

印度USDT溢价突破8.5%，监管压力收紧供应

交易

热门分类

热门标签