Tether представила кроссплатформенную систему для локального дообучения LLM

cryptonews.ru发布于2025-02-02更新于2025-12-03

  • Tether Data интегрировала полноценную LoRA-тренировку в llama.cpp с кроссплатформенной поддержкой.
  • QVAC-fabric-llm работает благодаря Vulkan, Metal и LoRA.
  • Новая ИИ-система Tether позволяет дообучать Qwen3 и Gemma3 на любом устройстве — от смартфона до сервера.

Исследовательское подразделение искусственного интеллекта (ИИ) компании Tether — Tether Data AI — представило QVAC-fabric-llm. Это новая инфраструктура для Low-Rank Adaptation (LoRA)-дообучения больших языковых моделей (LLM) непосредственно в рамках экосистемы llama.cpp.

Как отмечает компания, это первое решение, позволяющее проводить параметро-эффективное обучение LLM на всем спектре потребительского оборудования — от мобильных графических процессоров (GPU) до десктопных видеокарт.

В Tether говорят, что проект является «значительным шагом в миссии QVAC», ведь система обеспечивает настоящую аппаратно-независимую совместимость и устраняет зависимость от конкретных вендоров.

Разработчики отметили, что технология позволяет выполнять дообучение «на любом современном устройстве — от мобильного до серверного».

Одной из ключевых инноваций является возможность запускать LoRA-дообучение на мобильных графических процессорах, что до этого считалось недоступным. В Tether заявили:

«Мы демонстрируем первые успешные результаты точной настройки на мобильных GPU, ранее недоступные возможности, которые открывают путь к настоящей персонализации на устройстве».

Поддержка охватывает GPU Adreno, Mali и Apple, а также настольные графические решения AMD, Intel, NVIDIA и Apple.

QVAC-fabric-llm также добавляет первую кроссплатформенную поддержку LoRA-обучения для моделей Qwen3 и Gemma3, что существенно расширяет функциональность llama.cpp.

Чтобы ускорить развитие экосистемы, Tether Data AI открывает доступ к:

  • мультиплатформенным бинарным файлам;
  • LoRA-адаптерам, дообученным непосредственно на устройствах;
  • исходному коду новых модулей.

Компания подчеркивает:

«Все взносы являются безопасными для высших уровней: мы не меняли публичные API llama.cpp и добавляли только новые модули».

Код опубликовали под лицензией Apache 2.0.

Зачем это криптовалютной индустрии и Tether

Для Tether, крупнейшего эмитента стейблкоинов, развитие собственного ИИ-направления направлено на:

  • создание автономных систем, которые могут работать локально в регионах с высокой задержкой или нестабильной инфраструктурой;
  • защиту приватности, ведь чувствительные данные пользователей не нужно передавать в облако;
  • масштабируемость, которая не зависит от вендора GPU.

В Tether Data подчеркнули важность локального дообучения:

«Способность к точной настройке LLM на персональных данных пользователя является критической для персонализации и более широкого принятия технологии».

Среди ключевых технических решений:

  • перенос полного LoRA-workflow в llama.cpp с API для инициализации, тренировки, чекпойнтинга и слияния адаптеров;
  • использование Vulkan для универсальной GPU-совместимости (NVIDIA, AMD, Intel, Adreno, Mali);
  • поддержка Apple Metal для M-серии и мобильных A-серий;
  • поддержка инструкционного дообучения благодаря маскированным потерям (обучение только на токенах ассистента);
  • добавление обратных проходов для современных архитектур, включая GEGLU;
  • динамический алгоритм разбиения на блоки для обхода жестких ограничений драйверов Adreno и выполнения больших матричных операций.

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Проект показал жизнеспособность LoRA-тренировки на самых разных устройствах — от RTX 4090 до мобильных Mali.

Согласно тестам, качество моделей после дообучения в QVAC-fabric-llm сопоставимо с PyTorch-HuggingFace:

  • процент побед LLM-судей: 45-48% (против 52-55% в PyTorch);
  • биомедицинская точность: 79-94% (против 78-86%);
  • косинусное сходство: 0.82 против 0.77.

В Tether отметили, что технология особенно полезна для сфер со строгими требованиями к приватности — медицины, науки, регулируемых финансовых сервисов.

Дальнейшие планы

Среди следующих шагов команда назвала расширение поддержки количественных форматов (GPTQ-INT8, Q5_K_M), оптимизацию GPU-операторов и улучшение управления памятью.

Представив QVAC-fabric-llm, Tether сделала попытку перенести ИИ-возможности, которые обычно доступны только в дата-центрах, непосредственно на потребительские устройства.

Компания заявила, что эта технология «разрушает давние аппаратные ограничения» и открывает путь к эпохе частных, локальных, устойчивых ИИ-решений.

Напомним, что недавно Tether подписала арендное соглашение на 20 000 GPU для поддержки ИИ-сферы на фоне партнерства видеоплатформы Rumble и немецкой майнинговой компании Northern Data.

你可能也喜欢

AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口“很小”

OpenAI首席研究官Mark Chen近日表示,通用人工智能(AGI)即将到来,人类面临的窗口期“很小”。他认为,AI模型正快速接近能够自主进行“自我维持研究”的阶段,届时创新和进化或将由AI主导。 Chen指出,如今在各个领域都已出现AI的“神之一手”——做出超越人类直觉的突破。他坚信,扩展定律(Scaling Laws)尚未失效,技术进步仍处在指数曲线上。此前OpenAI在内部大力押注的推理模型o1的成功,也增强了这一信心。 随着AI执行能力的大幅提升,人类在研究中的角色可能演变为“氛围研究员”(Vibe Researcher),即主要负责提出关键问题和凭借“品味”判断成果价值,而将具体的实施、编排工作交给AI。OpenAI的路线图目标正是实现端到端的AI自主研究。 然而,通往AGI之路仍充满挑战。一是评估危机(Benchmaxxing),现有评测方法易被钻空子,缺乏真正有效的评估标准;二是“参差的前沿”问题,AI可能在复杂任务上表现出色,却在需要常识或持续学习的简单任务上失败。Chen承认这些难题,但相信正在被攻克。 最后,Chen谈及一个温馨的隐喻:当AGI实现后,他个人的愿望是开一家面馆。这暗示在AI主导认知与创新的未来,人类独有的体验、情感与故事,可能成为最宝贵的价值。

marsbit36分钟前

AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口“很小”

marsbit36分钟前

印度USDT溢价突破8.5%,监管压力收紧供应

印度国内USDT(泰达币)溢价率已飙升至8.5%以上,主要原因是监管压力导致稳定币供应收紧。目前,监管机构通过执法行动和加强监督,抑制了资本流入。 供应紧张使得USDT对印度卢比的价格升至102.88卢比,而官方美元/卢比汇率约为94.65,溢价远超通常的3-4%范围。这表明套利效率降低,合规风险阻碍了资本流入。交易员、跨境用户和企业持续争夺有限的稳定币供应。若监管不确定性持续,高溢价可能维持,并促使市场更多依赖非正式交易渠道。 监管压力正深刻改变印度稳定币市场的结构,而不仅是造成暂时性价格波动。近几个月,监管执法减缓了新的USDT流入,降低了P2P市场、场外交易柜和交易所订单簿的流动性。尽管供应下降,但活跃钱包地址数和交易量保持相对强劲,显示出跨境支付、贸易结算和美元价值存储等需求依然坚挺。 当前,市场效率因监管不确定性而降低,获取美元流动性的成本增加。数据显示,尽管单日交易笔数超过14万,但成交金额因流动性不足而较低,买单量远低于卖单量,做市能力受限。长期来看,若现状持续,交易者可能寻求替代途径或离岸美元流动性。 总之,印度市场对USDT的需求保持韧性,但持续的供应限制可能使国内溢价居高不下。USDT流动性的恢复依赖于更明确的监管框架,需要更强的合规路径来重建高效的市场定价。

ambcrypto2小时前

印度USDT溢价突破8.5%,监管压力收紧供应

ambcrypto2小时前

交易

现货
活动图片