Tether представила кроссплатформенную систему для локального дообучения LLM

cryptonews.ruPublicado a 2025-02-02Actualizado a 2025-12-03

  • Tether Data интегрировала полноценную LoRA-тренировку в llama.cpp с кроссплатформенной поддержкой.
  • QVAC-fabric-llm работает благодаря Vulkan, Metal и LoRA.
  • Новая ИИ-система Tether позволяет дообучать Qwen3 и Gemma3 на любом устройстве — от смартфона до сервера.

Исследовательское подразделение искусственного интеллекта (ИИ) компании Tether — Tether Data AI — представило QVAC-fabric-llm. Это новая инфраструктура для Low-Rank Adaptation (LoRA)-дообучения больших языковых моделей (LLM) непосредственно в рамках экосистемы llama.cpp.

Как отмечает компания, это первое решение, позволяющее проводить параметро-эффективное обучение LLM на всем спектре потребительского оборудования — от мобильных графических процессоров (GPU) до десктопных видеокарт.

В Tether говорят, что проект является «значительным шагом в миссии QVAC», ведь система обеспечивает настоящую аппаратно-независимую совместимость и устраняет зависимость от конкретных вендоров.

Разработчики отметили, что технология позволяет выполнять дообучение «на любом современном устройстве — от мобильного до серверного».

Одной из ключевых инноваций является возможность запускать LoRA-дообучение на мобильных графических процессорах, что до этого считалось недоступным. В Tether заявили:

«Мы демонстрируем первые успешные результаты точной настройки на мобильных GPU, ранее недоступные возможности, которые открывают путь к настоящей персонализации на устройстве».

Поддержка охватывает GPU Adreno, Mali и Apple, а также настольные графические решения AMD, Intel, NVIDIA и Apple.

QVAC-fabric-llm также добавляет первую кроссплатформенную поддержку LoRA-обучения для моделей Qwen3 и Gemma3, что существенно расширяет функциональность llama.cpp.

Чтобы ускорить развитие экосистемы, Tether Data AI открывает доступ к:

  • мультиплатформенным бинарным файлам;
  • LoRA-адаптерам, дообученным непосредственно на устройствах;
  • исходному коду новых модулей.

Компания подчеркивает:

«Все взносы являются безопасными для высших уровней: мы не меняли публичные API llama.cpp и добавляли только новые модули».

Код опубликовали под лицензией Apache 2.0.

Зачем это криптовалютной индустрии и Tether

Для Tether, крупнейшего эмитента стейблкоинов, развитие собственного ИИ-направления направлено на:

  • создание автономных систем, которые могут работать локально в регионах с высокой задержкой или нестабильной инфраструктурой;
  • защиту приватности, ведь чувствительные данные пользователей не нужно передавать в облако;
  • масштабируемость, которая не зависит от вендора GPU.

В Tether Data подчеркнули важность локального дообучения:

«Способность к точной настройке LLM на персональных данных пользователя является критической для персонализации и более широкого принятия технологии».

Среди ключевых технических решений:

  • перенос полного LoRA-workflow в llama.cpp с API для инициализации, тренировки, чекпойнтинга и слияния адаптеров;
  • использование Vulkan для универсальной GPU-совместимости (NVIDIA, AMD, Intel, Adreno, Mali);
  • поддержка Apple Metal для M-серии и мобильных A-серий;
  • поддержка инструкционного дообучения благодаря маскированным потерям (обучение только на токенах ассистента);
  • добавление обратных проходов для современных архитектур, включая GEGLU;
  • динамический алгоритм разбиения на блоки для обхода жестких ограничений драйверов Adreno и выполнения больших матричных операций.

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Проект показал жизнеспособность LoRA-тренировки на самых разных устройствах — от RTX 4090 до мобильных Mali.

Согласно тестам, качество моделей после дообучения в QVAC-fabric-llm сопоставимо с PyTorch-HuggingFace:

  • процент побед LLM-судей: 45-48% (против 52-55% в PyTorch);
  • биомедицинская точность: 79-94% (против 78-86%);
  • косинусное сходство: 0.82 против 0.77.

В Tether отметили, что технология особенно полезна для сфер со строгими требованиями к приватности — медицины, науки, регулируемых финансовых сервисов.

Дальнейшие планы

Среди следующих шагов команда назвала расширение поддержки количественных форматов (GPTQ-INT8, Q5_K_M), оптимизацию GPU-операторов и улучшение управления памятью.

Представив QVAC-fabric-llm, Tether сделала попытку перенести ИИ-возможности, которые обычно доступны только в дата-центрах, непосредственно на потребительские устройства.

Компания заявила, что эта технология «разрушает давние аппаратные ограничения» и открывает путь к эпохе частных, локальных, устойчивых ИИ-решений.

Напомним, что недавно Tether подписала арендное соглашение на 20 000 GPU для поддержки ИИ-сферы на фоне партнерства видеоплатформы Rumble и немецкой майнинговой компании Northern Data.

Lecturas Relacionadas

El número uno de China, rozando a OpenAI, un misterioso 'Monge Barredor' entra en el top siete mundial

"¡Una revolución en el mundo de la IA! Un misterioso agente chino llamado **MopMonk** (que significa 'monje barrendero') ha irrumpido en el top 10 global del prestigioso y exigente benchmark **CyberGym**, logrando un **73.1% de éxito** y situándose en el séptimo puesto, justo detrás de gigantes como OpenAI. Este logro marca la puntuación más alta jamás alcanzada por un equipo chino en esta clasificación. Lo más sorprendente es su completo anonimato: sin página web oficial ni anuncios públicos. Su identidad es un enigma total, aunque todas las pistas apuntan a un equipo de China, probablemente de Shanghái. Utiliza como modelo base el **MiniMax M3**, un modelo abierto chino conocido por sus capacidades avanzadas en programación, contexto largo (1M tokens) y multimodalidad nativa. **¿Por qué su éxito es tan significativo?** CyberGym, desarrollado por UC Berkeley, es considerado las 'Olimpiadas' de la seguridad en IA. Evalúa la capacidad real de los modelos para **explotar vulnerabilidades de software en entornos reales y aislados**, requiriendo que generen una prueba de concepto (PoC) que funcione en la versión vulnerable pero no en la parcheada. No se trata solo de 'saber', sino de 'poder hacer'. La clave del rendimiento de MopMonk no está solo en su potente modelo base, sino en su innovador **sistema multiagente especializado en seguridad**, o *Harness*. Este sistema coordina la acción del modelo mediante: 1. **Memoria estructurada de vulnerabilidades**: Organiza el conocimiento adquirido (código, rutas, fallos) para guiar la búsqueda de forma eficiente. 2. **Exploración basada en memoria**: El modelo no parte de cero en cada intento, sino que usa la memoria acumulada para refinar sus hipótesis. 3. **Exploración paralela de múltiples agentes**: Varios 'agentes' trabajan en paralelo, compartiendo memoria y evitando esfuerzos repetidos. Este enfoque demuestra que, más allá de simplemente escalar el tamaño de los modelos, el futuro de la IA aplicada a tareas complejas como la ciberseguridad reside en el **diseño de sistemas de agente (Harness) robustos y especializados** que puedan convertir la 'inteligencia' del modelo en 'capacidad de ejecución' real y eficiente. MopMonk ha mostrado el camino para llevar un modelo base de código abierto al máximo de su potencial en un campo de batalla extremadamente difícil. La gran pregunta que queda en el aire es: **¿quién está realmente detrás de este misterioso 'monje barrendero' de la IA?**

marsbitHace 57 min(s)

El número uno de China, rozando a OpenAI, un misterioso 'Monge Barredor' entra en el top siete mundial

marsbitHace 57 min(s)

Trading

Spot
活动图片