Tether представила кроссплатформенную систему для локального дообучения LLM

cryptonews.ruPublicado a 2025-02-02Actualizado a 2025-12-03

Tether Data интегрировала полноценную LoRA-тренировку в llama.cpp с кроссплатформенной поддержкой.
QVAC-fabric-llm работает благодаря Vulkan, Metal и LoRA.
Новая ИИ-система Tether позволяет дообучать Qwen3 и Gemma3 на любом устройстве — от смартфона до сервера.

Исследовательское подразделение искусственного интеллекта (ИИ) компании Tether — Tether Data AI — представило QVAC-fabric-llm. Это новая инфраструктура для Low-Rank Adaptation (LoRA)-дообучения больших языковых моделей (LLM) непосредственно в рамках экосистемы llama.cpp.

Как отмечает компания, это первое решение, позволяющее проводить параметро-эффективное обучение LLM на всем спектре потребительского оборудования — от мобильных графических процессоров (GPU) до десктопных видеокарт.

В Tether говорят, что проект является «значительным шагом в миссии QVAC», ведь система обеспечивает настоящую аппаратно-независимую совместимость и устраняет зависимость от конкретных вендоров.

Разработчики отметили, что технология позволяет выполнять дообучение «на любом современном устройстве — от мобильного до серверного».

Одной из ключевых инноваций является возможность запускать LoRA-дообучение на мобильных графических процессорах, что до этого считалось недоступным. В Tether заявили:

«Мы демонстрируем первые успешные результаты точной настройки на мобильных GPU, ранее недоступные возможности, которые открывают путь к настоящей персонализации на устройстве».

Поддержка охватывает GPU Adreno, Mali и Apple, а также настольные графические решения AMD, Intel, NVIDIA и Apple.

QVAC-fabric-llm также добавляет первую кроссплатформенную поддержку LoRA-обучения для моделей Qwen3 и Gemma3, что существенно расширяет функциональность llama.cpp.

Чтобы ускорить развитие экосистемы, Tether Data AI открывает доступ к:

мультиплатформенным бинарным файлам;
LoRA-адаптерам, дообученным непосредственно на устройствах;
исходному коду новых модулей.

Компания подчеркивает:

«Все взносы являются безопасными для высших уровней: мы не меняли публичные API llama.cpp и добавляли только новые модули».

Код опубликовали под лицензией Apache 2.0.

Зачем это криптовалютной индустрии и Tether

Для Tether, крупнейшего эмитента стейблкоинов, развитие собственного ИИ-направления направлено на:

создание автономных систем, которые могут работать локально в регионах с высокой задержкой или нестабильной инфраструктурой;
защиту приватности, ведь чувствительные данные пользователей не нужно передавать в облако;
масштабируемость, которая не зависит от вендора GPU.

В Tether Data подчеркнули важность локального дообучения:

«Способность к точной настройке LLM на персональных данных пользователя является критической для персонализации и более широкого принятия технологии».

Среди ключевых технических решений:

перенос полного LoRA-workflow в llama.cpp с API для инициализации, тренировки, чекпойнтинга и слияния адаптеров;
использование Vulkan для универсальной GPU-совместимости (NVIDIA, AMD, Intel, Adreno, Mali);
поддержка Apple Metal для M-серии и мобильных A-серий;
поддержка инструкционного дообучения благодаря маскированным потерям (обучение только на токенах ассистента);
добавление обратных проходов для современных архитектур, включая GEGLU;
динамический алгоритм разбиения на блоки для обхода жестких ограничений драйверов Adreno и выполнения больших матричных операций.

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Проект показал жизнеспособность LoRA-тренировки на самых разных устройствах — от RTX 4090 до мобильных Mali.

Согласно тестам, качество моделей после дообучения в QVAC-fabric-llm сопоставимо с PyTorch-HuggingFace:

процент побед LLM-судей: 45-48% (против 52-55% в PyTorch);
биомедицинская точность: 79-94% (против 78-86%);
косинусное сходство: 0.82 против 0.77.

В Tether отметили, что технология особенно полезна для сфер со строгими требованиями к приватности — медицины, науки, регулируемых финансовых сервисов.

Дальнейшие планы

Среди следующих шагов команда назвала расширение поддержки количественных форматов (GPTQ-INT8, Q5_K_M), оптимизацию GPU-операторов и улучшение управления памятью.

Представив QVAC-fabric-llm, Tether сделала попытку перенести ИИ-возможности, которые обычно доступны только в дата-центрах, непосредственно на потребительские устройства.

Компания заявила, что эта технология «разрушает давние аппаратные ограничения» и открывает путь к эпохе частных, локальных, устойчивых ИИ-решений.

Напомним, что недавно Tether подписала арендное соглашение на 20 000 GPU для поддержки ИИ-сферы на фоне партнерства видеоплатформы Rumble и немецкой майнинговой компании Northern Data.

Lecturas Relacionadas

Bitmine aumenta su tenencia a 5,7 millones de ETH, es incluida en el índice Russell 1000 y Tom Lee afirma que está a un paso del 'objetivo del 5%'

Bitmine aumentó sus tenencias de ETH a 5,7 millones de unidades (4,7% del suministro total), acercándose a su meta del 5%. A pesar de la caída del 8% en el precio del ETH la semana pasada, atribuida por su presidente Tom Lee a ajustes de fin de trimestre, la compañía mantiene su estrategia de compra constante para 2026. En un movimiento significativo, Bitmine fue incluida en el índice Russell 1000, lo que, según Lee, atraerá importantes flujos de capital institucional pasivo. De sus 5,7 millones de ETH, aproximadamente 4,88 millones están apostados, generando unos ingresos anualizados estimados de 211 millones de dólares. La empresa sigue siendo el mayor tesoro corporativo de Ethereum a nivel mundial.

marsbitHace 17 min(s)

Bitmine aumenta su tenencia a 5,7 millones de ETH, es incluida en el índice Russell 1000 y Tom Lee afirma que está a un paso del 'objetivo del 5%'

marsbitHace 17 min(s)

Cuenta regresiva para la AGI: declaración crucial del Director de Investigación de OpenAI: la ventana para la humanidad es "muy pequeña"

Resumen: Mark Chen, director de investigación de OpenAI, afirma que el desarrollo hacia la AGI (Inteligencia Artificial General) avanza rápidamente, y la ventana de tiempo para que la humanidad se adapte podría ser "pequeña". Destaca que en todos los campos se están produciendo avances revolucionarios similares al "movimiento divino" de AlphaGo. La curva de escalado de modelos continúa en una trayectoria exponencial, impulsando capacidades como el razonamiento y la investigación autosostenida por IA. Aunque aún existen desafíos, como la crisis en la evaluación de modelos y el "frente irregular" de capacidades, la dirección es clara: los modelos podrán realizar investigación de extremo a extremo. Esto podría llevar a roles humanos centrados en plantear preguntas y discernir la calidad de los resultados. Chen imagina un futuro pos-AGI donde el valor humano radique en la experiencia y la conexión humana, simbolizadas por su deseo de abrir un restaurante de fideos.

marsbitHace 30 min(s)

Cuenta regresiva para la AGI: declaración crucial del Director de Investigación de OpenAI: la ventana para la humanidad es "muy pequeña"

marsbitHace 30 min(s)

El número uno de China, rozando a OpenAI, un misterioso 'Monge Barredor' entra en el top siete mundial

"¡Una revolución en el mundo de la IA! Un misterioso agente chino llamado **MopMonk** (que significa 'monje barrendero') ha irrumpido en el top 10 global del prestigioso y exigente benchmark **CyberGym**, logrando un **73.1% de éxito** y situándose en el séptimo puesto, justo detrás de gigantes como OpenAI. Este logro marca la puntuación más alta jamás alcanzada por un equipo chino en esta clasificación. Lo más sorprendente es su completo anonimato: sin página web oficial ni anuncios públicos. Su identidad es un enigma total, aunque todas las pistas apuntan a un equipo de China, probablemente de Shanghái. Utiliza como modelo base el **MiniMax M3**, un modelo abierto chino conocido por sus capacidades avanzadas en programación, contexto largo (1M tokens) y multimodalidad nativa. **¿Por qué su éxito es tan significativo?** CyberGym, desarrollado por UC Berkeley, es considerado las 'Olimpiadas' de la seguridad en IA. Evalúa la capacidad real de los modelos para **explotar vulnerabilidades de software en entornos reales y aislados**, requiriendo que generen una prueba de concepto (PoC) que funcione en la versión vulnerable pero no en la parcheada. No se trata solo de 'saber', sino de 'poder hacer'. La clave del rendimiento de MopMonk no está solo en su potente modelo base, sino en su innovador **sistema multiagente especializado en seguridad**, o *Harness*. Este sistema coordina la acción del modelo mediante: 1. **Memoria estructurada de vulnerabilidades**: Organiza el conocimiento adquirido (código, rutas, fallos) para guiar la búsqueda de forma eficiente. 2. **Exploración basada en memoria**: El modelo no parte de cero en cada intento, sino que usa la memoria acumulada para refinar sus hipótesis. 3. **Exploración paralela de múltiples agentes**: Varios 'agentes' trabajan en paralelo, compartiendo memoria y evitando esfuerzos repetidos. Este enfoque demuestra que, más allá de simplemente escalar el tamaño de los modelos, el futuro de la IA aplicada a tareas complejas como la ciberseguridad reside en el **diseño de sistemas de agente (Harness) robustos y especializados** que puedan convertir la 'inteligencia' del modelo en 'capacidad de ejecución' real y eficiente. MopMonk ha mostrado el camino para llevar un modelo base de código abierto al máximo de su potencial en un campo de batalla extremadamente difícil. La gran pregunta que queda en el aire es: **¿quién está realmente detrás de este misterioso 'monje barrendero' de la IA?**

marsbitHace 57 min(s)

El número uno de China, rozando a OpenAI, un misterioso 'Monge Barredor' entra en el top siete mundial

marsbitHace 57 min(s)

¿Se repetirá la historia? Fidelity enumera los cinco catalizadores para poner fin al criptoinvierno

¿Se repetirá la historia? Fidelity enumera cinco catalizadores para poner fin al invierno cripto. Fidelity señala en un nuevo informe que el actual invierno cripto del Bitcoin podría estar llegando a su fin. Basándose en patrones históricos, identifica cinco posibles catalizadores: el ciclo de cuatro años, una regulación más clara, políticas de flexibilización de la Fed, nuevos casos de uso disruptivos y una nueva ola de adopción institucional. El precio de Bitcoin ha caído aproximadamente un 53% desde su máximo histórico a finales de 2025. El informe analiza cada factor: el próximo posible fondo del ciclo cuadrienal estaría cerca de noviembre de 2026; la aprobación de leyes como la CLARITY podría proporcionar un marco regulatorio crucial; los recortes de tasas de la Fed históricamente han beneficiado a los activos de riesgo; la tokenización de activos reales, la IA y las stablecoins son tendencias prometedoras; y un movimiento institucional inesperado aún podría impulsar el mercado. Fidelity concluye que, aunque el mercado está en un período frío, los puntos de inflexión históricos a menudo han surgido de la combinación de tales factores. La próxima fase para Bitcoin podría depender de cuál de estos catalizadores se active primero.

Foresight NewsHace 1 hora(s)

¿Se repetirá la historia? Fidelity enumera los cinco catalizadores para poner fin al criptoinvierno

Foresight NewsHace 1 hora(s)

La prima de USDT en India supera el 8.5% a medida que la presión regulatoria restringe la oferta

La prima del USDT en India supera el 8,5% debido a que la presión regulatoria reduce drásticamente la oferta de esta stablecoin en el mercado doméstico. Mientras la demanda para pagos transfronterizos y cobertura de valor se mantiene firme, las acciones de control y supervisión han limitado severamente los flujos de entrada de nuevos fondos. Esto ha provocado una escasez de liquidez en los mercados P2P y OTC, ampliando la brecha entre el precio local del USDT (₹102,88) y el tipo de cambio oficial USD/INR (₹94,65). Los datos muestran un volumen de compra muy bajo ($1,2 millones) frente a las ventas ($17,8 millones), lo que evidencia la dificultad para realizar actividades de market-making. La persistente incertidumbre regulatoria podría mantener elevada la prima y desplazar la actividad hacia canales informales, aunque una mayor claridad normativa y mejor acceso al mercado serían clave para restaurar la liquidez y la eficiencia de precios.

ambcryptoHace 2 hora(s)

La prima de USDT en India supera el 8.5% a medida que la presión regulatoria restringe la oferta