Tether представила кроссплатформенную систему для локального дообучения LLM

cryptonews.ruDipublikasikan tanggal 2025-02-02Terakhir diperbarui pada 2025-12-03

  • Tether Data интегрировала полноценную LoRA-тренировку в llama.cpp с кроссплатформенной поддержкой.
  • QVAC-fabric-llm работает благодаря Vulkan, Metal и LoRA.
  • Новая ИИ-система Tether позволяет дообучать Qwen3 и Gemma3 на любом устройстве — от смартфона до сервера.

Исследовательское подразделение искусственного интеллекта (ИИ) компании Tether — Tether Data AI — представило QVAC-fabric-llm. Это новая инфраструктура для Low-Rank Adaptation (LoRA)-дообучения больших языковых моделей (LLM) непосредственно в рамках экосистемы llama.cpp.

Как отмечает компания, это первое решение, позволяющее проводить параметро-эффективное обучение LLM на всем спектре потребительского оборудования — от мобильных графических процессоров (GPU) до десктопных видеокарт.

В Tether говорят, что проект является «значительным шагом в миссии QVAC», ведь система обеспечивает настоящую аппаратно-независимую совместимость и устраняет зависимость от конкретных вендоров.

Разработчики отметили, что технология позволяет выполнять дообучение «на любом современном устройстве — от мобильного до серверного».

Одной из ключевых инноваций является возможность запускать LoRA-дообучение на мобильных графических процессорах, что до этого считалось недоступным. В Tether заявили:

«Мы демонстрируем первые успешные результаты точной настройки на мобильных GPU, ранее недоступные возможности, которые открывают путь к настоящей персонализации на устройстве».

Поддержка охватывает GPU Adreno, Mali и Apple, а также настольные графические решения AMD, Intel, NVIDIA и Apple.

QVAC-fabric-llm также добавляет первую кроссплатформенную поддержку LoRA-обучения для моделей Qwen3 и Gemma3, что существенно расширяет функциональность llama.cpp.

Чтобы ускорить развитие экосистемы, Tether Data AI открывает доступ к:

  • мультиплатформенным бинарным файлам;
  • LoRA-адаптерам, дообученным непосредственно на устройствах;
  • исходному коду новых модулей.

Компания подчеркивает:

«Все взносы являются безопасными для высших уровней: мы не меняли публичные API llama.cpp и добавляли только новые модули».

Код опубликовали под лицензией Apache 2.0.

Зачем это криптовалютной индустрии и Tether

Для Tether, крупнейшего эмитента стейблкоинов, развитие собственного ИИ-направления направлено на:

  • создание автономных систем, которые могут работать локально в регионах с высокой задержкой или нестабильной инфраструктурой;
  • защиту приватности, ведь чувствительные данные пользователей не нужно передавать в облако;
  • масштабируемость, которая не зависит от вендора GPU.

В Tether Data подчеркнули важность локального дообучения:

«Способность к точной настройке LLM на персональных данных пользователя является критической для персонализации и более широкого принятия технологии».

Среди ключевых технических решений:

  • перенос полного LoRA-workflow в llama.cpp с API для инициализации, тренировки, чекпойнтинга и слияния адаптеров;
  • использование Vulkan для универсальной GPU-совместимости (NVIDIA, AMD, Intel, Adreno, Mali);
  • поддержка Apple Metal для M-серии и мобильных A-серий;
  • поддержка инструкционного дообучения благодаря маскированным потерям (обучение только на токенах ассистента);
  • добавление обратных проходов для современных архитектур, включая GEGLU;
  • динамический алгоритм разбиения на блоки для обхода жестких ограничений драйверов Adreno и выполнения больших матричных операций.

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Проект показал жизнеспособность LoRA-тренировки на самых разных устройствах — от RTX 4090 до мобильных Mali.

Согласно тестам, качество моделей после дообучения в QVAC-fabric-llm сопоставимо с PyTorch-HuggingFace:

  • процент побед LLM-судей: 45-48% (против 52-55% в PyTorch);
  • биомедицинская точность: 79-94% (против 78-86%);
  • косинусное сходство: 0.82 против 0.77.

В Tether отметили, что технология особенно полезна для сфер со строгими требованиями к приватности — медицины, науки, регулируемых финансовых сервисов.

Дальнейшие планы

Среди следующих шагов команда назвала расширение поддержки количественных форматов (GPTQ-INT8, Q5_K_M), оптимизацию GPU-операторов и улучшение управления памятью.

Представив QVAC-fabric-llm, Tether сделала попытку перенести ИИ-возможности, которые обычно доступны только в дата-центрах, непосредственно на потребительские устройства.

Компания заявила, что эта технология «разрушает давние аппаратные ограничения» и открывает путь к эпохе частных, локальных, устойчивых ИИ-решений.

Напомним, что недавно Tether подписала арендное соглашение на 20 000 GPU для поддержки ИИ-сферы на фоне партнерства видеоплатформы Rumble и немецкой майнинговой компании Northern Data.

Bacaan Terkait

AGI Menuju Hitungan Mundur, Penelitian Utama OpenAI Berikan Pernyataan Penting: Jendela untuk Manusia 'Sangat Sempit'

Kedatangan AGI (Kecerdasan Umum Buatan) semakin dekat. Mark Chen, Kepala Ilmuwan Penelitian OpenAI, menyatakan dengan tegas bahwa umat manusia hanya memiliki "jendela yang sangat kecil" sebelum AGI tiba. Dia menekankan bahwa model AI saat ini semakin mendekati kemampuan untuk melakukan penelitian yang mandiri dan berkelanjutan, yang berarti "evolusi" itu sendiri mulai diserahkan kepada kecerdasan berbasis silikon. Chen menggambarkan momen saat ini sebagai saat di mana setiap bidang mengalami "langkah jenius" (God's Move) seperti pada AlphaGo, di mana AI dapat menghasilkan solusi yang tak terpikirkan oleh manusia. Dia menolak pandangan pesimis bahwa skala peningkatan model (scaling) telah mencapai batasnya, dengan percaya bahwa kurva eksponensial kemajuan akan terus berlanjut. Buktinya adalah keberhasilan model seperti o1 dalam penalaran (reasoning). Dia memperkenalkan konsep "Vibe Researcher" — di mana peran manusia di masa depan adalah memberikan arahan dan "rasa" (taste), sementara AI yang mengeksekusi pekerjaan. OpenAI menargetkan model yang dapat melakukan penelitian "end-to-end" secara mandiri dalam tiga tahun ke depan. Namun, jalan menuju AGI masih memiliki tantangan. Pertama, krisis evaluasi (benchmarking) di mana model sering kali hanya mahir pada tes tertentu tanpa kemampuan generalisasi yang baik. Kedua, "batas yang tidak rata" (jagged frontier), di mana AI unggul dalam tugas kompleks seperti matematika, tetapi masih kesulitan dengan tugas sehari-hari yang membutuhkan pembelajaran berkelanjutan dan konteks. Ketika ditanya tentang rencana setelah AGI terwujud, Chen secara mengejutkan menjawab bahwa dia ingin membuka kedai mie. Jawaban ini menyiratkan bahwa ketika AI dapat menangani semua inovasi dan penelitian, nilai tertinggi manusia mungkin terletak pada pengalaman hidup, cerita, dan kehangatan manusiawi yang tidak dapat direplikasi oleh mesin.

marsbit31m yang lalu

AGI Menuju Hitungan Mundur, Penelitian Utama OpenAI Berikan Pernyataan Penting: Jendela untuk Manusia 'Sangat Sempit'

marsbit31m yang lalu

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

**Ringkasan: "MopMonk" - "Biksu Penyapu" Misterius dari China Masuk 7 Besar Dunia di CyberGym** Sebuah entitas AI misterius asal China bernama **MopMonk** (dalam bahasa Indonesia: "Biksu Penyapu") tiba-tiba muncul dan menempati peringkat **ketujuh dunia** di papan peringkat benchmark keamanan siber **CyberGym**, yang dibuat oleh UC Berkeley. Dengan tingkat keberhasilan **73.1%**, skor MopMonk hanya sedikit di belakang raksasa AI seperti OpenAI dan mencetak rekor tertinggi baru untuk tim China di papan peringkat tersebut. Yang membuat heboh adalah tidak adanya informasi tentang tim di baliknya: tidak ada situs web, konferensi pers, atau pengungkapan identitas. CyberGym dianggap sebagai "Olimpiade" untuk kemampuan keamanan AI, mengevaluasi model dengan 1507 contoh kerentanan nyata dari proyek sumber terbuka besar. Benchmark ini menguji bukan hanya pemahaman, tetapi kemampuan **Agent AI untuk benar-benar mengeksekusi**—yaitu menghasilkan bukti konsep (PoC) yang dapat memicu kerentanan dalam lingkungan tertutup. MopMonk diketahui menggunakan model dasar **MiniMax M3**, model open-source dari Shanghai yang terkenal dengan kemampuan pemrograman, konteks panjang (1M token), dan multimodalitas. Kunci kesuksesannya diduga terletak pada **kerangka kerja Agent (Harness)** yang dirancang khusus untuk penemuan kerentanan. Kerangka kerja ini memiliki tiga inti: 1. **Memori Terstruktur untuk Kerentanan:** Menyimpan fakta tugas seperti target, jalur kode, dan kendala untuk percobaan berikutnya. 2. **Eksplorasi Berbasis Memori:** Setiap percobaan baru belajar dari memori sebelumnya, menghindari pengulangan dan meningkatkan efisiensi. 3. **Eksplorasi Paralel Multi-Agent:** Beberapa upaya eksplorasi berbagi memori yang sama, memperluas cakupan investigasi. Prestasi MopMonk menunjukkan pergeseran penting: dalam tugas keamanan dunia nyata, **kualitas rekayasa Agent (Harness)** yang mengoordinasikan eksekusi sering kali lebih krusial daripada sekadar "menumpuk parameter" pada model dasar. Meskipun identitasnya masih menjadi misteri, kombinasi nama bernuansa武侠 (cerita silat China), model dasar MiniMax, dan keahlian keamanan yang mendalam mengarah pada spekulasi kuat bahwa ini adalah tim keamanan AI dari China, kemungkinan berbasis di Shanghai.

marsbit59m yang lalu

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

marsbit59m yang lalu

Trading

Spot
活动图片