Tether представила кроссплатформенную систему для локального дообучения LLM

cryptonews.ruDipublikasikan tanggal 2025-02-02Terakhir diperbarui pada 2025-12-03

Tether Data интегрировала полноценную LoRA-тренировку в llama.cpp с кроссплатформенной поддержкой.
QVAC-fabric-llm работает благодаря Vulkan, Metal и LoRA.
Новая ИИ-система Tether позволяет дообучать Qwen3 и Gemma3 на любом устройстве — от смартфона до сервера.

Исследовательское подразделение искусственного интеллекта (ИИ) компании Tether — Tether Data AI — представило QVAC-fabric-llm. Это новая инфраструктура для Low-Rank Adaptation (LoRA)-дообучения больших языковых моделей (LLM) непосредственно в рамках экосистемы llama.cpp.

Как отмечает компания, это первое решение, позволяющее проводить параметро-эффективное обучение LLM на всем спектре потребительского оборудования — от мобильных графических процессоров (GPU) до десктопных видеокарт.

В Tether говорят, что проект является «значительным шагом в миссии QVAC», ведь система обеспечивает настоящую аппаратно-независимую совместимость и устраняет зависимость от конкретных вендоров.

Разработчики отметили, что технология позволяет выполнять дообучение «на любом современном устройстве — от мобильного до серверного».

Одной из ключевых инноваций является возможность запускать LoRA-дообучение на мобильных графических процессорах, что до этого считалось недоступным. В Tether заявили:

«Мы демонстрируем первые успешные результаты точной настройки на мобильных GPU, ранее недоступные возможности, которые открывают путь к настоящей персонализации на устройстве».

Поддержка охватывает GPU Adreno, Mali и Apple, а также настольные графические решения AMD, Intel, NVIDIA и Apple.

QVAC-fabric-llm также добавляет первую кроссплатформенную поддержку LoRA-обучения для моделей Qwen3 и Gemma3, что существенно расширяет функциональность llama.cpp.

Чтобы ускорить развитие экосистемы, Tether Data AI открывает доступ к:

мультиплатформенным бинарным файлам;
LoRA-адаптерам, дообученным непосредственно на устройствах;
исходному коду новых модулей.

Компания подчеркивает:

«Все взносы являются безопасными для высших уровней: мы не меняли публичные API llama.cpp и добавляли только новые модули».

Код опубликовали под лицензией Apache 2.0.

Зачем это криптовалютной индустрии и Tether

Для Tether, крупнейшего эмитента стейблкоинов, развитие собственного ИИ-направления направлено на:

создание автономных систем, которые могут работать локально в регионах с высокой задержкой или нестабильной инфраструктурой;
защиту приватности, ведь чувствительные данные пользователей не нужно передавать в облако;
масштабируемость, которая не зависит от вендора GPU.

В Tether Data подчеркнули важность локального дообучения:

«Способность к точной настройке LLM на персональных данных пользователя является критической для персонализации и более широкого принятия технологии».

Среди ключевых технических решений:

перенос полного LoRA-workflow в llama.cpp с API для инициализации, тренировки, чекпойнтинга и слияния адаптеров;
использование Vulkan для универсальной GPU-совместимости (NVIDIA, AMD, Intel, Adreno, Mali);
поддержка Apple Metal для M-серии и мобильных A-серий;
поддержка инструкционного дообучения благодаря маскированным потерям (обучение только на токенах ассистента);
добавление обратных проходов для современных архитектур, включая GEGLU;
динамический алгоритм разбиения на блоки для обхода жестких ограничений драйверов Adreno и выполнения больших матричных операций.

Результаты тестов: мобильное дообучение и качество на уровне PyTorch

Проект показал жизнеспособность LoRA-тренировки на самых разных устройствах — от RTX 4090 до мобильных Mali.

Согласно тестам, качество моделей после дообучения в QVAC-fabric-llm сопоставимо с PyTorch-HuggingFace:

процент побед LLM-судей: 45-48% (против 52-55% в PyTorch);
биомедицинская точность: 79-94% (против 78-86%);
косинусное сходство: 0.82 против 0.77.

В Tether отметили, что технология особенно полезна для сфер со строгими требованиями к приватности — медицины, науки, регулируемых финансовых сервисов.

Дальнейшие планы

Среди следующих шагов команда назвала расширение поддержки количественных форматов (GPTQ-INT8, Q5_K_M), оптимизацию GPU-операторов и улучшение управления памятью.

Представив QVAC-fabric-llm, Tether сделала попытку перенести ИИ-возможности, которые обычно доступны только в дата-центрах, непосредственно на потребительские устройства.

Компания заявила, что эта технология «разрушает давние аппаратные ограничения» и открывает путь к эпохе частных, локальных, устойчивых ИИ-решений.

Напомним, что недавно Tether подписала арендное соглашение на 20 000 GPU для поддержки ИИ-сферы на фоне партнерства видеоплатформы Rumble и немецкой майнинговой компании Northern Data.

Bacaan Terkait

Bitmine Tambah Kepemilikan hingga 5,7 Juta ETH, Masuk Indeks Russell 1000, Tom Lee Sebut Hanya Selangkah Lagi dari 'Target 5%'

Bitmine Immersion Technologies (BMNR) telah meningkatkan kepemilikan ETH-nya menjadi 5,7 juta koin, setara dengan 4,7% dari total pasokan ETH yang beredar. Perusahaan kini telah mencapai 94% dari target yang dicanangkan Chairman Tom Lee untuk menguasai 5% pasokan ETH. Dalam seminggu terakhir, Bitmine membeli 27.084 ETH meskipun harga ETH turun 8%. Lee menyebut penurunan ini akibat aktivitas penyesuaian portofolio di akhir kuartal. Total aset perusahaan, termasuk kripto, kas, dan sekuritas, mencapai $9,8 miliar. Bitmine juga baru saja dimasukkan ke dalam indeks saham besar Russell 1000. Lee memperkirakan masuknya ini akan menarik ratusan juta dana investasi pasif dari lembaga keuangan. Dari total ETH yang dimiliki, sekitar 4,88 juta koin di-staking, dengan perkiraan pendapatan tahunan sebesar $211 juta. Lee menargetkan perusahaan akan menyelesaikan seluruh staking ETH-nya melalui jaringan MAVAN pada tahun 2026. Bitmine tetap menjadi perusahaan dengan perbendaharaan Ethereum perusahaan terbesar di dunia. Namun, harga saham BMNR turun sekitar 13% dalam seminggu dan telah turun lebih dari 90% dari titik tertingginya setahun lalu.

marsbit17m yang lalu

Bitmine Tambah Kepemilikan hingga 5,7 Juta ETH, Masuk Indeks Russell 1000, Tom Lee Sebut Hanya Selangkah Lagi dari 'Target 5%'

marsbit17m yang lalu

AGI Menuju Hitungan Mundur, Penelitian Utama OpenAI Berikan Pernyataan Penting: Jendela untuk Manusia 'Sangat Sempit'

Kedatangan AGI (Kecerdasan Umum Buatan) semakin dekat. Mark Chen, Kepala Ilmuwan Penelitian OpenAI, menyatakan dengan tegas bahwa umat manusia hanya memiliki "jendela yang sangat kecil" sebelum AGI tiba. Dia menekankan bahwa model AI saat ini semakin mendekati kemampuan untuk melakukan penelitian yang mandiri dan berkelanjutan, yang berarti "evolusi" itu sendiri mulai diserahkan kepada kecerdasan berbasis silikon. Chen menggambarkan momen saat ini sebagai saat di mana setiap bidang mengalami "langkah jenius" (God's Move) seperti pada AlphaGo, di mana AI dapat menghasilkan solusi yang tak terpikirkan oleh manusia. Dia menolak pandangan pesimis bahwa skala peningkatan model (scaling) telah mencapai batasnya, dengan percaya bahwa kurva eksponensial kemajuan akan terus berlanjut. Buktinya adalah keberhasilan model seperti o1 dalam penalaran (reasoning). Dia memperkenalkan konsep "Vibe Researcher" — di mana peran manusia di masa depan adalah memberikan arahan dan "rasa" (taste), sementara AI yang mengeksekusi pekerjaan. OpenAI menargetkan model yang dapat melakukan penelitian "end-to-end" secara mandiri dalam tiga tahun ke depan. Namun, jalan menuju AGI masih memiliki tantangan. Pertama, krisis evaluasi (benchmarking) di mana model sering kali hanya mahir pada tes tertentu tanpa kemampuan generalisasi yang baik. Kedua, "batas yang tidak rata" (jagged frontier), di mana AI unggul dalam tugas kompleks seperti matematika, tetapi masih kesulitan dengan tugas sehari-hari yang membutuhkan pembelajaran berkelanjutan dan konteks. Ketika ditanya tentang rencana setelah AGI terwujud, Chen secara mengejutkan menjawab bahwa dia ingin membuka kedai mie. Jawaban ini menyiratkan bahwa ketika AI dapat menangani semua inovasi dan penelitian, nilai tertinggi manusia mungkin terletak pada pengalaman hidup, cerita, dan kehangatan manusiawi yang tidak dapat direplikasi oleh mesin.

marsbit31m yang lalu

AGI Menuju Hitungan Mundur, Penelitian Utama OpenAI Berikan Pernyataan Penting: Jendela untuk Manusia 'Sangat Sempit'

marsbit31m yang lalu

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

**Ringkasan: "MopMonk" - "Biksu Penyapu" Misterius dari China Masuk 7 Besar Dunia di CyberGym** Sebuah entitas AI misterius asal China bernama **MopMonk** (dalam bahasa Indonesia: "Biksu Penyapu") tiba-tiba muncul dan menempati peringkat **ketujuh dunia** di papan peringkat benchmark keamanan siber **CyberGym**, yang dibuat oleh UC Berkeley. Dengan tingkat keberhasilan **73.1%**, skor MopMonk hanya sedikit di belakang raksasa AI seperti OpenAI dan mencetak rekor tertinggi baru untuk tim China di papan peringkat tersebut. Yang membuat heboh adalah tidak adanya informasi tentang tim di baliknya: tidak ada situs web, konferensi pers, atau pengungkapan identitas. CyberGym dianggap sebagai "Olimpiade" untuk kemampuan keamanan AI, mengevaluasi model dengan 1507 contoh kerentanan nyata dari proyek sumber terbuka besar. Benchmark ini menguji bukan hanya pemahaman, tetapi kemampuan **Agent AI untuk benar-benar mengeksekusi**—yaitu menghasilkan bukti konsep (PoC) yang dapat memicu kerentanan dalam lingkungan tertutup. MopMonk diketahui menggunakan model dasar **MiniMax M3**, model open-source dari Shanghai yang terkenal dengan kemampuan pemrograman, konteks panjang (1M token), dan multimodalitas. Kunci kesuksesannya diduga terletak pada **kerangka kerja Agent (Harness)** yang dirancang khusus untuk penemuan kerentanan. Kerangka kerja ini memiliki tiga inti: 1. **Memori Terstruktur untuk Kerentanan:** Menyimpan fakta tugas seperti target, jalur kode, dan kendala untuk percobaan berikutnya. 2. **Eksplorasi Berbasis Memori:** Setiap percobaan baru belajar dari memori sebelumnya, menghindari pengulangan dan meningkatkan efisiensi. 3. **Eksplorasi Paralel Multi-Agent:** Beberapa upaya eksplorasi berbagi memori yang sama, memperluas cakupan investigasi. Prestasi MopMonk menunjukkan pergeseran penting: dalam tugas keamanan dunia nyata, **kualitas rekayasa Agent (Harness)** yang mengoordinasikan eksekusi sering kali lebih krusial daripada sekadar "menumpuk parameter" pada model dasar. Meskipun identitasnya masih menjadi misteri, kombinasi nama bernuansa武侠 (cerita silat China), model dasar MiniMax, dan keahlian keamanan yang mendalam mengarah pada spekulasi kuat bahwa ini adalah tim keamanan AI dari China, kemungkinan berbasis di Shanghai.

marsbit59m yang lalu

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

marsbit59m yang lalu

Apakah Sejarah akan Terulang? Fidelity Merinci Lima Katalis yang Bisa Mengakhiri Musim Dingin Kripto

Fidelity dalam laporan baru menyoroti bahwa musim dingin kripto saat ini mungkin akan segera berakhir jika sejarah berulang, dengan lima katalis potensial: siklus empat tahun Bitcoin, regulasi yang lebih jelas (seperti RUU CLARITY), kebijakan moneter Fed yang lebih longgar, adopsi skenario aplikasi terobosan (seperti tokenisasi aset dunia nyata, infrastruktur AI-kripto, dan stablecoin), serta gelombang adopsi institusional baru. Laporan ini mencatat bahwa harga Bitcoin telah turun sekitar 53% dari puncak sejarahnya pada Oktober 2025, dan menganalisis pola historis di mana faktor-faktor ini sering mendahului pemulihan pasar. Meski siklus empat tahun dan pengurangan separuh Bitcoin memberikan kerangka waktu referensi, Fidelity menekankan bahwa katalis terbesar seringkali datang secara tak terduga, dan kombinasi faktor-faktor ini dapat menentukan tahap berikutnya bagi industri kripto.

Foresight News1j yang lalu

Apakah Sejarah akan Terulang? Fidelity Merinci Lima Katalis yang Bisa Mengakhiri Musim Dingin Kripto

Foresight News1j yang lalu

Premi USDT India Melonjak di Atas 8,5% seiring Tekanan Regulasi Memperketat Pasokan

Premium USDT di India telah melampaui 8,5% karena tekanan regulasi yang ketat membatasi pasokan stablecoin di dalam negeri. Nilai USDT diperdagangkan sekitar ₹102,88, jauh di atas kurs resmi USD/INR sebesar ₹94,65. Penyempitan pasokan ini, akibat tindakan penegakan hukum dan pengawasan yang meningkat, menyebabkan premi meluas melebihi kisaran normal 3-4%. Meskipun permintaan untuk USDT tetap kuat—untuk pembayaran lintas batas, perdagangan, dan penyimpanan nilai—pasokan yang masuk ke pasar India sangat terbatas. Data menunjukkan volume beli yang rendah dibandingkan volume jual, mengindikasikan berkurangnya likuiditas dan kapasitas market maker. Ketidakpastian regulasi berisiko mendorong perdagangan ke saluran informal atau likuiditas dolar lepas pantai. Kejelasan regulasi dan peningkatan akses pasar diperlukan untuk memulihkan kesempatan arbitrase, menambah likuiditas dolar, dan pada akhirnya menurunkan premium USDT yang tinggi di India.

ambcrypto2j yang lalu

Premi USDT India Melonjak di Atas 8,5% seiring Tekanan Regulasi Memperketat Pasokan