Di Balik Skor AI, Ada "Pembuat Soal" Seorang Tionghoa

marsbitDipublikasikan tanggal 2026-06-19Terakhir diperbarui pada 2026-06-19

Abstrak

Setiap peluncuran model AI terbaru, industri sering merujuk pada sejumlah "rapor" standar seperti MMLU-Pro, MMMU, dan MMMU-Pro. Di balik sistem evaluasi kunci ini, terdapat seorang "penyusun soal" bernama Chen Wenhu, asisten profesor di University of Waterloo. MMLU-Pro dikembangkan oleh Chen dan timnya sebagai respons atas keterbatasan MMLU lama. Ketika model-model mutakhir seperti o3 OpenAI mulai mencapai skor hampir sempurna, MMLU-Pro hadir dengan 12.032 soal yang lebih menantang, memperluas pilihan jawaban dan menekankan penalaran, sehingga berhasil membedakan kemampuan model yang sebelumnya tampak setara. Chen juga terlibat dalam MMMU, tolok ukur multimodal yang mengevaluasi pemahaman model terhadap gambar, grafik, dan teks secara terintegrasi. MMMU-Pro kemudian menyempurnakannya dengan memastikan model tidak bisa mengandalkan teks saja. Latar belakang Chen dalam pemahaman informasi kompleks dan pengembangannya di Google DeepMind untuk proyek Gemini memberinya wawasan mendalam. Ia mendirikan TIGERLab (atau "Geng Harimau"), yang tidak hanya fokus pada evaluasi tetapi juga riset model, seperti UniVideo untuk video dan MoCha untuk karakter virtual. Saat ini, Chen bergabung dengan Meta Super Intelligence Lab, terus berkontribusi pada data dan evaluasi multimodal. Karyanya mengingatkan bahwa di balik kemajuan AI yang terlihat, ada banyak talenta seperti dirinya yang membangun fondasi penting bagi perkembangan industri.

Oleh | Huruf AI

Setiap kali model mutakhir dirilis, komunitas AI akan menatap beberapa laporan skor yang familiar.

MMLU-Pro, MMMU, MMMU-Pro… Nama-nama ini mungkin asing bagi pengguna biasa, tetapi bagi perusahaan model dan peneliti, mereka hampir menjadi "mata pelajaran standar". GPT, Claude, Gemini, Llama, Qwen, DeepSeek terus mengerjakan ujian di benchmark ini.

"Bagus atau tidak, coba tes", performa model seringkali harus dibuktikan dengan skor-skor ini.

Banyak grafik perbandingan performa pada peluncuran model, tidak lepas dari mereka; beberapa peringkat di HuggingFace juga dibangun di atas sistem evaluasi ini. Bahkan bisa dikatakan, saat industri AI membahas kemampuan model, yang digunakan sudah menjadi bahasa bersama yang didefinisikan oleh benchmark ini.

Tapi menariknya, hampir semua orang fokus pada skor, tapi sangat sedikit yang tahu siapa pembuat soalnya. Dan di balik MMLU-Pro, MMMU dan MMMU-Pro, terlihat nama yang sama——Chen Wenhu (Chen Wenhū).

Dia adalah asisten profesor di Departemen Ilmu Komputer Universitas Waterloo, Kanada. Di Google Scholar, makalahnya telah dikutip lebih dari 30.000 kali.

Dia juga adalah pendiri "TIGERLab", nama lengkap lab ini dalam bahasa Inggris adalah Text and Image GEnerative Research Lab, karena ada kata "Hu" (Harimau) dalam namanya, Chen Wenhu memberinya nama Mandarin yang sangat mudah dikenali——Hutou Bang (Geng Harimau).

Setelah Kertas Ujian Lama Tak Efektif

Chen Wenhu pertama kali lebih banyak diperhatikan orang, karena MMLU-Pro.

MMLU dulunya adalah salah satu benchmark evaluasi kemampuan model bahasa besar yang paling umum digunakan. Itu seperti kertas ujian komprehensif, mencakup berbagai disiplin ilmu, digunakan untuk mengukur kinerja model dalam tugas pemahaman pengetahuan dan penalaran.

Di awal, kertas ujian ini sangat berguna. Jarak antar model bisa dibedakan dengan skor, dan industri juga bisa mengamati apakah model bahasa besar benar-benar berkembang melalui ini.

Tapi masalah segera muncul.

Seiring kemampuan model terus meningkat, MMLU secara bertahap menjadi "kurang cukup untuk diuji". Skor model mutakhir semakin tinggi, jarak di antara mereka semakin kecil.

Sampai OpenAI merilis o3, masalah ini menjadi lebih jelas. Akurasi o3 pada MMLU sudah mendekati 100%, model mutakhir lainnya juga satu per satu menyerahkan hasil yang mendekati nilai sempurna.

Kedengarannya seperti kabar baik, tapi untuk evaluasi, justru berarti masalah.

Sebuah kertas ujian jika semua orang bisa mendapat nilai mendekati sempurna, akan sulit untuk terus menilai siapa yang lebih kuat, kuat di mana. Ia masih bisa membuktikan model telah memiliki kemampuan tertentu, tapi tidak lagi cocok untuk mengukur kemajuan baru.

Industri AI membutuhkan kertas ujian yang lebih sulit, dan lebih sulit untuk "dilewatkan begitu saja".

Tahun 2024, Chen Wenhu dan tim merilis MMLU-Pro.

MMLU-Pro mendesain ulang kertas ujian ini, bukan sekadar memperbesar bank soal.

Ia mencakup 12.032 soal, meliputi matematika, fisika, kimia, hukum, teknik, psikologi, kesehatan, dan 14 bidang lainnya. Dibandingkan MMLU versi asli, ia memperluas pilihan dari 4 menjadi 10, mengurangi probabilitas model menebak dan benar; sekaligus menambahkan lebih banyak soal yang condong ke penalaran, membersihkan soal-soal di bank soal asli yang relatif mudah, bermakna ambigu atau kurang daya pembeda.

Efeknya langsung.

Hasil makalah menunjukkan, akurasi model pada MMLU-Pro turun 16% hingga 33% dibandingkan MMLU versi asli. Saat model yang sama diuji dengan 24 gaya prompt berbeda, fluktuasi nilai juga turun dari 4% hingga 5% di MMLU asli, menjadi sekitar 2%.

Artinya, kertas ujian baru ini tidak hanya lebih sulit, tapi juga lebih stabil.

Ia membuat model-model yang terlihat sangat bagus di kertas ujian lama, kembali memiliki jarak perbedaan. Apakah model benar-benar bisa bernalar, atau hanya lebih pandai menghadapi soal lama, juga jadi lebih mudah terlihat.

Benchmark Evaluasi yang Berguna

MMLU-Pro dengan cepat digunakan oleh industri.

MMLU-Pro kemudian masuk ke jalur dataset dan benchmark evaluasi NeurIPS2024, juga diintegrasikan ke dalam kerangka evaluasi model bahasa lm-evaluation-harness milik EleutherAI. Bagi komunitas model open-source, ini berarti ia tidak lagi hanya dataset dalam sebuah makalah, tapi sudah masuk ke dalam rangkaian alat evaluasi yang umum digunakan.

Banyak model mulai melaporkan skor MMLU-Pro saat dirilis. Beberapa peringkat di HuggingFace juga memasukkannya ke dalam sistem evaluasi.

Jika MMLU-Pro menyelesaikan masalah "kertas ujian lama tak efektif" dalam evaluasi model bahasa, maka MMMU mendorong Chen Wenhu dan TIGERLab ke pusat evaluasi multimodal.

Masalah model multimodal lebih kompleks.

Model bahasa mengerjakan soal, terutama memproses teks. Model multimodal harus memproses informasi dalam berbagai bentuk seperti gambar, grafik, diagram skematis, peta, tabel, partitur musik, struktur kimia, secara bersamaan. Ia tidak hanya harus memahami pertanyaan, tapi juga benar-benar melihat isi dalam gambar, dan menggabungkan informasi visual, informasi teks, dan pengetahuan disiplin ilmu untuk bernalar.

Benchmark evaluasi MMMU mencakup 11.500 soal multimodal, berasal dari ujian kuliah, kuis, dan buku teks, meliputi enam bidang besar: seni dan desain, bisnis, sains, kesehatan dan kedokteran, humaniora dan ilmu sosial, teknologi dan teknik, lebih lanjut dibagi menjadi 30 disiplin ilmu dan 183 sub-bidang.

Soal-soal ini tidak sekadar menanyakan model "apa yang ada di gambar", ia menuntut model seperti siswa mengerjakan soal profesional, menggabungkan informasi gambar dan pengetahuan disiplin ilmu.

Saat MMMU dirilis, tim peneliti menguji 14 model multimodal open-source, serta model closed-source representatif seperti GPT-4V, GeminiUltra. Bahkan model closed-source terkuat saat itu, GPT-4V dan GeminiUltra hanya mencapai akurasi 56% dan 59%.

Angka-angka ini menunjukkan, model multimodal terlihat berkembang cepat, tapi pada soal yang benar-benar membutuhkan pemahaman profesional dan penalaran, masih ada banyak ruang.

Kemudian, tim Chen Wenhu merilis MMMU-Pro, lebih lanjut menutup ruang model menghindari informasi visual. Ia menyaring soal yang bisa dijawab hanya dengan model teks, memperluas pilihan jawaban, dan memperkenalkan pengaturan vision-only, menanamkan pertanyaan ke dalam gambar, menuntut model menyelesaikan pembacaan visual dan pemahaman teks secara bersamaan.

Sederhananya, agar model tidak "hanya membaca teks dan menebak jawaban".

Pekerjaan semacam ini terdengar agak rumit, tapi mereka krusial. Karena model multimodal di masa depan akan masuk ke skenario seperti medis, pendidikan, penelitian, desain, teknik, hanya bisa mendeskripsikan gambar tidaklah cukup. Ia harus bisa menilai, bernalar, menjelaskan, dan juga harus bisa menemukan bagian yang benar-benar berguna dalam informasi visual yang kompleks.

Orang di Balik "Kertas Ujian"

Chen Wenhu kemudian membuat MMLU-Pro dan MMMU, berasal dari arah penelitian yang sudah lama dia tekuni.

Minat penelitiannya memang terkait dengan pemahaman informasi kompleks, tanya jawab pengetahuan, dan penalaran.

Dia lulus S1 dari Universitas Sains dan Teknologi Huazhong, kemudian melanjutkan S2 di Universitas Teknologi RWTH Aachen, Jerman, lalu mendapat gelar doktor di bidang Ilmu Komputer dari Universitas California, Santa Barbara. Selama doktor, dia sudah mulai melakukan penelitian seputar tanya jawab kompleks, penalaran tabel, pelokalan bukti pengetahuan, dan arah lainnya.

Tugas semacam ini memiliki kesamaan: jawaban seringkali tidak ada dalam teks tunggal.

Mungkin tersembunyi dalam sebuah tabel, mungkin perlu menggabungkan sepotong teks dan sebuah gambar, atau mungkin model perlu mengambil informasi terlebih dahulu, lalu mengintegrasikan, menghitung, dan bernalar. Model tidak boleh hanya bisa mengulang pengetahuan yang ada.

Proyek-proyek yang pernah diikuti Chen Wenhu seperti HybridQA, TabFact, Program of Thoughts, MAmmoTH, semuanya terkait dengan garis ini.

Ini juga menjelaskan mengapa dia sensitif terhadap celah dalam evaluasi model.

Benchmark evaluasi yang baik bukan sekadar membuat soal semakin sulit, tapi harus memprediksi di mana model paling mudah "menebak soal dengan benar", "terlihat pintar".

Model mungkin menghafal bank soal, bisa menebak jawaban berdasarkan pilihan, atau mungkin menggunakan teks untuk menghindari informasi visual… Evaluasi yang baik harus menambal celah-celah ini.

Setelah lulus doktor, Chen Wenhu masuk ke Google Research, kemudian dari 2021 hingga 2025 berpartisipasi dalam pekerjaan model multimodal Gemini dan evaluasi di Google DeepMind. Pengalaman ini juga penting. Kontak jangka panjang dengan pengembangan model mutakhir membuatnya lebih paham bagaimana kemampuan model tumbuh, juga lebih mudah melihat bias dan titik buta yang mungkin ada dalam evaluasi.

Musim gugur 2022, Chen Wenhu bergabung dengan Fakultas Ilmu Komputer Universitas Waterloo, sebagai asisten profesor. Tahun itu juga, dia terpilih sebagai Canada CIFAR AI Chair. Setelah itu, dia mendirikan "TIGERLab (alias Hutou Bang)", melanjutkan penelitian seputar model dasar, kemampuan multimodal, dan benchmark evaluasi.

Hutou Bang tidak hanya melakukan benchmark evaluasi, tapi juga penelitian model dan sistem.

Dalam arah video, UniVideo mencoba memasukkan pemahaman video, generasi, dan penyuntingan ke dalam kerangka yang sama, agar model tidak hanya menghasilkan segmen gambar, tapi juga memahami konten, merespons instruksi, dan menyelesaikan modifikasi. Vamba menargetkan pemahaman video panjang, menyelesaikan masalah memori, komputasi, dan efisiensi pelatihan yang dibawa video tingkat satu jam. MoCha, hasil kolaborasi dengan tim Generative AI Meta, fokus pada generasi karakter virtual yang berbicara, menghasilkan video karakter berkualitas tinggi melalui suara dan deskripsi teks.

Pembuat soal yang tidak pernah mengerjakan soal, tidak mungkin bisa membuat soal yang bagus. Turun tangan sendiri membuat model, sebaliknya membuat mereka lebih cocok melakukan evaluasi.

Karena evaluasi yang benar-benar baik, seringkali berasal dari pemahaman terhadap batas kemampuan model. Hanya dengan tahu bagaimana model dibuat, tahu masalah apa yang akan dihadapi dalam tugas nyata, baru lebih mudah merancang soal yang bisa mengukur perbedaan, dan juga mengekspos masalah.

Sekarang, Chen Wenhu masuk ke Meta Superintelligence Lab, pekerjaan terus terkonsentrasi pada data pelatihan awal multimodal dan evaluasi, serta melayani model dasar Meta.

Industri AI tidak kekurangan orang yang terlihat. Dalam industri AI, sorotan biasanya jatuh pada pengusaha, peneliti bintang, dan kepala perusahaan model besar. Peluncuran produk baru, kabar pendanaan, model open-source dan penyesuaian tim, seringkali paling mudah menarik perhatian luar, juga membuat nama-nama ini lebih mudah masuk ke pandangan publik.

Tapi di bidang AI saat ini, partisipasi talenta Tionghoa sudah jauh melampaui posisi paling mencolok ini.

Kripto yang Sedang Tren

Pertanyaan Terkait

QSiapa yang berada di balik pengembangan benchmark AI seperti MMLU-Pro dan MMMU?

ASeorang peneliti keturunan Tionghoa bernama Wenhu Chen, asisten profesor di Departemen Ilmu Komputer Universitas Waterloo Kanada, dan pendiri TIGERLab (atau 'Hutou Bang').

QMengapa MMLU-Pro dikembangkan, dan apa perbedaannya dengan MMLU asli?

AMMLU-Pro dikembangkan karena model AI terdepan seperti o3 OpenAI mencapai akurasi mendekati 100% pada MMLU, sehingga sulit membedakan kemampuan mereka. Perbedaanya: MMLU-Pro memiliki 12.032 soal, pilihan ganda diperluas dari 4 menjadi 10 opsi, lebih fokus pada penalaran, serta menghilangkan soal yang ambigu atau terlalu mudah.

QApa tujuan utama dari benchmark MMMU dalam mengevaluasi model AI?

AMMMU dirancang untuk menguji kemampuan model multimodal (teks dan gambar) dalam memahami dan bernalar berdasarkan informasi visual yang kompleks (seperti diagram, peta, tabel) yang dikombinasikan dengan pengetahuan akademis di berbagai bidang seperti seni, sains, dan teknik.

QApa peran laboratorium TIGERLab (Hutou Bang) selain mengembangkan benchmark evaluasi AI?

ASelain benchmark, TIGERLab juga meneliti dan mengembangkan model serta sistem AI, seperti UniVideo untuk pemahaman dan generasi video, Vamba untuk pemahaman video panjang, dan MoCha untuk menghasilkan karakter virtual yang berbicara.

QBagaimana latar belakang dan pengalaman Wenhu Chen memengaruhi karyanya dalam evaluasi model AI?

ALatar belakangnya dalam penelitian pemahaman informasi kompleks, tanya jawab berbasis pengetahuan, dan penalaran (sejak PhD) serta pengalaman bekerja di Google Research/DeepMind untuk pengembangan model Gemini membuatnya memahami batasan model dan mampu merancang benchmark yang efektif mendeteksi kelemahan model.

Bacaan Terkait

CPU Kembali ke Meja Permainan, Drama "Peningkatan Posisi" Senilai 170 Miliar Dolar Dimulai

CPU Kembali ke Meja, Drama “Naik Takhta” Senilai 1700 Miliar Dolar Dimulai Pada 1 Juni, Nvidia meluncurkan Vera CPU, menandai pertama kalinya perusahaan tersebut merilis lini produk CPU independen. CEO Nvidia Jensen Huang menyatakan, di era AI Agent, CPU telah menjadi hambatan kinerja kunci di pusat data. Pasar CPU server diproyeksikan tumbuh pesat, dari sekitar 300 miliar dolar AS pada 2025 menjadi sekitar 1700 miliar dolar AS pada 2030, didorong oleh permintaan AI. Dalam beban kerja AI Agent, CPU menangani 70% atau lebih dari total pekerjaan, karena tugas-tugas seperti pemanggilan alat eksternal dan manajemen konteks sangat intensif. Rasio GPU terhadap CPU dalam penyebaran AI juga menyusut, dari 8:1 menjadi sekitar 4:1, bahkan mendekati 1:1 dalam skenario Agent tertentu. Perubahan ini telah menyebabkan peningkatan harga CPU server sebesar 10-15%, kenaikan pertama dalam lebih dari satu dekade. Nvidia, AMD, dan Intel semua berinvestasi besar-besaran di CPU. Nvidia memproyeksikan pendapatan terkait CPU mendekati 200 miliar dolar AS pada 2026. Pertumbuhan pasar ini juga membuka peluang bagi rantai pasokan CPU China, seperti Haiguang Information dan Huawei, yang diuntungkan oleh permintaan industri dan kebijakan substitusi impor. Intinya, sementara GPU tetap penting, kemampuan sinergi antara CPU dan GPU akan menjadi pembeda utama dalam penerapan AI skala besar berikutnya.

marsbit2j yang lalu

CPU Kembali ke Meja Permainan, Drama "Peningkatan Posisi" Senilai 170 Miliar Dolar Dimulai

marsbit2j yang lalu

Kantor Intelijen TechFlow: Direktur AI AMD Secara Terbuka Mengkritik Claude Code "Menjadi Lebih Bodoh dan Lebih Malas", Trump Klaim Gencatan Senjata Lengkap di Selat Hormuz Tetapi Masih Ada 80 Ranjau Laut yang Harus Dibersihkan

**Wired** melaporkan SK Telecom, mitra strategis Anthropic, sedang ditinjau kontrol ekspor AS terkait potensi transfer teknologi model Mythos. Seorang pengguna Reddit mengeluh Gemini memberikan saran menyesatkan dalam skenario penipuan, memicu diskusi tentang batasan keamanan AI. **Z.AI** merilis model GLM-5.2 China yang diklaim setara Claude Opus tanpa menggunakan chip Nvidia. **0G Labs** mencapai tonggak 100 miliar token untuk inferensi AI terdesentralisasi. Kemampuan visual **DeepSeek** memicu perbandingan dengan GPT-4V di platform Zhihu. Di sektor **Web3**, Bithumb menambahkan pasangan perdagangan RE, sementara Upbit menghapus pasangan KERNEL. Peneliti **MIT** membangun sistem operasi sendiri untuk memahami chip. AS klaim peralatan litografi ASML canggih mungkin telah masuk ke China, namun ASML membantah. **Amazon** dilaporkan bernegosiasi menjual chip AI Trainium/Inferentia mereka. **Apple** dikabarkan akan menggunakan proses N2P eksklusif untuk chip A21 Pro. **GitHub** ditemukan memiliki 10.000 repositori yang mendistribusikan perangkat lunak berbahaya. Apple perbarui firmware untuk tutup celah keamanan di Beats Studio Buds. Karyawan **Amazon** diselidiki internal karena mengkritik ekspansi pusat data AI. **Microsoft** dan **Amazon Web Services** menghadapi pengawasan antitrust ketat dari UE. Saham semikonduktor meroket di pasar saham AS, dengan **Intel** melonjak 10.6%, sementara **SpaceX** turun 3.5%. Meskipun ada pengumuman gencatan senjata di Selat Hormuz, asosiasi tanker memperingatkan masih ada sekitar 80 ranjau laut di jalur utama, menghalangi 80 juta barel minyak yang siap dikirim. Iran menunda perjalanan diplomatik ke Swiss, meragukan prospek perdamaian. **Trump** menyebut kesepakatan dengan Iran sebagai "penyerahan tanpa syarat" dan menegaskan kekuasaan presiden yang tidak terbatas. **Valve** mengalami penumpukan pesanan parah untuk Steam Controller, dengan sebagian pengiriman tertunda hingga 2027. **Inti:** Ketegangan geopolitik di Timur Tengah tetap rapuh dengan ranjau dan ketidakpastian diplomasi, sementara perang teknologi dan rekonfigurasi rantai pasokan semikonduktor terus berlanjut dengan langkah-langkah seperti model AI buatan China dan penjualan chip mandiri Amazon.

marsbit2j yang lalu

Kantor Intelijen TechFlow: Direktur AI AMD Secara Terbuka Mengkritik Claude Code "Menjadi Lebih Bodoh dan Lebih Malas", Trump Klaim Gencatan Senjata Lengkap di Selat Hormuz Tetapi Masih Ada 80 Ranjau Laut yang Harus Dibersihkan

marsbit2j yang lalu

Korea Selatan Bergerak Mengatur Transfer Crypto Lintas Batas di Bawah Kerangka Kerja Baru

Pemerintah Korea Selatan berencana memasukkan perusahaan fintech ke dalam kerangka kerja perizinan baru untuk transfer aset virtual lintas batas, yang dijadwalkan berlaku pada Desember. Peraturan ini mewajibkan perusahaan yang melakukan transfer lintas batas menggunakan aset kripto untuk mendaftar di Kementerian Ekonomi dan Keuangan serta melaporkan transaksinya melalui sistem pelaporan devisa. Kerangka regulasi ini dibuat untuk membawa transfer lintas batas berbasis kripto ke dalam pengawasan formal, menyusul temuan bahwa banyak transfer aset digital beroperasi di luar sistem pengawasan devisa dan berpotensi digunakan untuk pencucian uang serta kejahatan. Aturan VASP (Virtual Asset Service Provider) yang ada saat ini terutama membatasi akses ke bursa kripto seperti Upbit dan Bithumb. Namun, regulator berencana memperluas cakupan entitas yang memenuhi syarat untuk mencakup pelaku non-tradisional, seperti perusahaan fintech, jika mereka dapat melakukan transfer tersebut secara efisien. Otoritas masih menganalisis proses perizinan dan kepatuhan bagi calon pelamar. Kementerian dan Bank of Korea terus berkolaborasi dengan pemangku kepentingan industri untuk menyelesaikan aturan implementasi sebelum peluncuran di Desember. Perkembangan ini sejalan dengan upaya Korea Selatan memperkuat pengawasan aset digital, termasuk aturan baru untuk sekuritisasi token yang dijadwalkan terbit pada Juli.

TheNewsCrypto4j yang lalu

Korea Selatan Bergerak Mengatur Transfer Crypto Lintas Batas di Bawah Kerangka Kerja Baru

TheNewsCrypto4j yang lalu

Trading

Spot
Futures

Artikel Populer

Apa Itu GROK AI

Grok AI: Merevolusi Teknologi Percakapan di Era Web3 Pendahuluan Dalam lanskap kecerdasan buatan yang terus berkembang dengan cepat, Grok AI menonjol sebagai proyek yang patut diperhatikan yang menjembatani domain teknologi canggih dan interaksi pengguna. Dikembangkan oleh xAI, sebuah perusahaan yang dipimpin oleh pengusaha terkenal Elon Musk, Grok AI berupaya untuk mendefinisikan ulang cara kita berinteraksi dengan kecerdasan buatan. Seiring dengan berkembangnya gerakan Web3, Grok AI bertujuan untuk memanfaatkan kekuatan AI percakapan untuk menjawab pertanyaan kompleks, memberikan pengguna pengalaman yang tidak hanya informatif tetapi juga menghibur. Apa itu Grok AI? Grok AI adalah chatbot AI percakapan yang canggih yang dirancang untuk berinteraksi dengan pengguna secara dinamis. Berbeda dengan banyak sistem AI tradisional, Grok AI menerima berbagai pertanyaan yang lebih luas, termasuk yang biasanya dianggap tidak pantas atau di luar respons standar. Tujuan inti proyek ini meliputi: Penalaran yang Andal: Grok AI menekankan penalaran akal sehat untuk memberikan jawaban logis berdasarkan pemahaman kontekstual. Pengawasan yang Dapat Diskalakan: Integrasi bantuan alat memastikan bahwa interaksi pengguna dipantau dan dioptimalkan untuk kualitas. Verifikasi Formal: Keamanan adalah hal yang utama; Grok AI menggabungkan metode verifikasi formal untuk meningkatkan keandalan output-nya. Pemahaman Konteks Panjang: Model AI unggul dalam mempertahankan dan mengingat riwayat percakapan yang luas, memfasilitasi diskusi yang bermakna dan sadar konteks. Ketahanan Adversarial: Dengan fokus pada peningkatan pertahanannya terhadap input yang dimanipulasi atau berbahaya, Grok AI bertujuan untuk mempertahankan integritas interaksi pengguna. Intinya, Grok AI bukan hanya perangkat pengambilan informasi; ini adalah mitra percakapan yang imersif yang mendorong dialog yang dinamis. Pencipta Grok AI Otak di balik Grok AI tidak lain adalah Elon Musk, seorang individu yang identik dengan inovasi di berbagai bidang, termasuk otomotif, perjalanan luar angkasa, dan teknologi. Di bawah naungan xAI, sebuah perusahaan yang fokus pada kemajuan teknologi AI dengan cara yang bermanfaat, visi Musk bertujuan untuk membentuk kembali pemahaman tentang interaksi AI. Kepemimpinan dan etos dasar sangat dipengaruhi oleh komitmen Musk untuk mendorong batasan teknologi. Investor Grok AI Meskipun rincian spesifik mengenai investor yang mendukung Grok AI masih terbatas, secara publik diakui bahwa xAI, inkubator proyek ini, didirikan dan didukung terutama oleh Elon Musk sendiri. Usaha dan kepemilikan Musk sebelumnya memberikan dukungan yang kuat, lebih lanjut memperkuat kredibilitas dan potensi pertumbuhan Grok AI. Namun, hingga saat ini, informasi mengenai yayasan investasi tambahan atau organisasi yang mendukung Grok AI tidak tersedia secara mudah, menandai area untuk eksplorasi potensial di masa depan. Bagaimana Grok AI Bekerja? Mekanisme operasional Grok AI sama inovatifnya dengan kerangka konseptualnya. Proyek ini mengintegrasikan beberapa teknologi mutakhir yang memfasilitasi fungsionalitas uniknya: Infrastruktur yang Kuat: Grok AI dibangun menggunakan Kubernetes untuk orkestrasi kontainer, Rust untuk kinerja dan keamanan, dan JAX untuk komputasi numerik berkinerja tinggi. Ketiga elemen ini memastikan bahwa chatbot beroperasi secara efisien, dapat diskalakan dengan efektif, dan melayani pengguna dengan cepat. Akses Pengetahuan Real-Time: Salah satu fitur pembeda Grok AI adalah kemampuannya untuk mengakses data real-time melalui platform X—sebelumnya dikenal sebagai Twitter. Kemampuan ini memberikan AI akses ke informasi terbaru, memungkinkannya untuk memberikan jawaban dan rekomendasi yang tepat waktu yang mungkin terlewat oleh model AI lainnya. Dua Mode Interaksi: Grok AI menawarkan pengguna pilihan antara “Mode Menyenangkan” dan “Mode Reguler.” Mode Menyenangkan memungkinkan gaya interaksi yang lebih bermain dan humoris, sementara Mode Reguler fokus pada memberikan respons yang tepat dan akurat. Fleksibilitas ini memastikan pengalaman yang disesuaikan yang memenuhi berbagai preferensi pengguna. Intinya, Grok AI menggabungkan kinerja dengan keterlibatan, menciptakan pengalaman yang kaya dan menghibur. Garis Waktu Grok AI Perjalanan Grok AI ditandai oleh tonggak penting yang mencerminkan tahap pengembangan dan penerapannya: Pengembangan Awal: Fase dasar Grok AI berlangsung selama sekitar dua bulan, di mana pelatihan awal dan penyempurnaan model dilakukan. Rilis Beta Grok-2: Dalam kemajuan signifikan, beta Grok-2 diumumkan. Rilis ini memperkenalkan dua versi chatbot—Grok-2 dan Grok-2 mini—masing-masing dilengkapi dengan kemampuan untuk chatting, coding, dan penalaran. Akses Publik: Setelah pengembangan beta, Grok AI menjadi tersedia untuk pengguna platform X. Mereka yang memiliki akun yang diverifikasi dengan nomor telepon dan aktif selama setidaknya tujuh hari dapat mengakses versi terbatas, membuat teknologi ini tersedia untuk audiens yang lebih luas. Garis waktu ini mencakup pertumbuhan sistematis Grok AI dari awal hingga keterlibatan publik, menekankan komitmennya untuk perbaikan berkelanjutan dan interaksi pengguna. Fitur Utama Grok AI Grok AI mencakup beberapa fitur kunci yang berkontribusi pada identitas inovatifnya: Integrasi Pengetahuan Real-Time: Akses ke informasi terkini dan relevan membedakan Grok AI dari banyak model statis, memungkinkan pengalaman pengguna yang menarik dan akurat. Gaya Interaksi yang Beragam: Dengan menawarkan mode interaksi yang berbeda, Grok AI memenuhi berbagai preferensi pengguna, mengundang kreativitas dan personalisasi dalam berkomunikasi dengan AI. Dasar Teknologi yang Canggih: Pemanfaatan Kubernetes, Rust, dan JAX memberikan proyek ini kerangka kerja yang solid untuk memastikan keandalan dan kinerja optimal. Pertimbangan Diskursus Etis: Penyertaan fungsi penghasil gambar menunjukkan semangat inovatif proyek ini. Namun, hal ini juga menimbulkan pertimbangan etis seputar hak cipta dan penggambaran yang menghormati tokoh-tokoh yang dikenali—diskusi yang sedang berlangsung dalam komunitas AI. Kesimpulan Sebagai entitas perintis di bidang AI percakapan, Grok AI mencakup potensi untuk pengalaman pengguna yang transformatif di era digital. Dikembangkan oleh xAI dan didorong oleh pendekatan visioner Elon Musk, Grok AI mengintegrasikan pengetahuan real-time dengan kemampuan interaksi yang canggih. Ini berupaya untuk mendorong batasan apa yang dapat dicapai oleh kecerdasan buatan sambil tetap fokus pada pertimbangan etis dan keselamatan pengguna. Grok AI tidak hanya mewujudkan kemajuan teknologi tetapi juga mewakili paradigma percakapan baru di lanskap Web3, menjanjikan untuk melibatkan pengguna dengan pengetahuan yang mahir dan interaksi yang menyenangkan. Seiring proyek ini terus berkembang, ia berdiri sebagai bukti apa yang dapat dicapai di persimpangan teknologi, kreativitas, dan interaksi yang mirip manusia.

587 Total TayanganDipublikasikan pada 2024.12.26Diperbarui pada 2024.12.26

Apa Itu GROK AI

Apa Itu ERC AI

Euruka Tech: Gambaran Umum tentang $erc ai dan Ambisinya di Web3 Pendahuluan Dalam lanskap teknologi blockchain dan aplikasi terdesentralisasi yang berkembang pesat, proyek-proyek baru muncul dengan frekuensi tinggi, masing-masing dengan tujuan dan metodologi yang unik. Salah satu proyek tersebut adalah Euruka Tech, yang beroperasi di domain cryptocurrency dan Web3 yang luas. Fokus utama Euruka Tech, khususnya tokennya $erc ai, adalah untuk menghadirkan solusi inovatif yang dirancang untuk memanfaatkan kemampuan teknologi terdesentralisasi yang terus berkembang. Artikel ini bertujuan untuk memberikan gambaran komprehensif tentang Euruka Tech, eksplorasi tujuannya, fungsionalitas, identitas penciptanya, calon investor, dan signifikansinya dalam konteks yang lebih luas dari Web3. Apa itu Euruka Tech, $erc ai? Euruka Tech dicirikan sebagai proyek yang memanfaatkan alat dan fungsionalitas yang ditawarkan oleh lingkungan Web3, dengan fokus pada integrasi kecerdasan buatan dalam operasinya. Meskipun rincian spesifik tentang kerangka proyek ini agak samar, proyek ini dirancang untuk meningkatkan keterlibatan pengguna dan mengotomatiskan proses di ruang crypto. Proyek ini bertujuan untuk menciptakan ekosistem terdesentralisasi yang tidak hanya memfasilitasi transaksi tetapi juga menggabungkan fungsionalitas prediktif melalui kecerdasan buatan, sehingga penamaan tokennya, $erc ai. Tujuannya adalah untuk menyediakan platform intuitif yang memfasilitasi interaksi yang lebih cerdas dan pemrosesan transaksi yang efisien dalam lingkup Web3 yang terus berkembang. Siapa Pencipta Euruka Tech, $erc ai? Saat ini, informasi mengenai pencipta atau tim pendiri di balik Euruka Tech masih tidak ditentukan dan agak tidak jelas. Ketidakhadiran data ini menimbulkan kekhawatiran, karena pengetahuan tentang latar belakang tim sering kali penting untuk membangun kredibilitas dalam sektor blockchain. Oleh karena itu, kami telah mengkategorikan informasi ini sebagai tidak diketahui sampai rincian konkret tersedia di domain publik. Siapa Investor Euruka Tech, $erc ai? Demikian pula, identifikasi investor atau organisasi pendukung untuk proyek Euruka Tech tidak disediakan dengan mudah melalui penelitian yang tersedia. Aspek yang sangat penting bagi pemangku kepentingan atau pengguna potensial yang mempertimbangkan keterlibatan dengan Euruka Tech adalah jaminan yang datang dari kemitraan keuangan yang mapan atau dukungan dari perusahaan investasi yang terkemuka. Tanpa pengungkapan tentang afiliasi investasi, sulit untuk menarik kesimpulan komprehensif tentang keamanan finansial atau keberlangsungan proyek. Sesuai dengan informasi yang ditemukan, bagian ini juga berada pada status tidak diketahui. Bagaimana Euruka Tech, $erc ai Bekerja? Meskipun kurangnya spesifikasi teknis yang mendetail untuk Euruka Tech, penting untuk mempertimbangkan ambisi inovatifnya. Proyek ini berusaha memanfaatkan kemampuan komputasi kecerdasan buatan untuk mengotomatiskan dan meningkatkan pengalaman pengguna dalam lingkungan cryptocurrency. Dengan mengintegrasikan AI dengan teknologi blockchain, Euruka Tech bertujuan untuk menyediakan fitur seperti perdagangan otomatis, penilaian risiko, dan antarmuka pengguna yang dipersonalisasi. Esensi inovatif dari Euruka Tech terletak pada tujuannya untuk menciptakan koneksi yang mulus antara pengguna dan kemungkinan luas yang ditawarkan oleh jaringan terdesentralisasi. Melalui pemanfaatan algoritma pembelajaran mesin dan AI, proyek ini bertujuan untuk meminimalkan tantangan bagi pengguna baru dan menyederhanakan pengalaman transaksional dalam kerangka Web3. Simbiosis antara AI dan blockchain ini menggarisbawahi signifikansi token $erc ai, yang berdiri sebagai jembatan antara antarmuka pengguna tradisional dan kemampuan canggih dari teknologi terdesentralisasi. Garis Waktu Euruka Tech, $erc ai Sayangnya, sebagai akibat dari informasi yang terbatas mengenai Euruka Tech, kami tidak dapat menyajikan garis waktu yang mendetail tentang perkembangan utama atau tonggak dalam perjalanan proyek ini. Garis waktu ini, yang biasanya sangat berharga dalam memetakan evolusi suatu proyek dan memahami trajektori pertumbuhannya, saat ini tidak tersedia. Ketika informasi tentang peristiwa penting, kemitraan, atau penambahan fungsional menjadi jelas, pembaruan pasti akan meningkatkan visibilitas Euruka Tech di dunia crypto. Klarifikasi tentang Proyek “Eureka” Lainnya Penting untuk dicatat bahwa banyak proyek dan perusahaan berbagi nomenklatur serupa dengan “Eureka.” Penelitian telah mengidentifikasi inisiatif seperti agen AI dari NVIDIA Research, yang fokus pada pengajaran robot tugas kompleks menggunakan metode generatif, serta Eureka Labs dan Eureka AI, yang meningkatkan pengalaman pengguna dalam analitik pendidikan dan layanan pelanggan, masing-masing. Namun, proyek-proyek ini berbeda dari Euruka Tech dan tidak boleh disamakan dengan tujuan atau fungsionalitasnya. Kesimpulan Euruka Tech, bersama dengan token $erc ai-nya, mewakili pemain yang menjanjikan namun saat ini masih samar dalam lanskap Web3. Meskipun rincian tentang pencipta dan investor masih belum diungkapkan, ambisi inti untuk menggabungkan kecerdasan buatan dengan teknologi blockchain tetap menjadi titik fokus yang menarik. Pendekatan unik proyek ini dalam mendorong keterlibatan pengguna melalui otomatisasi canggih dapat membedakannya seiring dengan kemajuan ekosistem Web3. Seiring dengan terus berkembangnya pasar crypto, pemangku kepentingan harus memperhatikan kemajuan seputar Euruka Tech, karena pengembangan inovasi yang terdokumentasi, kemitraan, atau peta jalan yang terdefinisi dapat menghadirkan peluang signifikan di masa depan. Saat ini, kami menunggu wawasan yang lebih substansial yang dapat mengungkap potensi Euruka Tech dan posisinya dalam lanskap crypto yang kompetitif.

557 Total TayanganDipublikasikan pada 2025.01.02Diperbarui pada 2025.01.02

Apa Itu ERC AI

Apa Itu DUOLINGO AI

DUOLINGO AI: Mengintegrasikan Pembelajaran Bahasa dengan Inovasi Web3 dan AI Dalam era di mana teknologi membentuk kembali pendidikan, integrasi kecerdasan buatan (AI) dan jaringan blockchain menandai batasan baru untuk pembelajaran bahasa. Masuklah DUOLINGO AI dan cryptocurrency terkaitnya, $DUOLINGO AI. Proyek ini bercita-cita untuk menggabungkan kekuatan pendidikan dari platform pembelajaran bahasa terkemuka dengan manfaat teknologi Web3 yang terdesentralisasi. Artikel ini menggali aspek-aspek kunci dari DUOLINGO AI, menjelajahi tujuannya, kerangka teknologi, perkembangan sejarah, dan potensi masa depan sambil mempertahankan kejelasan antara sumber daya pendidikan asli dan inisiatif cryptocurrency independen ini. Gambaran Umum DUOLINGO AI Pada intinya, DUOLINGO AI berusaha untuk membangun lingkungan terdesentralisasi di mana pelajar dapat memperoleh imbalan kriptografi untuk mencapai tonggak pendidikan dalam kemahiran bahasa. Dengan menerapkan kontrak pintar, proyek ini bertujuan untuk mengotomatiskan proses verifikasi keterampilan dan alokasi token, sesuai dengan prinsip Web3 yang menekankan transparansi dan kepemilikan pengguna. Model ini menyimpang dari pendekatan tradisional dalam akuisisi bahasa dengan sangat bergantung pada struktur tata kelola yang dipimpin oleh komunitas, memungkinkan pemegang token untuk menyarankan perbaikan pada konten kursus dan distribusi imbalan. Beberapa tujuan notable dari DUOLINGO AI meliputi: Pembelajaran Gamified: Proyek ini mengintegrasikan pencapaian blockchain dan token non-fungible (NFT) untuk mewakili tingkat kemahiran bahasa, mendorong motivasi melalui imbalan digital yang menarik. Penciptaan Konten Terdesentralisasi: Ini membuka jalan bagi pendidik dan penggemar bahasa untuk berkontribusi pada kursus mereka, memfasilitasi model pembagian pendapatan yang menguntungkan semua kontributor. Personalisasi Berbasis AI: Dengan menggunakan model pembelajaran mesin yang canggih, DUOLINGO AI mempersonalisasi pelajaran untuk beradaptasi dengan kemajuan belajar individu, mirip dengan fitur adaptif yang ditemukan di platform yang sudah mapan. Pencipta Proyek dan Tata Kelola Hingga April 2025, tim di balik $DUOLINGO AI tetap anonim, praktik yang umum dalam lanskap cryptocurrency terdesentralisasi. Anonimitas ini dimaksudkan untuk mempromosikan pertumbuhan kolektif dan keterlibatan pemangku kepentingan daripada fokus pada pengembang individu. Kontrak pintar yang diterapkan di blockchain Solana mencatat alamat dompet pengembang, yang menandakan komitmen terhadap transparansi terkait transaksi meskipun identitas penciptanya tidak diketahui. Menurut peta jalannya, DUOLINGO AI bertujuan untuk berkembang menjadi Organisasi Otonom Terdesentralisasi (DAO). Struktur tata kelola ini memungkinkan pemegang token untuk memberikan suara pada isu-isu penting seperti implementasi fitur dan alokasi kas. Model ini sejalan dengan etos pemberdayaan komunitas yang ditemukan dalam berbagai aplikasi terdesentralisasi, menekankan pentingnya pengambilan keputusan kolektif. Investor dan Kemitraan Strategis Saat ini, tidak ada investor institusi atau modal ventura yang dapat diidentifikasi secara publik yang terkait dengan $DUOLINGO AI. Sebaliknya, likuiditas proyek ini terutama berasal dari bursa terdesentralisasi (DEX), menandai kontras yang tajam dengan strategi pendanaan perusahaan teknologi pendidikan tradisional. Model akar rumput ini menunjukkan pendekatan yang dipimpin oleh komunitas, mencerminkan komitmen proyek terhadap desentralisasi. Dalam whitepapernya, DUOLINGO AI menyebutkan pembentukan kolaborasi dengan “platform pendidikan blockchain” yang tidak ditentukan yang bertujuan untuk memperkaya penawaran kursusnya. Meskipun kemitraan spesifik belum diungkapkan, upaya kolaboratif ini menunjukkan strategi untuk menggabungkan inovasi blockchain dengan inisiatif pendidikan, memperluas akses dan keterlibatan pengguna di berbagai jalur pembelajaran. Arsitektur Teknologi Integrasi AI DUOLINGO AI menggabungkan dua komponen utama yang didorong oleh AI untuk meningkatkan penawaran pendidikannya: Mesin Pembelajaran Adaptif: Mesin canggih ini belajar dari interaksi pengguna, mirip dengan model kepemilikan dari platform pendidikan besar. Ia secara dinamis menyesuaikan kesulitan pelajaran untuk mengatasi tantangan spesifik pelajar, memperkuat area yang lemah melalui latihan yang ditargetkan. Agen Percakapan: Dengan menggunakan chatbot bertenaga GPT-4, DUOLINGO AI menyediakan platform bagi pengguna untuk terlibat dalam percakapan yang disimulasikan, mendorong pengalaman pembelajaran bahasa yang lebih interaktif dan praktis. Infrastruktur Blockchain Dibangun di atas blockchain Solana, $DUOLINGO AI memanfaatkan kerangka teknologi yang komprehensif yang mencakup: Kontrak Pintar Verifikasi Keterampilan: Fitur ini secara otomatis memberikan token kepada pengguna yang berhasil melewati tes kemahiran, memperkuat struktur insentif untuk hasil pembelajaran yang nyata. Lencana NFT: Token digital ini menandakan berbagai tonggak yang dicapai pelajar, seperti menyelesaikan bagian dari kursus mereka atau menguasai keterampilan tertentu, memungkinkan mereka untuk memperdagangkan atau memamerkan pencapaian mereka secara digital. Tata Kelola DAO: Anggota komunitas yang memiliki token dapat terlibat dalam tata kelola dengan memberikan suara pada proposal kunci, memfasilitasi budaya partisipatif yang mendorong inovasi dalam penawaran kursus dan fitur platform. Garis Waktu Sejarah 2022–2023: Konseptualisasi Landasan untuk DUOLINGO AI dimulai dengan pembuatan whitepaper, menyoroti sinergi antara kemajuan AI dalam pembelajaran bahasa dan potensi terdesentralisasi dari teknologi blockchain. 2024: Peluncuran Beta Peluncuran beta terbatas memperkenalkan penawaran dalam bahasa-bahasa populer, memberikan imbalan kepada pengguna awal dengan insentif token sebagai bagian dari strategi keterlibatan komunitas proyek. 2025: Transisi DAO Pada bulan April, peluncuran mainnet penuh terjadi dengan peredaran token, mendorong diskusi komunitas mengenai kemungkinan ekspansi ke bahasa Asia dan pengembangan kursus lainnya. Tantangan dan Arah Masa Depan Hambatan Teknis Meskipun memiliki tujuan ambisius, DUOLINGO AI menghadapi tantangan signifikan. Skalabilitas tetap menjadi perhatian yang berkelanjutan, terutama dalam menyeimbangkan biaya yang terkait dengan pemrosesan AI dan mempertahankan jaringan terdesentralisasi yang responsif. Selain itu, memastikan penciptaan konten berkualitas dan moderasi di tengah penawaran terdesentralisasi menimbulkan kompleksitas dalam mempertahankan standar pendidikan. Peluang Strategis Melihat ke depan, DUOLINGO AI memiliki potensi untuk memanfaatkan kemitraan mikro-credentialing dengan institusi akademis, menyediakan validasi keterampilan bahasa yang diverifikasi oleh blockchain. Selain itu, ekspansi lintas rantai dapat memungkinkan proyek ini untuk menjangkau basis pengguna yang lebih luas dan ekosistem blockchain tambahan, meningkatkan interoperabilitas dan jangkauannya. Kesimpulan DUOLINGO AI mewakili perpaduan inovatif antara kecerdasan buatan dan teknologi blockchain, menghadirkan alternatif yang berfokus pada komunitas untuk sistem pembelajaran bahasa tradisional. Meskipun pengembangannya yang anonim dan model ekonomi yang muncul membawa risiko tertentu, komitmen proyek terhadap pembelajaran gamified, pendidikan yang dipersonalisasi, dan tata kelola terdesentralisasi menerangi jalan ke depan untuk teknologi pendidikan di ranah Web3. Seiring kemajuan AI dan evolusi ekosistem blockchain, inisiatif seperti DUOLINGO AI dapat mendefinisikan ulang bagaimana pengguna terlibat dengan pendidikan bahasa, memberdayakan komunitas dan memberikan imbalan atas keterlibatan melalui mekanisme pembelajaran yang inovatif.

609 Total TayanganDipublikasikan pada 2025.04.11Diperbarui pada 2025.04.11

Apa Itu DUOLINGO AI

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga AI (AI) disajikan di bawah ini.

活动图片