Diam-diam Xiaomi Bangun Kerajaan AI: Model Triliunan Parameter dan Agen Otonom Siap Menggebrak
Jika selama ini Anda mengenal Xiaomi sebagai pembuat ponsel murah dan peralatan rumah pintar, bersiaplah mengubah sudut pandang. Dalam 18 bulan terakhir, perusahaan itu diam-diam meroket menjadi salah satu pemain kecerdasan buatan paling ambisius di dunia. Mereka tidak sekadar ikut-ikutan tren model bahasa besar (LLM), melainkan membangun fondasi yang bisa mengubah cara kita menggunakan gawai sehari-hari.
- Model open-source pertama langsung menyaingi performa ragam model raksasa di tolok ukur matematika.
- MiMo-V2-Pro dengan parameter triliunan siap menangani tugas agen multi-langkah yang kompleks.
- OmniVoice dapat mengkloning suara dalam 646 bahasa, dari rekaman sekian detik saja.
- miclaw bukan asisten suara pasif, melainkan agen yang membuka aplikasi, mengisi formulir, dan menyelesaikan urusan tanpa disuruh berulang kali.
- Semua ambisi ini disokong suntikan investasi jumbo sekitar Rp 145 triliun untuk tiga tahun ke depan.
Model MiMo 7B Jadi Fondasi Ambisi AI Xiaomi

Cerita ini berawal pada April 2025. Xiaomi merilis MiMo-7B, model bahasa besar open-source pertama mereka. Nama MiMo adalah singkatan dari Xiaomi Model. Daripada sekadar membuat chatbot, tim Xiaomi langsung mengasah kemampuan penalaran (reasoning) dan pengodean (coding).
Hasilnya lumayan bikin takjub. Meski hanya dibekali 7 miliar parameter, MiMo-7B versi reinforcement learning diklaim mencetak skor 95,8% di tolok ukur MATH-500. Angka ini bahkan mengungguli model-model yang jauh lebih besar, seperti OpenAI-o1-mini dan Qwen-32B-Preview milik Alibaba, dalam kompetisi matematika AIME 2024 dan 2025. Model ini dilatih dengan 25 triliun token data yang dikurasi khusus. Hebatnya, semua dilepas dengan lisensi MIT, sehingga pengembang di mana pun bisa mengaksesnya di Hugging Face.
Tinggalkan Tampilan Jam Statis, Watch Face Kick It Punya Live Skor dan Semua Update Piala Dunia 2026

MiMo-V2-Flash: Kencang, Hemat, dan Hampir Setara Model Premium

Memasuki Desember 2025, Xiaomi melompat ke MiMo-V2-Flash. Model ini memiliki 309 miliar parameter, tetapi berkat arsitektur Mixture-of-Experts (MoE), hanya sekitar 15 miliar parameter yang aktif setiap saat. Alhasil, kecepatan dan efisiensinya melesat.
Di atas kertas, MiMo-V2-Flash menduduki posisi dua besar di antara model open-source dalam tolok ukur reasoning. Ia menyamai performa GPT-5 dan Claude 4.5 Sonnet pada pengujian rekayasa perangkat lunak (SWE-Bench Verified), sambil mampu menyemburkan respons hingga 150 token per detik. Biaya inferensi pun amat rendah, sekitar Rp 1.600 per sejuta token masukan (US$ 0,1). Xiaomi bahkan sempat menggratiskan akses API di awal peluncuran.
MiMo-V2-Pro: Si Otak Triliunan Parameter untuk Tugas Agentic

Puncaknya pada Maret 2026, Xiaomi memperkenalkan MiMo-V2-Pro. Total parameternya menembus lebih dari 1 triliun, dengan 42 miliar parameter aktif per langkah. Model ini mendukung jendela konteks hingga 1 juta token, cukup untuk “membaca” beberapa novel panjang dalam satu percakapan.
Uniknya, model ini lebih dulu muncul secara misterius di platform OpenRouter dengan nama samaran “Hunter Alpha”. Tanpa atribusi merek, performanya langsung melejit ke puncak papan peringkat, memproses lebih dari 1,5 triliun token sebelum Xiaomi akhirnya mengakuinya. Menurut perusahaan, MiMo-V2-Pro dirancang khusus untuk tugas agentic: pekerjaan multi-langkah yang butuh perencanaan dan eksekusi, bukan sekadar menjawab pertanyaan.
Tinggalkan Aplikasi Keuangan Konvensional, ChatGPT Kini Bisa Akses Rekening Bank dan Dompet Anda

OmniVoice: Hadirkan Kloning Suara 646 Bahasa, dari Melayu hingga Bahasa Langka

Di ranah suara, Xiaomi memamerkan OmniVoice pada Mei 2026. Model text-to-speech ini mendukung 646 bahasa, termasuk banyak bahasa dengan sumber daya terbatas. Hanya dengan beberapa detik sampel suara, OmniVoice dapat mengkloning karakter vokal dan menghasilkan ucapan natural dalam berbagai bahasa.
Dari segi teknis, OmniVoice mengandalkan arsitektur transformer tunggal yang memetakan teks langsung ke token akustik. Hasilnya, pelatihan dengan 100.000 jam data audio bisa diselesaikan dalam satu hari, dan inferensi berjalan 40 kali lipat lebih cepat ketimbang kecepatan real-time. Semua ini dirilis dengan lisensi Apache-2.0, membuka pintu bagi pengembang di seluruh dunia.
miclaw: Saat Ponsel Punya Agen yang Bekerja Sendiri

Sosok paling revolusioner dalam strategi Xiaomi adalah miclaw. Diumumkan pada Maret 2026 dan masih dalam beta tertutup, miclaw bukan chatbot biasa. Ia adalah agen AI otonom yang dibangun di atas MiMo. Alih-alih menunggu instruksi satu per satu, miclaw mampu membuka aplikasi, menavigasi antarmuka, mengisi formulir, berinteraksi dengan alat sistem, dan menuntaskan tugas multi-langkah sepenuhnya tanpa perlu diawasi terus-menerus.
Cara kerjanya menggunakan “inference-execution loop”: AI memutuskan langkah, menjalankannya, memeriksa hasil, lalu melanjutkan sampai selesai. Xiaomi mengklaim privasi pengguna terlindungi lewat edge-cloud privacy computing, di mana data sensitif diproses di perangkat. Saat ini miclaw hanya mendukung Xiaomi 17 series, tetapi HyperOS 4 akan mengintegrasikannya penuh di level sistem.
Tinggalkan Ilusi Update Gratis, Tembok Eksklusivitas iOS 27 Bantai Standar Ekosistem Apple

Gelontoran Dana Rp145 Triliun Demi Konvergensi Penuh
Semua lompatan ini tak lepas dari komitmen finansial. CEO Lei Jun mengumumkan investasi minimal US$ 8,7 miliar, sekitar Rp 145 triliun, untuk AI dalam tiga tahun ke depan. Anggaran riset tahunan Xiaomi pun diproyeksikan menembus 40 miliar yuan. Ambisi akhirnya adalah “grand convergence”: menyatukan chip buatan sendiri, OS mandiri, dan model AI orisinal ke dalam satu perangkat tunggal.
Jika miclaw dan HyperOS 4 mampu membuat kecerdasan buatan benar-benar berguna dalam keseharian, Xiaomi tak lagi sekadar vendor ponsel yang iseng bermain AI. Perusahaan ini bertransformasi menjadi platform AI sejati, dengan fondasi model open-source yang telah menyita lebih dari 21% trafik di OpenRouter pada awal April 2026.
Via: Gizmochina