MiniMax-M3 bukan model murah biasa. Dalam pengujian SWE-Bench Pro—metrik untuk mengukur kemampuan agen otonom menyelesaikan tugas rekayasa perangkat lunak—M3 mencatat skor 59,0 persen. Angka ini melampaui GPT-5.5 milik OpenAI dan Gemini 3.1 Pro milik Google. Model ini juga unggul dalam penelusuran web otonom (BrowseComp) dengan skor 83,5 persen, mengalahkan Claude Opus 4.7 milik Anthropic yang hanya meraih 79,3 persen.
Rahasia efisiensi M3 terletak pada inovasi arsitektur MiniMax Sparse Attention (MSA). Alih-alih membaca seluruh data dari awal seperti model transformer konvensional, MSA menggunakan sistem indeksasi cerdas yang hanya mengambil blok data relevan. Hasilnya, kebutuhan komputasi per token saat menangani konteks 1 juta token turun menjadi hanya 1/20 dari generasi sebelumnya. Kecepatan pemrosesan melonjak 9 kali lipat pada tahap prefilling dan 15 kali lipat saat decoding.
Model ini dirancang multimodal sejak awal—bukan sekadar menggabungkan model teks dan visual. Dengan korpus pelatihan lebih dari 100 triliun token, M3 mampu menerjemahkan diagram pemrograman atau peta koordinat langsung menjadi kode struktural tanpa kehilangan konteks.
Strategi harga MiniMax mematahkan kebiasaan industri. Selama masa promosi seminggu, biaya input M3 hanya $0,30 per juta token dan output $1,20 per juta token. Bandingkan dengan GPT-5.5 yang mematok $5,00 untuk input dan $30,00 untuk output per juta token. Bahkan setelah diskon berakhir, harga normal M3 ($0,6/$2,40) tetap hanya 8-20 persen dari harga model AS.
Untuk pengguna individu, MiniMax menawarkan paket berlangganan Token Plan mulai dari Plus seharga $20 per bulan (sekitar Rp 320 ribu). Paket ini mencakup 1,7 miliar token per bulan dan mendukung 3-4 agen AI berjalan bersamaan. Paket Max ($50/bulan) dan Ultra ($120/bulan) menawarkan kapasitas lebih besar plus pembuatan video otomatis.
Yang membuat developer tercengang adalah kemampuan otonomi M3. Dalam pengujian viral di platform X, peneliti MiniMax @MikaStars37 mendemonstrasikan bagaimana M3 bekerja mandiri selama hampir 12 jam tanpa intervensi manusia. Model itu berhasil mereproduksi eksperimen dari makalah peraih penghargaan ICLR 2025, menghasilkan 18 komit kode dan 23 figur eksperimental secara otomatis. "M3 mencocokkan tren probabilitas yang diprediksi, mengamati efek squeezing, dan memvalidasi metode mitigasi yang diusulkan," tulisnya.
Keputusan MiniMax merilis bobot model secara terbuka menjadi game changer. Berbeda dengan GPT-5.5 atau Claude Opus yang hanya bisa diakses via API dengan risiko kebocoran data, M3 bisa dijalankan sepenuhnya di server internal perusahaan. Ini berarti privasi data terjamin, tidak ada vendor lock-in, dan tim engineering bisa melakukan fine-tuning mendalam hingga ke lapisan arsitektur model. Bagi perusahaan Indonesia yang bergulat dengan aturan ketat perlindungan data pribadi (PDP), opsi ini jelas lebih menarik.
Meski demikian, M3 bukannya tanpa cela. Dalam pengujian sangat kompleks seperti SWE-Bench Pro, Claude Opus 4.8—model premium terbaru Anthropic—masih unggul dengan skor 69,2 persen. Di Terminal-Bench, Opus 4.8 mencatat 74,6 persen berbanding 66,0 persen milik M3. Namun, dengan selisih harga mencapai puluhan kali lipat, pertanyaan yang muncul bukan lagi "mana yang lebih hebat", melainkan "seberapa besar performa ekstra yang benar-benar Anda butuhkan?"