Apa yang Menghambat Peluncuran DeepSeek-R2?

DeepSeek.(freepik)

ASIAWORLDVIEW – Model bahasa besar generasi berikutnya DeepSeek, R2, dikabarkan akan diluncurkan pada akhir bulan ini. Spekulasi yang beredar di kalangan teknologi China dan bahkan disinggung oleh AI DeepSeek sendiri.

Model tersebut, dalam menanggapi pertanyaan pengguna, menyarankan jendela peluncuran antara 15 dan 30 Agustus. Namun, hanya beberapa jam setelah informasi ini muncul, sumber yang dekat dengan DeepSeek secara tegas membantah klaim tersebut, menegaskan bahwa tidak ada rencana untuk meluncurkan DeepSeek-R2 pada bulan Agustus.

Ini bukan kali pertama roadmap DeepSeek menimbulkan kebingungan. Rumor serupa beredar awal tahun ini dengan klaim peluncuran pada 17 Maret, yang juga terbukti palsu. Meskipun ada antusiasme publik, perusahaan belum secara resmi mengonfirmasi tanggal peluncuran atau bahkan mengungkapkan spesifikasi teknis kunci dari model R2.

Hal itu tidak menghentikan spekulasi. DeepSeek-R2 diharapkan menjadi lompatan besar, meningkatkan kemampuan penalaran multibahasa dan pembangkitan kode, serta bersaing dengan model teratas seperti GPT-4/5. Namun, kemajuan dilaporkan menemui hambatan.

Menurut sumber yang dikutip oleh The Information pada Juni, CEO DeepSeek Liang Wenfeng masih tidak puas dengan kinerja model tersebut, meskipun telah melalui bulan-bulan pengembangan intensif.

Penundaan ini bukan hanya soal penyempurnaan; hal ini juga mungkin mencerminkan masalah infrastruktur. DeepSeek beroperasi dengan ketersediaan komputasi yang terbatas, terutama setelah chip H20 Nvidia dilarang diekspor ke China.

Baca Juga: DeepSeek AI Sebabkan Harga di Pasar Kripto Terguncang?

Sumber-sumber menyarankan perusahaan khawatir meluncurkan R2 terlalu cepat dapat berbalik merugikan jika lonjakan penggunaan melebihi kapasitas sistemnya. Ini adalah kekhawatiran nyata dalam perlombaan AI, di mana kinerja saja tidak cukup; skalabilitas juga penting.

Untuk mengatasi kekurangan tersebut, DeepSeek dilaporkan sedang melatih R2 menggunakan chip Huawei Ascend 910B. Kluster komputasi Huawei dilaporkan mampu menghasilkan 512 PFLOPS kinerja FP16 pada tingkat utilisasi 82%, setara dengan sekitar 91% kinerja kluster A100 Nvidia. Meskipun ini menunjukkan potensi, belum jelas apakah konfigurasi ini dapat memenuhi skala yang diperlukan untuk peluncuran model besar.

Sementara itu, situasi pasokan chip mungkin membaik. Beberapa hari lalu, Nvidia dan AMD menyetujui kesepakatan pembagian pendapatan dengan pemerintah AS, memungkinkan mereka untuk terus menjual chip AI di China dengan imbalan menyerahkan 15% dari pendapatan mereka di China. Kesepakatan ini mungkin pada akhirnya akan meredakan kendala pasokan bagi perusahaan seperti DeepSeek. Namun, manfaat langsungnya masih tidak pasti, karena otoritas China dilaporkan telah menghalangi perusahaan domestik untuk menggunakan chip H20 Nvidia.

Meskipun model DeepSeek sendiri mungkin telah memberikan petunjuk tentang peluncuran yang segera, posisi perusahaan tampaknya jauh lebih hati-hati. R2 memang nyata. Sedang dalam pengujian aktif. Tapi belum siap untuk diluncurkan secara luas. Dan dalam lanskap AI yang sangat kompetitif, DeepSeek membutuhkan lebih dari sekadar model yang baik; mereka membutuhkan model yang stabil, skalabel, dan siap pasar.