Jakarta – Laporan DeepSeek yang disusun Pendiri DeepSeek Liang Wenfeng menyebutkan DeepSeek-V3 dilatih menggunakan 2.048 GPU Nvidia H800.
Langkah ini bagaimana model hardware bisa mengubah tantangan ini secara efektif, membuat pelatihan dan inference dalam skala menjadi efisien.
DeepSeek dan High-Flyer merupakan penyandang dana DeepSeek yang sebelumnya sudah menimbun H800.
GPU H800 ini didesain khusus oleh Nvidia untuk pasar China sesuai aturan pembatasan yang diterapkan oleh AS, tapi juga dilarang pada 2023.
Cara melatih model AI yang dipakai oleh startup ini merupakan solusi dari pelatihan model AI yang dibatasi oleh hardware dan biaya yang tinggi, seperti OpenAI untuk melatih GPT.
DeepSeek juga mengemukakan optimasi teknis untuk meningkatkan efisiensi memori, memuluskan komunikasi antar chip. Selain itu meningkatkan performa infrastruktur artificial intelligence/AI (kecerdasan buatan) secara keseluruhan.
Berbagai metode yang diterapkan oleh DeepSeek diklaim bisa mengurangi biaya komputasional untuk prapelatihan dan mencapai performa lebih kencang selama inference.
Metode in sudah diadopsi oleh banyak pengembang AI di China seperti Alibaba dalam model AI Qen3.
DeepSeek merilis model V3 pada Desember 2024 yang sebulan kemudian diluncurkan R1. Kedua model AI ini mengejutkan dunia karena kebutuhan komputasinya jauh lebih irit dibanding GPT, tapi kemampuan yang sebanding.
Selanjutnya, DeepSeek diam tentang masa depan rencana penelitiannya, hanya disebutkan secara reguler.
Banyak perusahaan teknologi China mengklaim penelitiannya di ranah AI bisa berakselerasi secara cepat. Enam bulan sejak V3 dirilis, berbagai perusahaan teknologi China sudah meluncurkan banyak model AI baru yang terlihat menjanjikan.
Baidu merilis model AI Ernie 4.5 Turbo dan X1 Turbo pada April 2024 dengan kemampuan multimodal reasoning dan harga yang 40% lebih murah dibanding DeepSeek V3.
Kemudian, Alibaba juga memperkenalkan model AI Qwen terbarunya, yang langsung menyalip V3 sebagai model AI open source paling populer di dunia pada bulan yang sama. (adm)
Sumber: detik.com