DeepSeek Perkenalkan Sparse Attention untuk API Lebih Murah

Pada tanggal 29 September 2025, DeepSeek mengumumkan peluncuran model eksperimental baru bernama V3.2-exp, yang dirancang khusus untuk mengurangi biaya inference (pemanggilan API) dalam konteks panjang. Model baru ini diperkenalkan melalui unggahan di platform Hugging Face, disertai makalah akademik yang diunggah ke GitHub agar dapat diakses dan dievaluasi oleh pihak luar.
Artikel berjudul DeepSeek Perkenalkan Sparse Attention untuk API Lebih Murah ini kami hadirkan kembali dalam versi ringkas agar Anda bisa langsung menangkap inti pembahasannya tanpa harus membaca keseluruhan berita di sumber utama. Isinya kami pilih dari topik yang sedang ramai dibicarakan dan relevan dengan kehidupan sehari-hari.
Fitur paling menonjol dari model ini adalah mekanisme “Sparse Attention” atau perhatian jarang, yang mengoptimalkan penggunaan sumber daya ketika model harus memproses konteks panjang. Dengan teknik ini, DeepSeek mengklaim bahwa biaya panggilan API dapat ditekan hingga 50 persen dalam situasi konteks panjang.
Sparse Attention dalam model V3.2-exp dibangun melalui dua tahap utama: lightning indexer dan fine-grained token selector.
Kami menyajikan ringkasan dari artikel ini untuk memudahkan Anda memahami pokok pembahasannya. Anda bisa membaca berita selengkapnya melalui tautan di bawah ini:
Sumber: TrenMedia.co.id