Baru-baru ini, DeepSeek merilis pembaruan versi V3 terbaru di Hugging Face—DeepSeek-V3-0324, model ini memiliki 6850 miliar parameter, dengan peningkatan signifikan dalam kemampuan kode, desain UI, dan kemampuan inferensi.
Pada konferensi 2025 GTC yang baru saja berakhir, CEO Nvidia, Huang Renxun, memberikan pujian tinggi kepada DeepSeek. Dia menekankan bahwa pandangan pasar sebelumnya yang menganggap model efisien DeepSeek akan mengurangi permintaan chip adalah salah, dan kebutuhan komputasi di masa depan hanya akan semakin meningkat, bukan semakin berkurang.
DeepSeek sebagai produk perwakilan terobosan algoritme, hubungan antara pasokan chip dan produk ini layak untuk dibahas lebih dalam. Mari kita analisis terlebih dahulu arti dari daya komputasi dan algoritme terhadap perkembangan industri AI.
Evolusi Simbiosis Antara Daya Komputasi dan Algoritme
Di bidang AI, peningkatan kekuatan komputasi menyediakan dasar untuk menjalankan algoritme yang lebih kompleks, memungkinkan model untuk memproses lebih banyak data dan mempelajari pola yang lebih rumit; sementara optimasi algoritme dapat memanfaatkan kekuatan komputasi dengan lebih efisien, meningkatkan efisiensi penggunaan sumber daya komputasi.
Keterkaitan antara daya komputasi dan algoritme sedang membentuk kembali pola industri AI:
Diferensiasi jalur teknologi: Beberapa perusahaan mengejar pembangunan kluster kekuatan komputasi yang sangat besar, sementara yang lain fokus pada optimasi efisiensi algoritme, membentuk aliran teknologi yang berbeda.
Rekonstruksi rantai industri: Beberapa perusahaan menjadi pemimpin dalam kekuatan komputasi AI melalui ekosistem, sementara penyedia layanan cloud mengurangi hambatan penerapan melalui layanan komputasi yang fleksibel.
Penyesuaian alokasi sumber daya: Perusahaan mencari keseimbangan antara investasi infrastruktur perangkat keras dan pengembangan algoritme yang efisien.
Kebangkitan Komunitas Sumber Terbuka: Model sumber terbuka seperti DeepSeek, LLaMA, dan lainnya memungkinkan inovasi algoritme dan hasil optimisasi daya komputasi untuk dibagikan, mempercepat iterasi dan difusi teknologi.
Inovasi Teknologi DeepSeek
Keberhasilan DeepSeek tidak terlepas dari inovasi teknologinya. Berikut adalah penjelasan sederhana tentang poin inovasi utamanya:
Optimasi Arsitektur Model
DeepSeek mengadopsi arsitektur kombinasi Transformer+MOE (Mixture of Experts) dan memperkenalkan mekanisme perhatian laten multi-kepala (Multi-Head Latent Attention, MLA). Arsitektur ini seperti tim super, di mana Transformer bertanggung jawab untuk menangani tugas rutin, sementara MOE berfungsi sebagai kelompok ahli dalam tim, di mana setiap ahli memiliki bidang keahlian masing-masing. Ketika menghadapi masalah tertentu, ahli yang paling kompeten akan menangani, sehingga dapat secara signifikan meningkatkan efisiensi dan akurasi model. Mekanisme MLA memungkinkan model untuk lebih fleksibel dalam memperhatikan detail penting yang berbeda saat memproses informasi, yang lebih lanjut meningkatkan kinerja model.
Inovasi Metode Pelatihan
DeepSeek telah mengusulkan kerangka pelatihan presisi campuran FP8. Kerangka ini berfungsi sebagai pengatur sumber daya cerdas, yang dapat secara dinamis memilih presisi komputasi yang sesuai berdasarkan kebutuhan pada berbagai fase selama proses pelatihan. Ketika dibutuhkan komputasi presisi tinggi, ia akan menggunakan presisi yang lebih tinggi untuk memastikan akurasi model; sedangkan ketika presisi yang lebih rendah dapat diterima, ia akan menurunkan presisi, sehingga menghemat sumber daya komputasi, meningkatkan kecepatan pelatihan, dan mengurangi penggunaan memori.
Peningkatan efisiensi inferensi
Pada tahap inferensi, DeepSeek memperkenalkan teknologi Prediksi Multi-token (Multi-token Prediction, MTP). Metode inferensi tradisional dilakukan secara bertahap, di mana setiap langkah hanya memprediksi satu Token. Namun, teknologi MTP dapat memprediksi beberapa Token sekaligus, sehingga secara signifikan mempercepat kecepatan inferensi sekaligus mengurangi biaya inferensi.
Terobosan algoritme pembelajaran penguatan
Algoritme pembelajaran penguatan baru dari DeepSeek, GRPO (Generalized Reward-Penalized Optimization), mengoptimalkan proses pelatihan model. Pembelajaran penguatan seperti memberikan pelatih kepada model, di mana pelatih membimbing model untuk belajar perilaku yang lebih baik melalui hadiah dan hukuman. Algoritme pembelajaran penguatan tradisional dalam proses ini mungkin menghabiskan banyak sumber daya komputasi, sementara algoritme baru dari DeepSeek lebih efisien, mampu mengurangi komputasi yang tidak perlu sambil memastikan peningkatan kinerja model, sehingga mencapai keseimbangan antara kinerja dan biaya.
Inovasi-inovasi ini membentuk sistem teknologi yang lengkap, mengurangi kebutuhan daya komputasi dari pelatihan hingga penalaran di seluruh rantai. Kartu grafis konsumer biasa sekarang juga dapat menjalankan model AI yang kuat, secara signifikan menurunkan ambang batas aplikasi AI, memungkinkan lebih banyak pengembang dan perusahaan untuk terlibat dalam inovasi AI.
Dampak pada Pemasok Chip
Banyak orang berpikir bahwa DeepSeek telah melewati beberapa lapisan teknologi untuk menghindari ketergantungan pada penyedia tertentu. Sebenarnya, DeepSeek melakukan optimasi algoritme langsung melalui lapisan PTX (Parallel Thread Execution). PTX adalah bahasa representasi menengah yang berada di antara kode tingkat tinggi dan instruksi GPU yang sebenarnya, dengan mengoperasikan lapisan ini, DeepSeek dapat mencapai penyesuaian kinerja yang lebih halus.
Dampak ini bagi pemasok chip bersifat ganda, di satu sisi, DeepSeek sebenarnya terikat lebih dalam dengan perangkat keras dan ekosistem terkait, penurunan ambang batas aplikasi AI mungkin memperluas ukuran pasar secara keseluruhan; di sisi lain, optimasi algoritme DeepSeek dapat mengubah struktur permintaan pasar untuk chip kelas atas, beberapa model AI yang sebelumnya memerlukan GPU kelas atas untuk berjalan, sekarang mungkin dapat berjalan secara efisien di kartu grafis kelas menengah bahkan kelas konsumen.
Arti untuk Industri AI
Optimisasi algoritme DeepSeek memberikan jalur terobosan teknologi untuk industri AI. Dalam latar belakang keterbatasan chip high-end, pemikiran "perangkat lunak menggantikan perangkat keras" mengurangi ketergantungan pada chip impor terkemuka.
Di hulu, algoritme yang efisien mengurangi tekanan permintaan daya komputasi, memungkinkan penyedia layanan komputasi untuk memperpanjang siklus penggunaan perangkat keras melalui optimasi perangkat lunak, meningkatkan pengembalian investasi. Di hilir, model sumber terbuka yang telah dioptimalkan mengurangi hambatan pengembangan aplikasi AI. Banyak usaha kecil dan menengah tanpa perlu sumber daya komputasi yang besar juga dapat mengembangkan aplikasi yang kompetitif berdasarkan model DeepSeek, yang akan memunculkan lebih banyak solusi AI di berbagai bidang vertikal.
Dampak Mendalam Web3+AI
Infrastruktur AI terdesentralisasi
Optimasi algoritme DeepSeek memberikan dorongan baru bagi infrastruktur AI Web3, dengan arsitektur inovatif, algoritme yang efisien, dan kebutuhan daya komputasi yang lebih rendah, membuat inferensi AI terdesentralisasi menjadi mungkin. Arsitektur MoE secara alami cocok untuk penerapan terdistribusi, di mana node yang berbeda dapat menyimpan jaringan ahli yang berbeda, tanpa perlu menyimpan model lengkap di satu node, yang secara signifikan mengurangi persyaratan penyimpanan dan komputasi pada satu node, sehingga meningkatkan fleksibilitas dan efisiensi model.
Kerangka pelatihan FP8 selanjutnya mengurangi kebutuhan akan sumber daya komputasi tingkat tinggi, memungkinkan lebih banyak sumber daya komputasi untuk bergabung ke dalam jaringan node. Ini tidak hanya menurunkan ambang partisipasi dalam komputasi AI terdesentralisasi, tetapi juga meningkatkan kemampuan dan efisiensi komputasi seluruh jaringan.
Sistem Multi-Agen
Optimasi Strategi Perdagangan Cerdas: Melalui analisis data pasar real-time, prediksi fluktuasi harga jangka pendek, pelaksanaan perdagangan on-chain, dan pengawasan hasil perdagangan yang beroperasi secara kolaboratif, membantu pengguna mendapatkan keuntungan yang lebih tinggi.
Eksekusi otomatis kontrak pintar: Agen pemantauan kontrak pintar, agen eksekusi kontrak pintar, agen pengawasan hasil eksekusi, dan lain-lain beroperasi secara kolaboratif untuk mencapai otomatisasi logika bisnis yang lebih kompleks.
Manajemen portofolio yang dipersonalisasi: AI membantu pengguna menemukan peluang staking atau penyediaan likuiditas terbaik secara real-time berdasarkan preferensi risiko, tujuan investasi, dan keadaan keuangan pengguna.
DeepSeek adalah inovator yang mencari terobosan melalui inovasi algoritme di bawah batasan daya komputasi, membuka jalur pengembangan yang berbeda untuk industri AI. Mengurangi ambang aplikasi, mendorong integrasi Web3 dan AI, mengurangi ketergantungan pada chip kelas atas, dan memberdayakan inovasi keuangan, dampak-dampak ini sedang membentuk kembali lanskap ekonomi digital. Di masa depan, perkembangan AI tidak lagi hanya menjadi perlombaan daya komputasi, tetapi juga perlombaan optimalisasi kolaboratif antara daya komputasi dan algoritme. Di jalur baru ini, para inovator seperti DeepSeek sedang mendefinisikan kembali aturan permainan dengan kebijaksanaan.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
DeepSeek V3 memimpin inovasi algoritme AI, membentuk kembali masa depan Web3
DeepSeek V3: Inovasi Algoritme di Bidang AI
Baru-baru ini, DeepSeek merilis pembaruan versi V3 terbaru di Hugging Face—DeepSeek-V3-0324, model ini memiliki 6850 miliar parameter, dengan peningkatan signifikan dalam kemampuan kode, desain UI, dan kemampuan inferensi.
Pada konferensi 2025 GTC yang baru saja berakhir, CEO Nvidia, Huang Renxun, memberikan pujian tinggi kepada DeepSeek. Dia menekankan bahwa pandangan pasar sebelumnya yang menganggap model efisien DeepSeek akan mengurangi permintaan chip adalah salah, dan kebutuhan komputasi di masa depan hanya akan semakin meningkat, bukan semakin berkurang.
DeepSeek sebagai produk perwakilan terobosan algoritme, hubungan antara pasokan chip dan produk ini layak untuk dibahas lebih dalam. Mari kita analisis terlebih dahulu arti dari daya komputasi dan algoritme terhadap perkembangan industri AI.
Evolusi Simbiosis Antara Daya Komputasi dan Algoritme
Di bidang AI, peningkatan kekuatan komputasi menyediakan dasar untuk menjalankan algoritme yang lebih kompleks, memungkinkan model untuk memproses lebih banyak data dan mempelajari pola yang lebih rumit; sementara optimasi algoritme dapat memanfaatkan kekuatan komputasi dengan lebih efisien, meningkatkan efisiensi penggunaan sumber daya komputasi.
Keterkaitan antara daya komputasi dan algoritme sedang membentuk kembali pola industri AI:
Diferensiasi jalur teknologi: Beberapa perusahaan mengejar pembangunan kluster kekuatan komputasi yang sangat besar, sementara yang lain fokus pada optimasi efisiensi algoritme, membentuk aliran teknologi yang berbeda.
Rekonstruksi rantai industri: Beberapa perusahaan menjadi pemimpin dalam kekuatan komputasi AI melalui ekosistem, sementara penyedia layanan cloud mengurangi hambatan penerapan melalui layanan komputasi yang fleksibel.
Penyesuaian alokasi sumber daya: Perusahaan mencari keseimbangan antara investasi infrastruktur perangkat keras dan pengembangan algoritme yang efisien.
Kebangkitan Komunitas Sumber Terbuka: Model sumber terbuka seperti DeepSeek, LLaMA, dan lainnya memungkinkan inovasi algoritme dan hasil optimisasi daya komputasi untuk dibagikan, mempercepat iterasi dan difusi teknologi.
Inovasi Teknologi DeepSeek
Keberhasilan DeepSeek tidak terlepas dari inovasi teknologinya. Berikut adalah penjelasan sederhana tentang poin inovasi utamanya:
Optimasi Arsitektur Model
DeepSeek mengadopsi arsitektur kombinasi Transformer+MOE (Mixture of Experts) dan memperkenalkan mekanisme perhatian laten multi-kepala (Multi-Head Latent Attention, MLA). Arsitektur ini seperti tim super, di mana Transformer bertanggung jawab untuk menangani tugas rutin, sementara MOE berfungsi sebagai kelompok ahli dalam tim, di mana setiap ahli memiliki bidang keahlian masing-masing. Ketika menghadapi masalah tertentu, ahli yang paling kompeten akan menangani, sehingga dapat secara signifikan meningkatkan efisiensi dan akurasi model. Mekanisme MLA memungkinkan model untuk lebih fleksibel dalam memperhatikan detail penting yang berbeda saat memproses informasi, yang lebih lanjut meningkatkan kinerja model.
Inovasi Metode Pelatihan
DeepSeek telah mengusulkan kerangka pelatihan presisi campuran FP8. Kerangka ini berfungsi sebagai pengatur sumber daya cerdas, yang dapat secara dinamis memilih presisi komputasi yang sesuai berdasarkan kebutuhan pada berbagai fase selama proses pelatihan. Ketika dibutuhkan komputasi presisi tinggi, ia akan menggunakan presisi yang lebih tinggi untuk memastikan akurasi model; sedangkan ketika presisi yang lebih rendah dapat diterima, ia akan menurunkan presisi, sehingga menghemat sumber daya komputasi, meningkatkan kecepatan pelatihan, dan mengurangi penggunaan memori.
Peningkatan efisiensi inferensi
Pada tahap inferensi, DeepSeek memperkenalkan teknologi Prediksi Multi-token (Multi-token Prediction, MTP). Metode inferensi tradisional dilakukan secara bertahap, di mana setiap langkah hanya memprediksi satu Token. Namun, teknologi MTP dapat memprediksi beberapa Token sekaligus, sehingga secara signifikan mempercepat kecepatan inferensi sekaligus mengurangi biaya inferensi.
Terobosan algoritme pembelajaran penguatan
Algoritme pembelajaran penguatan baru dari DeepSeek, GRPO (Generalized Reward-Penalized Optimization), mengoptimalkan proses pelatihan model. Pembelajaran penguatan seperti memberikan pelatih kepada model, di mana pelatih membimbing model untuk belajar perilaku yang lebih baik melalui hadiah dan hukuman. Algoritme pembelajaran penguatan tradisional dalam proses ini mungkin menghabiskan banyak sumber daya komputasi, sementara algoritme baru dari DeepSeek lebih efisien, mampu mengurangi komputasi yang tidak perlu sambil memastikan peningkatan kinerja model, sehingga mencapai keseimbangan antara kinerja dan biaya.
Inovasi-inovasi ini membentuk sistem teknologi yang lengkap, mengurangi kebutuhan daya komputasi dari pelatihan hingga penalaran di seluruh rantai. Kartu grafis konsumer biasa sekarang juga dapat menjalankan model AI yang kuat, secara signifikan menurunkan ambang batas aplikasi AI, memungkinkan lebih banyak pengembang dan perusahaan untuk terlibat dalam inovasi AI.
Dampak pada Pemasok Chip
Banyak orang berpikir bahwa DeepSeek telah melewati beberapa lapisan teknologi untuk menghindari ketergantungan pada penyedia tertentu. Sebenarnya, DeepSeek melakukan optimasi algoritme langsung melalui lapisan PTX (Parallel Thread Execution). PTX adalah bahasa representasi menengah yang berada di antara kode tingkat tinggi dan instruksi GPU yang sebenarnya, dengan mengoperasikan lapisan ini, DeepSeek dapat mencapai penyesuaian kinerja yang lebih halus.
Dampak ini bagi pemasok chip bersifat ganda, di satu sisi, DeepSeek sebenarnya terikat lebih dalam dengan perangkat keras dan ekosistem terkait, penurunan ambang batas aplikasi AI mungkin memperluas ukuran pasar secara keseluruhan; di sisi lain, optimasi algoritme DeepSeek dapat mengubah struktur permintaan pasar untuk chip kelas atas, beberapa model AI yang sebelumnya memerlukan GPU kelas atas untuk berjalan, sekarang mungkin dapat berjalan secara efisien di kartu grafis kelas menengah bahkan kelas konsumen.
Arti untuk Industri AI
Optimisasi algoritme DeepSeek memberikan jalur terobosan teknologi untuk industri AI. Dalam latar belakang keterbatasan chip high-end, pemikiran "perangkat lunak menggantikan perangkat keras" mengurangi ketergantungan pada chip impor terkemuka.
Di hulu, algoritme yang efisien mengurangi tekanan permintaan daya komputasi, memungkinkan penyedia layanan komputasi untuk memperpanjang siklus penggunaan perangkat keras melalui optimasi perangkat lunak, meningkatkan pengembalian investasi. Di hilir, model sumber terbuka yang telah dioptimalkan mengurangi hambatan pengembangan aplikasi AI. Banyak usaha kecil dan menengah tanpa perlu sumber daya komputasi yang besar juga dapat mengembangkan aplikasi yang kompetitif berdasarkan model DeepSeek, yang akan memunculkan lebih banyak solusi AI di berbagai bidang vertikal.
Dampak Mendalam Web3+AI
Infrastruktur AI terdesentralisasi
Optimasi algoritme DeepSeek memberikan dorongan baru bagi infrastruktur AI Web3, dengan arsitektur inovatif, algoritme yang efisien, dan kebutuhan daya komputasi yang lebih rendah, membuat inferensi AI terdesentralisasi menjadi mungkin. Arsitektur MoE secara alami cocok untuk penerapan terdistribusi, di mana node yang berbeda dapat menyimpan jaringan ahli yang berbeda, tanpa perlu menyimpan model lengkap di satu node, yang secara signifikan mengurangi persyaratan penyimpanan dan komputasi pada satu node, sehingga meningkatkan fleksibilitas dan efisiensi model.
Kerangka pelatihan FP8 selanjutnya mengurangi kebutuhan akan sumber daya komputasi tingkat tinggi, memungkinkan lebih banyak sumber daya komputasi untuk bergabung ke dalam jaringan node. Ini tidak hanya menurunkan ambang partisipasi dalam komputasi AI terdesentralisasi, tetapi juga meningkatkan kemampuan dan efisiensi komputasi seluruh jaringan.
Sistem Multi-Agen
Optimasi Strategi Perdagangan Cerdas: Melalui analisis data pasar real-time, prediksi fluktuasi harga jangka pendek, pelaksanaan perdagangan on-chain, dan pengawasan hasil perdagangan yang beroperasi secara kolaboratif, membantu pengguna mendapatkan keuntungan yang lebih tinggi.
Eksekusi otomatis kontrak pintar: Agen pemantauan kontrak pintar, agen eksekusi kontrak pintar, agen pengawasan hasil eksekusi, dan lain-lain beroperasi secara kolaboratif untuk mencapai otomatisasi logika bisnis yang lebih kompleks.
Manajemen portofolio yang dipersonalisasi: AI membantu pengguna menemukan peluang staking atau penyediaan likuiditas terbaik secara real-time berdasarkan preferensi risiko, tujuan investasi, dan keadaan keuangan pengguna.
DeepSeek adalah inovator yang mencari terobosan melalui inovasi algoritme di bawah batasan daya komputasi, membuka jalur pengembangan yang berbeda untuk industri AI. Mengurangi ambang aplikasi, mendorong integrasi Web3 dan AI, mengurangi ketergantungan pada chip kelas atas, dan memberdayakan inovasi keuangan, dampak-dampak ini sedang membentuk kembali lanskap ekonomi digital. Di masa depan, perkembangan AI tidak lagi hanya menjadi perlombaan daya komputasi, tetapi juga perlombaan optimalisasi kolaboratif antara daya komputasi dan algoritme. Di jalur baru ini, para inovator seperti DeepSeek sedang mendefinisikan kembali aturan permainan dengan kebijaksanaan.