
17 Fakta Menarik Tentang DeepSeek, AI China Terbaru Pesaing ChatGPT
DeepSeek kini menjadi perbincangan karena kemampuannya menantang dominasi teknologi kecerdasan buatan dari AS. AI buatan perusahaan China ini memiliki banyak kesamaan dengan ChatGPT dari OpenAI, Gemini dari Google, dan Claude dari Anthropic. DeepSeek juga mampu memahami serta merespons berbagai perintah pengguna dengan format yang serupa dengan chatbot AI lainnya.
Namun, yang membedakan DeepSeek dari model AI lainnya adalah efisiensi dalam pengembangannya. Dengan model terbarunya, DeepSeek berpotensi menjadi lebih cerdas dari ChatGPT namun dengan biaya pengembangan yang lebih murah, menjadikannya tantangan bagi dominasi AI dari AS. Berikut ini adalah beberapa fakta menarik seputar AI DeepSeek dari China yang perlu kamu ketahui.
1. Masih Berusia Muda
Sebagai pengembang model AI, DeepSeek masih tergolong sangat muda, dengan usia sekitar dua tahun. Startup AI ini berbasis di Hangzhou, Zhejiang, China, dan didirikan pada tahun 2023 yang lalu.
2. Didirikan oleh Liang Wenfeng
DeepSeek lahir dari inisiatif High Flyer, sebuah hedge fund asal China, dan dipimpin oleh Liang Wenfeng. Wenfeng, yang lahir pada tahun 1985 di Zhanjiang, Provinsi Guangdong, China, merupakan lulusan Teknik Informasi Elektronik dari Zhejiang University.
Meskipun model AI yang dikembangkannya masih tergolong baru, Wenfeng optimis bahwa DeepSeek dapat mendorong kemajuan China dalam inovasi teknologi AI.
Seperti pengembang AI lainnya, ia memiliki visi jangka panjang untuk menciptakan model AI yang mampu mencapai tingkat Artificial General Intelligence (AGI), yakni AI dengan kecerdasan mirip manusia.
3. Mengungguli ChatGPT di App Store
DeepSeek kini tersedia dalam berbagai format, termasuk sebagai aplikasi mobile. Pada Senin (26/1/2025), aplikasi DeepSeek untuk perangkat seluler berhasil menduduki peringkat teratas dalam kategori aplikasi gratis di App Store di 111 negara. Lonjakan popularitasnya sangat signifikan, mengingat beberapa hari sebelumnya DeepSeek masih berada di posisi ke-31.
Di App Store, DeepSeek bahkan melampaui peringkat aplikasi sejenis seperti ChatGPT. Berdasarkan data dari Appfigures, DeepSeek juga meraih posisi teratas dalam daftar aplikasi gratis di Google Play Store di 18 negara.
4. Memiliki Dua Model AI
Sejak berdiri pada 2023, DeepSeek telah mengembangkan beberapa model AI yang juga diberi nama "DeepSeek." Dua model terbaru yang mereka rilis adalah DeepSeek V3 dan DeepSeek R-1.
DeepSeek V3, yang diluncurkan pada Desember 2024, adalah model berbasis Mixture-of-Experts (MoE) dengan total 671 miliar parameter, tetapi hanya 37 miliar parameter yang diaktifkan per token saat inferensi, menjadikannya sangat efisien.
Model ini dapat menangani jendela konteks hingga 128.000 token dan menghasilkan output hingga 8.000 token, cocok untuk berbagai tugas seperti menjawab pertanyaan sehari-hari dan pembuatan konten kreatif.
Sementara itu, DeepSeek R-1, yang dirilis pada 20 Januari 2025, menarik perhatian publik karena kecerdasannya yang lebih unggul. Dikembangkan berdasarkan DeepSeek V3, model ini memiliki kemampuan bernalar yang ditingkatkan berkat penerapan reinforcement learning.
DeepSeek R-1 mampu menunjukkan proses berpikir sebelum menghasilkan kesimpulan serta menyelesaikan masalah kompleks dengan lebih baik. Selain itu, kapasitas outputnya lebih besar dibanding DeepSeek V3, yakni hingga 32.000 token.
5. Lahir di Tengah Pembatasan Ekspor Chip AI dari AS
DeepSeek muncul di tengah kebijakan pembatasan ekspor chip AI yang diterapkan oleh Amerika Serikat. Saat ini, industri AI masih dikuasai oleh AS, dengan sebagian besar chip AI diproduksi oleh perusahaan-perusahaan besar seperti Nvidia.
Pada pertengahan Januari lalu, pemerintah AS menetapkan regulasi baru yang memperketat pengawasan terhadap ekspor chip AI dari raksasa industri seperti Nvidia dan AMD ke pasar global.
Kebijakan ini bertujuan untuk mengendalikan distribusi teknologi AI canggih, terutama ke negara-negara di luar sekutu dan mitra AS, serta mempertahankan dominasi AS dalam persaingan AI global.
Selain itu, aturan ini juga menyederhanakan proses perizinan ekspor, menutup celah penyelundupan, dan menerapkan standar keamanan baru guna mencegah teknologi tersebut jatuh ke pihak yang tidak diinginkan.
Selain itu, regulasi baru ini membatasi ekspor chip AI ke negara-negara yang dianggap berpotensi mengancam keamanan nasional AS, seperti China, Rusia, Iran, dan Korea Utara. Akibatnya, DeepSeek mengalami kesulitan dalam memperoleh chip AI terbaru dan berteknologi tinggi.
6. 10 Kali Lebih Murah Dibanding ChatGPT
Pengembangan DeepSeek berlangsung lebih efisien dalam hal waktu dan biaya dibandingkan GPT-4, model AI populer yang digunakan dalam ChatGPT buatan OpenAI.
DeepSeek-R1 hanya memerlukan sekitar dua bulan pelatihan dengan biaya sekitar 6 juta dolar AS (sekitar Rp 97 miliar), atau 10 kali lebih murah dibandingkan ChatGPT.
Sebagai perbandingan, pengembangan GPT-4 memakan biaya sekitar 63 juta dolar AS (sekitar Rp 1 triliun) dan membutuhkan waktu beberapa bulan hingga satu tahun.
7. Hanya Menggunakan Chip Nvidia H800
Pengembangan DeepSeek lebih hemat biaya karena dilatih menggunakan GPU yang lebih terjangkau, yaitu Nvidia H800. Sebaliknya, GPT-4o dikembangkan dengan chipset Nvidia H100, yang memiliki spesifikasi lebih tinggi dan harga lebih mahal.
AI buatan China seperti DeepSeek tidak dapat mengakses chip AI terbaru seperti Nvidia H100 karena adanya pembatasan ekspor yang diterapkan oleh AS, terutama terhadap negara-negara yang dianggap berisiko, seperti China.
Selain menggunakan chip yang lebih murah, jumlah GPU yang digunakan untuk melatih DeepSeek juga lebih efisien. DeepSeek hanya memanfaatkan 2.048 unit GPU Nvidia H800, sedangkan pelatihan GPT-4 dapat melibatkan puluhan ribu unit Nvidia H100.
8. Lebih Efisien dan Optimal dalam Penggunaan Sumber Daya
DeepSeek menerapkan pendekatan teknologi inovatif untuk meningkatkan efisiensi dan kinerja model AI mereka. Dalam pengembangannya, DeepSeek menggunakan metode Mixture-of-Experts (MoE) dan Chain of Thought (CoT).
MoE adalah arsitektur yang memungkinkan model besar seperti DeepSeek V3, yang memiliki total 671 miliar parameter, hanya mengaktifkan 37 miliar parameter saat memproses setiap token. Dengan cara ini, penggunaan sumber daya menjadi lebih hemat tanpa mengurangi performa.
Selain itu, DeepSeek-R1 dilatih dengan teknik Chain of Thought (CoT), yang memecah pertanyaan kompleks menjadi langkah-langkah kecil sebelum memberikan jawaban akhir. Pendekatan ini tidak hanya meningkatkan logika dan akurasi dalam respons, tetapi juga membantu model mengidentifikasi serta memperbaiki kesalahan logika atau halusinasi data selama proses berpikirnya.
9. Unggul dalam Berbagai Platform Benchmark
Meskipun dikembangkan dengan biaya yang lebih efisien, kemampuan DeepSeek tetap mengesankan. Model AI asal China ini diklaim mampu melampaui performa beberapa model AI terkemuka lainnya, seperti Claude dari Anthropic, Llama dari Meta, dan GPT dari OpenAI, dalam berbagai benchmark.
Misalnya, dalam uji pemahaman konteks (DROP, 3-shot F1), DeepSeek V3 memperoleh skor 91,6 poin, lebih tinggi dibandingkan Llama 3.1 (88,7), Claude 3.5 (88,3), dan GPT-4o (83,7).
Selain itu, dalam penyelesaian soal matematika tingkat internasional, seperti AIME 2024, MATH-500, dan CNMO 2024, DeepSeek V3 mencatat skor masing-masing sebesar 39,2, 90,2, dan 43,2 poin.
Sebagai perbandingan, skor pada benchmark yang sama untuk Llama 3.1 adalah 23,3, 73,8, dan 6,8 poin; Claude 3.5 memperoleh 16,0, 78,3, dan 13,1 poin; sementara GPT-4o mendapatkan 9,3, 74,6, dan 10,8 poin.
DeepSeek juga mengklaim bahwa DeepSeek-R1 dapat bersaing dan bahkan melampaui model AI terbaru dari OpenAI, yaitu OpenAI O1, dalam berbagai benchmark, termasuk uji pemahaman konteks dan pemecahan masalah matematika.
10. Mengandalkan Talenta Lokal
Pengembangan DeepSeek sepenuhnya dilakukan oleh talenta muda dalam negeri. Wenfeng menegaskan bahwa inovasi AI tidak harus bergantung pada tenaga ahli dari luar China. Seluruh karyawan DeepSeek berasal dari dalam negeri, dengan mayoritas merupakan lulusan baru dari universitas terkemuka di China serta talenta muda berpengalaman di bidang AI.
Wenfeng juga menyadari bahwa saat ini mungkin belum banyak ahli AI dalam negeri yang setara dengan talenta global. Namun, ia berkomitmen untuk membina dan mengembangkan kemampuan mereka agar dapat bersaing di tingkat internasional.
11. DeepSeek Dibuat Open Source
Meskipun memiliki kemampuan yang mampu bersaing dengan model AI populer lainnya, DeepSeek tetap mengusung pendekatan terbuka. DeepSeek R-1 dikembangkan sebagai proyek open source, berbeda dengan ChatGPT yang bersifat close source. Dengan model pengembangan ini, kode DeepSeek R-1 dapat diakses, digunakan, dan dimodifikasi oleh siapa saja.
Pendekatan terbuka ini memungkinkan komunitas pengembang di seluruh dunia untuk berkontribusi dalam penyempurnaan dan pengembangan DeepSeek, sehingga mempercepat pertumbuhan dan evolusi model AI ini.
12. Buat Saham Perusahaan Teknologi AS Anjlok
Kehadiran DeepSeek menjadi sinyal bagi AS bahwa dominasinya dalam industri AI mungkin tidak akan bertahan lama. Peluncuran model AI terbaru DeepSeek pada 20 Januari lalu berdampak signifikan pada pasar saham, terutama bagi perusahaan teknologi AS.
Pada Senin (27/1/2025), saham perusahaan teknologi AS mengalami penurunan tajam. Saham Nvidia (NVDA), sebagai pemasok utama chip AI, merosot hampir 17 persen, menyebabkan hilangnya nilai pasar sebesar 588,8 miliar dolar AS.
Ini menjadi rekor kehilangan nilai pasar tertinggi dalam satu hari, melampaui rekor sebelumnya yang dicetak Meta hampir tiga tahun lalu dengan penurunan sebesar 240 miliar dolar AS.
Tak hanya Nvidia, saham perusahaan teknologi lain seperti Meta (META) dan Alphabet (GOOGL) juga mengalami penurunan signifikan. Selain itu, saham Oracle (ORCL), Vertiv, Constellation, NuScale, serta perusahaan pusat data lainnya ikut anjlok.
13. Membuat Pasar Meragukan Kemampuan Teknologi AS
Keith Lerner, analis investasi di lembaga keuangan Truist, menyatakan bahwa kehadiran DeepSeek telah membuat pasar meragukan kemampuan perusahaan-perusahaan AS dalam industri teknologi AI, yang sebelumnya selalu dianggap unggul.
Lerner menyatakan bahwa peluncuran model DeepSeek membuat investor meragukan keunggulan yang dimiliki perusahaan-perusahaan AS, serta mempertanyakan sejauh mana pengeluaran mereka dan apakah pengeluaran tersebut akan menghasilkan laba atau justru menjadi pemborosan.
Di sisi lain, Charu Chanana, kepala strategi investasi di Saxo, berpendapat bahwa dengan pengembangan yang lebih efisien, DeepSeek yang semakin berkembang berpotensi menarik minat investor, karena terlihat mampu memberikan pertumbuhan yang menjanjikan.
14. Membuat Investor Kripto Menjual Aset Secara Massal
Selain mempengaruhi pasar saham, kehadiran DeepSeek juga berdampak pada pasar kripto. Pada Senin (27/1/2025), harga Bitcoin sempat turun 7 persen, mencapai di bawah 98.000 dolar AS (sekitar Rp 1,58 miliar) per keping.
Platform analisis kripto Coinglass melaporkan bahwa pada hari tersebut, investor secara massal menjual aset kripto mereka, dengan total likuidasi mencapai 861,48 juta dolar AS (sekitar Rp 13,9 triliun).
Pakar kripto menyebutkan bahwa aksi jual besar-besaran ini terkait dengan kehadiran DeepSeek yang menyebabkan saham-saham teknologi yang dianggap overvalued mengalami penilaian ulang.
15. Membuat AS Waspada
Kehadiran DeepSeek dari China membuat pemerintah AS waspada terhadap dampak yang ditimbulkan. Sekretaris Pers Gedung Putih, Karoline Leavitt, mengonfirmasi bahwa pejabat AS tengah mengevaluasi potensi ancaman dari model AI tersebut.
Kekhawatiran muncul terkait teknik distilasi yang digunakan, memicu pembicaraan tentang perlunya langkah lebih ketat untuk mencegah penyalahgunaan teknologi AI AS. Perusahaan teknologi AS juga semakin waspada terhadap DeepSeek, dengan CEO Microsoft, Satya Nadella, mengingatkan perusahaan AI untuk berhati-hati.
Meta, yang juga mengembangkan model AI Llama, dilaporkan sedang merencanakan analisis terhadap teknologi DeepSeek. Meta tertarik untuk menyelidiki bagaimana DeepSeek dapat memangkas biaya pengembangan dan data yang digunakan dalam proses pengembangannya.
16. Disambut Baik oleh Trump dan Bos ChatGPT
Meski ada kekhawatiran dari beberapa pihak di AS, sejumlah tokoh penting justru menyambut positif kehadiran DeepSeek, AI dari China. Presiden Donald Trump dan CEO ChatGPT, Sam Altman, termasuk di antara mereka yang mengapresiasi hadirnya DeepSeek.
Trump menyatakan bahwa DeepSeek bisa menjadi peringatan bagi perusahaan-perusahaan AS untuk meningkatkan daya saing mereka. Menurutnya, AI China yang lebih cerdas dan hemat biaya ini merupakan hal yang positif.
Dengan pandangan serupa, Altman juga menilai bahwa DeepSeek memberikan dorongan positif dalam kompetisi AI. Kehadirannya mendorong OpenAI untuk menghasilkan model yang lebih baik.
17. Menciptakan AI Image Generator Janus Pro
Di tengah popularitas DeepSeek R-1, DeepSeek baru saja meluncurkan model AI baru yang mampu menghasilkan gambar secara multimodal, baik dari perintah teks maupun gambar, yang dikenal sebagai AI Image Generator. Sebelumnya, DeepSeek R-1 dan DeepSeek V-3 tidak memiliki kemampuan untuk menghasilkan gambar dari teks dan gambar.
Model AI Image Generator terbaru dari DeepSeek ini dinamakan Janus Pro. Janus Pro diklaim dapat mengalahkan model AI serupa seperti DALL-E 3 dari OpenAI (induk dari ChatGPT) dan Stable Diffusion. Saat ini, Janus Pro sudah tersedia untuk diunduh melalui platform AI Hugging Face.
Itulah 17 fakta menarik seputar DeepSeek, AI China terbaru yang menjadi pesaing ChatGPT. Dengan kemajuan teknologinya yang efisien dan biaya pengembangan yang lebih rendah, DeepSeek telah menarik perhatian global dan menjadi tantangan serius bagi dominasi AI dari Amerika Serikat. Meskipun baru muncul, DeepSeek berpotensi mengubah peta industri AI dengan pendekatan open-source dan inovasi yang dapat mempercepat evolusi teknologi AI secara signifikan.
Jangan lupa cek @felixindo di Instagram untuk insight lebih lanjut tentang DeepSeek dan perkembangan terbaru dalam teknologi AI.
Leave Your Comment