
Model AI diproduksi dengan cepat oleh semua orang, mulai dari perusahaan Big Tech seperti Google hingga startup seperti OpenAI dan Anthropic. Melacak yang terbaru dapat menjadi sangat membingungkan.
Ketakutan juga disebabkan oleh promosi model AI yang sering didasarkan pada benchmark industri. Tetapi metrik teknis ini seringkali tidak mengungkap banyak hal tentang bagaimana orang dan perusahaan sebenarnya menggunakannya.
Untuk menyaring informasi, TechCrunch telah menyusun ringkasan model AI paling canggih yang dirilis sejak tahun 2024, dengan detail tentang cara menggunakannya dan untuk apa mereka terbaik. Kami akan terus memperbarui daftar ini dengan peluncuran terbaru.
Ada lebih dari satu juta model AI di luar sana: HuggingFace, misalnya, memiliki lebih dari 1,4 juta model. Jadi daftar ini mungkin melewatkan beberapa model yang lebih baik, dengan cara tertentu.
Model AI yang dirilis pada tahun 2025
OpenAI o3-mini
Ini adalah model penalaran terbaru dari OpenAI dan dioptimalkan untuk tugas-tugas yang berhubungan dengan STEM seperti pemrograman, matematika, dan ilmu pengetahuan. Ini bukan model terkuat dari OpenAI tetapi karena ukurannya lebih kecil, perusahaan mengatakan harganya jauh lebih murah. Tersedia secara gratis tetapi memerlukan langganan untuk pengguna berat.
OpenAI Deep Research
Penelitian Mendalam OpenAI dirancang untuk melakukan penelitian mendalam tentang suatu topik dengan kutipan yang jelas. Layanan ini hanya tersedia dengan langganan Pro ChatGPT seharga $200 per bulan. OpenAI merekomendasikannya untuk segala hal mulai dari penelitian ilmiah hingga berbelanja, tetapi harus berhati-hati karena halusinasi tetap menjadi masalah bagi AI.
Mistral Le Chat
Mistral telah meluncurkan versi aplikasi dari asisten pribadi AI multimodal Le Chat. Mistral mengklaim Le Chat merespons lebih cepat daripada chatbot lainnya. Ini juga memiliki versi berbayar dengan berita terbaru dari AFP. Uji dari Le Monde menemukan kinerja Le Chat mengesankan, meskipun melakukan lebih banyak kesalahan daripada ChatGPT.
Operator OpenAI
Operator OpenAI dimaksudkan untuk menjadi asisten pribadi yang dapat melakukan hal-hal secara independen, misalnya membantu Anda membeli bahan makanan. Ini memerlukan langganan ChatGPT pro seharga $200 per bulan. Agen AI menjanjikan banyak hal, tetapi masih dalam tahap percobaan: seorang reviewer Washington Post mengatakan Operator memutuskan untuk memesan satu lusin telur seharga $31 secara otomatis, menggunakan kartu kredit reviewer.
Google Gemini 2.0 Pro Eksperimental
Model andalan Google Gemini yang sangat ditunggu-tunggu mengatakan sangat ahli dalam pemrograman dan pemahaman pengetahuan umum. Ini juga memiliki jendela konteks super panjang 2 juta token, membantu pengguna yang perlu memproses sejumlah besar teks dengan cepat. Layanan ini memerlukan langganan Premium AI Google One seharga $19.99 per bulan sebagai persyaratan minimum.
Model AI yang dirilis pada tahun 2024
DeepSeek R1
Model AI Cina ini menjadi sensasi di Silicon Valley. R1 DeepSeek berperforma baik dalam pemrograman dan matematika, sementara sifat open source-nya berarti siapa pun dapat menjalankannya secara lokal. Selain itu, gratis. Namun, R1 mengintegrasikan sensor pemerintah Cina dan menghadapi larangan yang semakin meningkat karena potensi mengirimkan data pengguna kembali ke Cina.
Gemini Deep Research
Penelitian Mendalam Gemini merangkum hasil pencarian Google dalam dokumen yang sederhana dan tercatat dengan baik. Layanan ini berguna bagi mahasiswa dan siapa pun yang membutuhkan ringkasan penelitian yang cepat. Namun, kualitasnya tidak sebaik makalah yang benar-benar diulas oleh rekan sejawat. Penelitian Mendalam memerlukan langganan Premium AI Google One seharga $19,99.
Meta Llama 3.3 7B
Ini adalah versi terbaru dan paling canggih dari model AI terbuka Meta Llama. Meta memuji versi ini sebagai yang termurah dan paling efisien, terutama untuk matematika, pengetahuan umum, dan mengikuti instruksi. Gratis dan open source.
OpenAI Sora
Sora adalah model yang menciptakan video realistis berdasarkan teks. Meskipun dapat menghasilkan cuplikan seluruh adegan daripada hanya klip, OpenAI mengakui sering menghasilkan "fisika yang tidak realistis". Saat ini hanya tersedia dalam versi berbayar ChatGPT, dimulai dengan Plus seharga $20 per bulan.
Alibaba Qwen QwQ-32B-Pratinjau
Model ini adalah salah satu dari sedikit model yang menyaingi OpenAI o1 pada beberapa benchmark industri tertentu, unggul dalam matematika dan pemrograman. Ironisnya untuk model 'pemikiran,' model ini "berpotensi untuk perbaikan dalam penalaran akal sehat," kata Alibaba. Ini juga menggabungkan sensor sensor pemerintah Cina, tes TechCrunch menunjukkan. Gratis dan open source.
Penggunaan Komputer Anthropic
Penggunaan Komputer Claude dimaksudkan untuk mengambil alih komputer Anda untuk menyelesaikan tugas seperti pemrograman atau memesan tiket pesawat, menjadikannya pendahulu dari Operator OpenAI. Namun, penggunaan komputer masih dalam beta. Harga melalui API: $0.80 per juta token input, dan $4 per juta token output.
Grok 2 x.AI
x.AI, perusahaan AI yang dimiliki oleh Elon Musk, telah meluncurkan versi unggulan dari chatbot andalannya Grok 2 yang diklaim "tiga kali lebih cepat." Pengguna gratis dibatasi hingga 10 pertanyaan setiap dua jam di Grok, sementara pelanggan langganan Premium dan Premium+ X menikmati batas penggunaan yang lebih tinggi. x.AI juga meluncurkan pembuat gambar, Aurora, yang menghasilkan gambar yang sangat fotorealistik, termasuk beberapa konten grafis atau kekerasan.
o1 OpenAI
Keluarga o1 OpenAI dimaksudkan untuk menghasilkan jawaban yang lebih baik dengan "memikirkan" respon melalui fitur penalaran tersembunyi. Model ini unggul dalam pemrograman, matematika, dan keamanan, klaim OpenAI, tetapi memiliki masalah dalam menipu manusia juga. O1 memerlukan langganan ChatGPT Plus, yang seharga $20 per bulan.
Claude Sonnet 3.5 Anthropic
Claude Sonnet 3.5 adalah model yang diklaim Anthropic sebagai yang terbaik di kelasnya. Model ini dikenal karena kemampuan pemrogramannya dan dianggap sebagai chatbot pilihan insdier teknologi. Model ini dapat diakses secara gratis di Claude meskipun pengguna berat akan memerlukan langganan Pro bulanan seharga $20. Meskipun dapat memahami gambar, model ini tidak dapat menghasilkannya.
GPT 4o-mini OpenAI
OpenAI telah mempromosikan GPT 4o-mini sebagai model paling terjangkau dan paling cepat yang pernah ada berkat ukurannya yang kecil. Didesain untuk memungkinkan sejumlah tugas seperti memberdayakan chatbot layanan pelanggan. Model ini tersedia pada tingkat gratis ChatGPT. Lebih cocok untuk tugas-tugas sederhana dalam volume tinggi dibandingkan dengan yang lebih kompleks.
Cohere Command R+
Model R+ Perintah Cohere mempunyai keunggulan dalam aplikasi Recovery-Augmented Generation (atau RAG) yang kompleks untuk perusahaan. Ini berarti dapat menemukan dan mengutip informasi tertentu dengan sangat baik. (Pencipta RAG sebenarnya bekerja di Cohere.) Namun, RAG tidak sepenuhnya menyelesaikan masalah halusinasi AI.