
Sebuah kelompok pengembang di platform pengembangan AI Hugging Face, termasuk Thomas Wolf, pendiri perusahaan dan ilmuwan utamanya, mengatakan bahwa mereka telah membangun versi 'terbuka' dari alat penelitian mendalam OpenAI.
Penelitian mendalam, yang diungkapkan oleh OpenAI dalam sebuah acara pada hari Minggu, menjelajahi web untuk menyusun laporan penelitian tentang subjek apa pun. Meskipun mengesankan, penelitian mendalam saat ini hanya tersedia dalam pratinjau terbatas bagi pengguna yang berlangganan rencana ChatGPT Pro OpenAI seharga $200 per bulan.
Proyek tim Hugging Face, yang mereka sebut Open Deep Research, terdiri dari model AI - OpenAI's o1 - dan 'kerangka kerja agen' open source yang membantu model merencanakan analisisnya dan membimbingnya untuk menggunakan alat seperti mesin pencari. O1 adalah model eksklusif (yaitu terkunci di balik API berbayar), namun tim mengatakan bahwa model ini memberikan kinerja yang lebih baik daripada model 'terbuka' seperti R1 dari DeepSeek.
Dalam waktu kurang dari 24 jam, para peneliti dapat memanfaatkan o1 untuk menggunakan browser berbasis teks sederhana dan toolkit 'inspektur teks' untuk membaca file di seluruh web. Open Deep Research dapat menjelajahi web secara otomatis, tim mengatakan, gulir melalui halaman, memanipulasi file, dan bahkan menjalankan perhitungan dengan data.
Pada GAIA, sebuah benchmark untuk asisten AI umum, Open Deep Research mencapai skor 54%. Dibandingkan dengan skor penelitian mendalam OpenAI sebesar 67,36%.
Saya mencoba Open Deep Research dalam demo publik yang disiapkan tim - tetapi tidak bisa membuatnya berfungsi. Halaman tersebut sedang dalam beban berat pada saat publikasi; setelah 10 menit, itu mengeluarkan pesan kesalahan.
Namun para peneliti mengatakan bahwa mereka berkomitmen untuk meningkatkan pengalaman tersebut, dan telah membuat kode sumber tersedia di GitHub untuk inspeksi dan umpan balik.
Sedikit, jika ada, model yang mengalahkan o3 dalam benchmark yang terkait dengan menjawab pertanyaan kompleks dan pengumpulan informasi. Tanpa model terbuka yang bisa menyamai o3, alternatif penelitian mendalam mungkin tidak cukup sebanding dengan hal yang sebenarnya.
TechCrunch memiliki buletin berbasis AI! Daftar di sini untuk menerimanya di kotak masuk Anda setiap Rabu.