
Agen AI seharusnya menjadi tren besar berikutnya dalam AI, tetapi tidak ada definisi yang tepat tentang apa itu. Sampai saat ini, orang-orang belum dapat sepakat mengenai apa yang sebenarnya merupakan agen AI.
Pada dasarnya, agen AI dapat didefinisikan sebagai perangkat lunak yang didukung AI yang melakukan serangkaian pekerjaan untuk Anda yang sebelumnya mungkin dilakukan oleh agen layanan pelanggan manusia, personel HR, atau karyawan pusat bantuan IT, meskipun pada akhirnya dapat melibatkan tugas apa pun. Anda memintanya untuk melakukan sesuatu, dan ia melakukannya untuk Anda, kadang-kadang menyeberangi beberapa sistem dan jauh melampaui sekadar menjawab pertanyaan.
Tampaknya cukup sederhana, bukan? Namun hal ini menjadi rumit karena kurangnya kejelasan. Bahkan di kalangan raksasa teknologi, belum ada konsensus. Google melihat mereka sebagai asisten berbasis tugas bergantung pada pekerjaan: bantuan pengkodean untuk pengembang; membantu pemasar menciptakan skema warna; membantu seorang profesional TI melacak masalah dengan mengajukan pertanyaan pada data log.
Untuk Asana, seorang agen mungkin berperan seperti karyawan tambahan, mengurus tugas yang ditugaskan seperti rekan kerja yang baik. Sierra, sebuah startup yang didirikan oleh mantan co-CEO Salesforce Bret Taylor dan mantan karyawan Google Clay Bavor, melihat agen sebagai alat pengalaman pelanggan, membantu orang mencapai tindakan yang jauh melampaui chatbot zaman dahulu untuk membantu menyelesaikan serangkaian masalah yang lebih kompleks.
Kurangnya definisi yang koheren ini memunculkan kebingungan akan tugas-tugas apa yang seharusnya dilakukan oleh agen ini, tetapi terlepas dari bagaimana mereka didefinisikan, para agen hadir untuk membantu menyelesaikan tugas secara otomatis dengan interaksi manusia seminimal mungkin.
Rudina Seseri, pendiri dan mitra manajemen di Glasswing Ventures, mengatakan bahwa saat ini masih awal dan hal tersebut dapat menyebabkan ketidaksepakatan. "Tidak ada definisi tunggal tentang apa itu 'agen AI'. Namun, pandangan yang paling sering adalah bahwa agen adalah sistem perangkat lunak cerdas yang dirancang untuk mendeteksi lingkungannya, merenungkan hal itu, membuat keputusan, dan mengambil tindakan untuk mencapai tujuan tertentu secara mandiri," Seseri mengatakan kepada TechCrunch.
Menurutnya, mereka menggunakan sejumlah teknologi AI untuk membuat hal itu terjadi. "Sistem-sistem ini menggabungkan berbagai teknik AI/ML seperti pemrosesan bahasa alami, pembelajaran mesin, dan visi komputer untuk beroperasi di domain-doman dinamis, mandiri atau bersama agen dan pengguna manusia lainnya."
Aaron Levie, salah satu pendiri dan CEO di Box, mengatakan bahwa dari waktu ke waktu, ketika AI semakin mampu, agen AI akan mampu melakukan jauh lebih banyak atas nama manusia, dan sudah ada dinamika yang berpengaruh pada evolusi itu.
"Dengan agen AI, ada beberapa komponen untuk sebuah roda gila yang saling memperkuat yang akan secara signifikan meningkatkan apa yang dapat dicapai oleh Agen AI dalam jangka dekat dan jangka panjang: harga/kinerja GPU, efisiensi model, kualitas model dan kecerdasan, kerangka kerja AI dan peningkatan infrastruktur," Levie menulis di LinkedIn baru-baru ini.
Itu adalah pandangan optimis tentang teknologi yang mengasumsikan pertumbuhan akan terjadi di semua area tersebut, padahal hal tersebut tidak selalu terjadi. Rodney Brooks, pionir robotika MIT, menunjukkan dalam wawancara baru-baru ini dengan TechCrunch bahwa AI harus menghadapi masalah yang jauh lebih sulit daripada kebanyakan teknologi, dan tidak akan tumbuh dengan cepat seperti chip di bawah hukum Moore.
"Ketika seseorang melihat sistem AI melakukan tugas, mereka segera menggeneralisasikannya ke hal-hal yang serupa dan membuat perkiraan tentang kompetensi sistem AI; bukan hanya kinerja pada hal itu, tetapi kompetensi di sekitar hal tersebut," Brooks mengatakan selama wawancara tersebut. "Dan biasanya mereka sangat optimis, dan itu karena mereka menggunakan model kinerja orang pada sebuah tugas."
Masalahnya adalah menyeberangi sistem sulit, dan ini dipersulit oleh kenyataan bahwa beberapa sistem warisan kekurangan akses API dasar. Meskipun kita terus melihat peningkatan yang stabil seperti yang diisyaratkan Levie, membuat perangkat lunak dapat mengakses beberapa sistem sambil menyelesaikan masalah yang mungkin dihadapi di sepanjang jalan bisa lebih rumit dari yang banyak orang pikirkan.
Jika demikian, semua orang mungkin terlalu memperkirakan apa yang seharusnya bisa dilakukan oleh agen AI. David Cushman, pemimpin penelitian di HFS Research, melihat kelompok bot saat ini lebih seperti yang dilakukan Asana: asisten yang membantu manusia menyelesaikan tugas tertentu demi mencapai tujuan strategis yang telah didefinisikan oleh pengguna. Tantangannya adalah membantu mesin menangani kemungkinan yang terjadi secara benar-benar otomatis, dan jelas kita masih jauh dari itu.
"Saya pikir ini langkah selanjutnya," kata dia. "Inilah di mana AI beroperasi secara independen dan efektif dalam skala besar. Jadi di sinilah manusia menetapkan panduan, rel kereta api, dan menerapkan berbagai teknologi untuk mengeluarkan manusia dari lingkaran — ketika semua tentang menjaga manusia di dalam lingkaran dengan GenAI," katanya. Jadi kunci di sini, katanya, adalah membiarkan agen AI mengambil alih dan menerapkan otomatisasi sejati.
Jon Turow, mitra di Madrona Ventures, mengatakan bahwa ini akan memerlukan penciptaan infrastruktur agen AI, rangkaian teknologi yang didesain khusus untuk membuat agen (bagaimanapun Anda mendefinisikannya). Dalam sebuah posting blog terbaru, Turow menjelaskan contoh-contoh agen AI yang saat ini bekerja di dunia dan bagaimana cara pembuatannya saat ini.
Menurut pandangan Turow, peningkatan proliferasi agen AI — dan dia mengakui, juga, bahwa definisinya masih agak kabur — membutuhkan rangkaian teknologi seperti teknologi lainnya. "Semua ini berarti bahwa industri kita masih memiliki pekerjaan untuk melakukan pembangunan infrastruktur yang mendukung agen AI dan aplikasi yang mengandalkan mereka," tulisnya dalam artikelnya.
"Seiring waktu, penalaran secara bertahap akan meningkat, model penelusuran akan datang untuk mengarahkan lebih banyak aliran kerja, dan pengembang ingin fokus pada produk dan data — hal-hal yang membuat mereka berbeda. Mereka menginginkan platform mendasar agar 'bekerja' secara otomatis dengan skala, kinerja, dan kehandalan."
Hal lain yang perlu diingat di sini adalah mungkin akan diperlukan beberapa model, daripada sebuah LLM tunggal, untuk membuat agen bekerja, dan hal ini masuk akal jika Anda memikirkan agen-agen ini sebagai kumpulan tugas yang berbeda. "Saya tidak berpikir saat ini ada satu model bahasa besar tunggal, setidaknya yang tersedia secara publik, model bahasa besar monolitik yang mampu menangani tugas-tugas agen. Saya tidak berpikir bahwa mereka sudah bisa melakukan penalaran multilangkah yang benar-benar membuat saya bersemangat tentang masa depan agen. Saya pikir kita semakin dekat, tetapi belum ada di sana," kata Fred Havemeyer, kepala penelitian AI dan perangkat lunak AS di Macquarie US Equity Research.
"Saya pikir agen-agennya yang paling efektif kemungkinan akan menjadi kumpulan koleksi dari beberapa model yang berbeda dengan lapisan penunjuk yang mengirim permintaan atau dorongan ke agen dan model yang paling efektif. Dan saya pikir itu akan menjadi semacam supervisor menarik, peran delegasi."
Selama ini bagi Havemeyer, industri bergerak menuju tujuan ini dari agen yang beroperasi secara independen. "Saat saya memikirkan masa depan agen, saya ingin melihat dan saya berharap untuk melihat agen yang benar-benar otonom dan mampu mengambil tujuan abstrak dan kemudian merenungkan semua langkah individual di antaranya dengan sepenuhnya independen," katanya kepada TechCrunch.
Namun kenyataannya adalah bahwa kita masih berada dalam periode transisi di mana agen-agennya dikhawatirkan, dan kita tidak tahu kapan kita akan mencapai negara akhir yang digambarkan Havemeyer tersebut. Meskipun apa yang telah kita lihat sejauh ini jelas merupakan langkah yang menjanjikan ke arah yang benar, kita masih memerlukan beberapa kemajuan dan terobosan agar agen AI beroperasi sesuai dengan apa yang sedang dibayangkan saat ini. Dan penting untuk memahami bahwa kita belum sampai di sana.