
Mengikuti perkembangan industri yang begitu cepat seperti AI adalah tugas yang sulit. Jadi sampai AI bisa melakukannya untuk Anda, berikut adalah rangkuman praktis dari cerita-cerita terbaru di dunia machine learning, bersama dengan riset dan eksperimen penting yang tidak kami bahas secara terpisah.
Oh ya, TechCrunch berencana untuk segera meluncurkan newsletter AI. Tunggu saja. Sementara itu, kami meningkatkan kecepatan kolom AI kami yang biasanya dua kali sebulan menjadi mingguan — jadi perhatikan terus untuk edisi-edisi lebih lanjut.
Pekan ini di dunia AI, OpenAI mengumumkan bahwa mereka mencapai kesepakatan dengan News Corp, raksasa penerbitan baru, untuk melatih model AI generatif yang dikembangkan OpenAI pada artikel dari merek-merek News Corp termasuk The Wall Street Journal, Financial Times, dan MarketWatch. Kesepakatan tersebut, yang perusahaan sebut sebagai "multi-tahun" dan "sejarah", juga memberikan hak kepada OpenAI untuk menampilkan masthead News Corp dalam aplikasi seperti ChatGPT sebagai respons terhadap pertanyaan tertentu — mungkin dalam kasus di mana jawabannya sebagian atau seluruhnya bersumber dari publikasi News Corp.
Terdengar seperti kemenangan bagi kedua belah pihak, bukan? News Corp mendapatkan suntikan uang untuk kontennya — lebih dari $250 juta, dilaporkan — pada saat prospek industri media lebih suram dari biasanya. (AI generatif tidak membantu masalah ini, mengancam untuk sangat mengurangi lalu lintas rujukan publikasi.) Sementara itu, OpenAI, yang sedang berperang dengan pemilik hak cipta dalam sejumlah sengketa penggunaan yang adil, memiliki satu pertempuran pengadilan yang lebih sedikit untuk dikhawatirkan.
Namun setan ada di detailnya. Perhatikan bahwa kesepakatan News Corp memiliki tanggal berakhir — seperti halnya semua kesepakatan lisensi konten OpenAI.
Itu sendiri bukanlah tindakan jahat dari OpenAI. Lisensi selamanya adalah hal yang jarang terjadi dalam media, mengingat motivasi semua pihak yang terlibat untuk tetap terbuka bagi negosiasi kembali kesepakatan. Namun, ini sedikit mencurigakan mengingat komentar CEO OpenAI, Sam Altman, baru-baru ini tentang menurunnya pentingnya data pelatihan model AI.
Dalam penampilan di podcast "All-In", Altman mengatakan bahwa ia "pasti [tidak] berpikir akan ada perlombaan senjata untuk data latihan" karena "ketika model menjadi cukup pintar, pada suatu titik, itu tidak harus tentang lebih banyak data — setidaknya bukan untuk pelatihan." Di tempat lain, ia mengatakan kepada James O'Donnell dari MIT Technology Review bahwa ia "optimis" bahwa OpenAI — dan/atau industri AI secara lebih luas — akan "menemukan jalan keluar dari [perlu] lebih dan lebih data pelatihan."
Model-model belum begitu "pintar", sehingga OpenAI dilaporkan sedang bereksperimen dengan data latihan sintetis dan menyelami jauh ke web — dan YouTube — untuk sumber organik. Tetapi mari kita asumsikan suatu hari mereka tidak membutuhkan banyak data tambahan untuk meningkatkan secara besar-besaran. Di mana itu meninggalkan penerbit, terutama setelah OpenAI menggarap seluruh arsip mereka?
Poin yang ingin saya sampaikan adalah bahwa penerbit — dan pemilik konten lainnya dengan siapa OpenAI bekerja — tampaknya menjadi mitra jangka pendek yang nyaman, tidak lebih dari itu. Melalui kesepakatan lisensi, OpenAI efektif menetralisir ancaman hukum — setidaknya sampai pengadilan menentukan bagaimana penggunaan wajar berlaku dalam konteks pelatihan AI — dan mendapatkan kesempatan untuk merayakan kemenangan PR. Penerbit mendapatkan modal yang sangat dibutuhkan. Dan kerja di bidang AI yang mungkin sangat merugikan penerbit-penerbit tersebut terus berlanjut.
Berikut adalah beberapa cerita AI lain yang menarik dari beberapa hari terakhir:
- DJ AI Spotify: Penambahan fitur AI DJ Spotify, yang memperkenalkan pilihan lagu yang dipersonalisasi kepada pengguna, adalah langkah pertama perusahaan menuju masa depan AI. Sekarang, Spotify sedang mengembangkan versi alternatif dari DJ tersebut yang akan berbicara bahasa Spanyol.
- Dewan Penasehat AI Meta: Meta pada hari Rabu mengumumkan pembentukan dewan penasehat AI. Namun, ada masalah besar: hanya pria kulit putih yang ada di dalamnya.
- FCC mengusulkan pengungkapan AI: Komisi Komunikasi Federal (FCC) telah mengemukakan persyaratan bahwa konten yang dihasilkan AI harus diungkapkan dalam iklan politik — namun tidak dilarang.
- Menanggapi panggilan dalam suara Anda: Truecaller, layanan identifikasi panggilan yang sangat dikenal, akan segera memungkinkan pelanggan menggunakan asisten AI-nya untuk menjawab panggilan telepon dengan suara mereka sendiri, berkat kemitraan baru dengan Microsoft.
- Humane mempertimbangkan penjualan: Humane, perusahaan di balik Ai Pin yang diluncurkan dengan ulasan kurang memuaskan bulan lalu, sedang mencari pembeli. Perusahaan itu dikabarkan menetapkan harga antara $750 juta dan $1 miliar, dan proses penjualan masih dalam tahap awal.
- TikTok beralih ke generative AI: TikTok adalah perusahaan teknologi terbaru yang menggabungkan generative AI ke dalam bisnis iklannya.
- Pertemuan AI Seoul: Dalam pertemuan keselamatan AI di Seoul, Korea Selatan, pejabat pemerintah dan eksekutif industri AI sepakat untuk menerapkan langkah-langkah keselamatan dasar di lapangan yang bergerak cepat ini dan mendirikan jaringan penelitian keamanan internasional.
- PC AI Microsoft: Pada sepasang keynote selama konferensi pengembang tahunan Build-nya minggu ini, Microsoft mengungkapkan jajaran mesin Windows baru (dan laptop Surface) yang disebut Copilot+ PCs, ditambah fitur-fitur yang didukung AI generatif untuk membantu pengguna menemukan aplikasi, file, dan konten lain yang pernah mereka lihat di masa lalu.
- Kekecewaan suara OpenAI: OpenAI akan menghapus salah satu suara dalam fitur text-to-speech ChatGPT-nya. Pengguna menemukan suara itu, bernama Sky, mirip dengan Scarlett Johansson (yang telah memerankan karakter AI sebelumnya) — dan Johansson sendiri merilis pernyataan mengatakan bahwa dia telah mengontrak penasihat hukum untuk menanyakan tentang suara Sky dan mendapatkan detail yang tepat tentang bagaimana suara itu dikembangkan.
- Hukum mengemudi otonom Inggris: Regulasi Inggris untuk mobil otonom kini resmi setelah menerima persetujuan kerajaan, cap jempol terakhir yang harus dilalui setiap undang-undang sebelum menjadi hukum.
Pelajaran mesin lainnya
Beberapa penelitian terkait AI yang menarik untuk Anda minggu ini. Peneliti produktif dari University of Washington, Shyan Gollakota, kembali berhasil dengan sepasang headphone noise-canceling yang dapat Anda minta untuk memblokir segalanya kecuali orang yang ingin Anda dengarkan. Saat menggunakan headphone tersebut, Anda menekan tombol sambil melihat orang tersebut, dan headphone akan menyaring suara yang berasal dari arah tertentu tersebut.
Para peneliti, yang dipimpin oleh Gollakota dan beberapa mahasiswa pascasarjana, menyebut sistem tersebut sebagai Target Speech Hearing, dan mempresentasikannya minggu lalu di konferensi di Honolulu. Berguna sebagai alat aksesibilitas dan pilihan sehari-hari, ini jelas merupakan fitur yang bisa Anda lihat salah satu perusahaan teknologi besar mencuri untuk generasi selanjutnya dari headphone premium.
Para ahli kimia di EPFL jelas sudah lelah melakukan 18 tugas tertentu, karena mereka telah melatih model bernama ChemCrow untuk melakukannya. Bukan hal-hal nyata seperti titrasi dan pipet, tetapi perencanaan pekerjaan seperti menyaring literatur dan merencanakan rantai reaksi. ChemCrow tidak hanya melakukannya semua untuk para peneliti, tentu saja, tetapi bertindak lebih sebagai antarmuka bahasa alami untuk seluruh set tersebut, menggunakan opsi pencarian atau perhitungan yang diperlukan.
Penulis utama makalah yang memamerkan ChemCrow mengatakan bahwa itu “analog dengan seorang ahli manusia dengan akses ke kalkulator dan database,” dengan kata lain mahasiswa pascasarjana, sehingga semoga mereka dapat bekerja pada sesuatu yang lebih penting atau melewatkan bagian yang membosankan. Mengingatkan saya sedikit pada CoScientist. Tentang nama, ini “karena gagak dikenal menggunakan alat dengan baik.” Cukup baik!
Roboticist Disney Research sedang bekerja keras membuat kreasi mereka bergerak lebih realistis tanpa harus menganimasikan setiap kemungkinan gerakan secara manual. Sebuah makalah baru yang akan mereka presentasikan di SIGGRAPH bulan Juli menunjukkan kombinasi animasi yang dihasilkan prosedural dengan antarmuka seniman untuk meningkatkannya, semuanya bekerja pada robot bipedal (Groot).
Idenya adalah Anda dapat membiarkan seniman menciptakan jenis pergerakan — melompat, kaku, tidak stabil — dan para insinyur tidak harus mengimplementasikan setiap detail, hanya memastikan bahwa itu berada dalam parameter tertentu. Itu kemudian dapat dilakukan dengan cepat, dengan sistem yang diusulkan secara efektif berimprovisasi gerakan tepatnya. Diharapkan akan melihat ini dalam beberapa tahun di Disney World...