
Berita & Pembaruan AI – 20 Juni
Yang Terbaru dalam Suara AI, Agen, Video, dan Alat Perusahaan
Selamat datang di penyelaman mendalam AI minggu ini — rangkuman cepat Anda tentang pembaruan paling berdampak di dunia AI. Dari suara AI yang bernuansa emosional dan agen otomatisasi nyata hingga terobosan dalam video yang dihasilkan AI dan integrasi tingkat perusahaan, inilah yang penting dan mengapa.
🔊 11 Labs V3: Suara AI yang Terdengar Manusiawi
Model 11 Labs V3 baru sudah tersedia dalam alfa publik dan mendefinisikan ulang pidato yang dihasilkan AI.
- Kini mendukung 70+ bahasa, mencakup 90% populasi global.
- Memungkinkan pengguna menyematkan tag emosi (seperti bersemangat, berbisik) langsung dalam teks.
- Dibangun dari awal dengan fokus pada pasar profesional: film, buku audio, game.
- API multi-pembicara baru memungkinkan percakapan dan dialog yang lebih alami.
- V3 belum real-time, tetapi model Turbo V2.5 yang lebih lama direkomendasikan untuk saat ini.
- Saat ini menawarkan diskon 80% untuk paket swalayan hingga Juni 2025.
🤖 Agen AI: Runner H oleh H Company
Runner H membuat gelombang dengan agen AI yang benar-benar melakukan tugas di web.
- Didukung oleh Hollow1, model bahasa visual dengan 3 miliar parameter.
- Memahami tata letak halaman web — mengklik tombol, mengisi formulir, memesan perjalanan.
- Mengungguli pesaing dalam tolok ukur WebVoyager dengan keberhasilan 67%.
- Bekerja di berbagai platform: Gmail, Notion, Slack, Zapier, dll.
- Dalam beta publik dan gratis untuk dicoba sekarang.
🎬 Video AI Sedang Berkembang Pesat
Tiga pendekatan berbeda untuk video AI semakin populer:
1. Google DeepMind V3
- Menghasilkan video pendek berkualitas tinggi dari teks atau gambar.
- Termasuk audio terintegrasi, konsistensi karakter, dan kontrol kamera.
- Kini tersedia di Leonardo.ai dan aplikasi Gemini, tersedia di 73 negara.
2. Mirage Studio (Captions AI)
- Membangun aktor AI yang sangat realistis dari perintah teks atau gambar referensi.
- Berfokus pada konten pemasaran — menjanjikan untuk mengurangi waktu produksi hingga 90%.
3. HeyGen AI Studio
- Dibuat untuk kontrol halus atas avatar AI dan pengeditan video.
- Menawarkan pencerminan suara, pemetaan gerakan, dan arah kinerja bahasa alami.
- Diluncurkan dengan avatar mereka yang paling hidup.
🧠 Platform AI Semakin Mendalam
Google Gemini 2.5 Pro
- Kini memimpin di papan peringkat WebDev Arena untuk membangun aplikasi dari perintah.
- Anggaran berpikir baru memungkinkan pengembang mengontrol penggunaan komputasi dan biaya.
- Tersedia melalui Google AI Studio dan Vertex AI.
Dorongan Enterprise OpenAI
- Meluncurkan ChatGPT Connectors untuk mengakses data perusahaan pribadi dari alat seperti Google Drive, SharePoint, Dropbox, dan Box.
- Kontrol izin ketat memastikan keamanan data.
- Mendorong ChatGPT sebagai pusat pengetahuan utama untuk organisasi.
- Juga mengisyaratkan penghubung penelitian mendalam untuk kasus penggunaan yang lebih otonom.
🔍 Gambaran Besar
Benang merah yang menghubungkan semua pembaruan ini?
AI bergerak dari demo yang mengesankan ke alat terpadu, dapat digunakan, setiap hari — di seluruh suara, otomatisasi, video, dan pengetahuan.
Pertanyaannya bukanlah apakah AI akan mempengaruhi cara kita bekerja dan mencipta — tetapi seberapa cepat semuanya akan berubah.
💡 Yang Perlu Diawasi:
- Siapa yang mendominasi ruang suara AI di pasar profesional?
- Akankah Runner H memicu gelombang startup berbasis agen?
- Apakah video AI siap menggantikan aktor atau hanya meningkatkan alur kerja?
- Dapatkah OpenAI dan Google menjadi sistem saraf pusat bagi perusahaan?
Tetap disini untuk lebih banyak pembaruan mingguan saat perlombaan AI terus mempercepat.
Berlangganan Wawasan Mingguan
Dapatkan insight mingguan tentang AI, SEO, dan Growth Marketing langsung ke inbox. Tanpa spam, hanya konten berkualitas.
Lebih suka tidak berlangganan? Silakan ikuti saya di LinkedIn untuk wawasan yang sama dan terhubung