
Berita & Pembaruan AI – 20 Juni
Terbaru dalam Suara AI, Agen, Video, dan Alat Perusahaan
Selamat datang di penjelajahan mendalam AI minggu ini — ringkasan cepat Anda tentang pembaruan paling berdampak di ruang AI. Dari suara AI yang bernuansa emosional dan agen otomatisasi sejati hingga terobosan dalam video yang dihasilkan AI dan integrasi tingkat perusahaan, inilah yang penting dan mengapa.
🔊 11 Labs V3: Suara AI yang Terdengar Manusiawi
Model baru 11 Labs V3 kini tersedia dalam alfa publik dan mendefinisikan ulang ucapan yang dihasilkan AI.
- Sekarang mendukung 70+ bahasa, mencakup 90% populasi global.
- Memungkinkan pengguna menyematkan tag emosi (seperti bersemangat, berbisik) langsung dalam teks.
- Dibangun dari awal dengan fokus pada pasar pro: film, buku audio, game.
- API multi-pembicara baru memungkinkan percakapan dan dialog yang lebih alami.
- V3 belum real-time, tetapi model Turbo V2.5 yang lebih lama direkomendasikan untuk saat ini.
- Saat ini menawarkan diskon 80% untuk rencana self-serve hingga Juni 2025.
🤖 Agen AI: Runner H oleh H Company
Runner H membuat gebrakan dengan agen AI yang benar-benar menjalankan tugas di web.
- Ditenagai oleh Hollow1, model bahasa visual dengan 3 miliar parameter.
- Memahami tata letak halaman web — mengklik tombol, mengisi formulir, memesan perjalanan.
- Mengungguli pesaing dalam tolok ukur WebVoyager dengan keberhasilan 67%.
- Bekerja di berbagai platform: Gmail, Notion, Slack, Zapier, dll.
- Dalam beta publik dan gratis untuk dicoba sekarang.
🎬 Video AI Sedang Meledak
Tiga pendekatan berbeda untuk video AI semakin mendapatkan perhatian:
1. Google DeepMind V3
- Menghasilkan video pendek berkualitas tinggi dari teks atau gambar.
- Termasuk audio terintegrasi, konsistensi karakter, dan kontrol kamera.
- Sekarang tersedia di Leonardo.ai dan aplikasi Gemini, tersedia di 73 negara.
2. Mirage Studio (Captions AI)
- Membangun aktor AI hiper-realistis dari prompt teks atau gambar referensi.
- Fokus pada konten pemasaran — menjanjikan memotong waktu produksi hingga 90%.
3. HeyGen AI Studio
- Dibangun untuk kontrol yang sangat halus atas avatar AI dan pengeditan video.
- Fitur pencerminan suara, pemetaan gerakan, dan arahan performa bahasa alami.
- Diluncurkan dengan avatar mereka yang paling realistis hingga saat ini.
🧠 Platform AI Semakin Mendalam
Google Gemini 2.5 Pro
- Sekarang memimpin di papan peringkat WebDev Arena untuk membangun aplikasi dari prompt.
- “Anggaran berpikir” baru memungkinkan pengembang mengontrol penggunaan komputasi dan biaya.
- Tersedia melalui Google AI Studio dan Vertex AI.
Dorongan Perusahaan OpenAI
- Meluncurkan ChatGPT Connectors untuk mengakses data perusahaan pribadi dari alat seperti Google Drive, SharePoint, Dropbox, dan Box.
- Kontrol izin ketat memastikan keamanan data.
- Mendorong ChatGPT sebagai pusat pengetahuan utama untuk organisasi.
- Juga menggoda penghubung penelitian mendalam untuk kasus penggunaan yang lebih otonom.
🔍 Gambaran Besar
Benang merah yang mengalir melalui semua pembaruan ini?
AI bergerak dari demo yang mengesankan ke alat yang terintegrasi, dapat digunakan, sehari-hari — di seluruh suara, otomatisasi, video, dan pengetahuan.
Pertanyaannya bukan apakah AI akan berdampak pada bagaimana kita bekerja dan mencipta — tetapi seberapa cepat akan mengubah segalanya.
💡 Apa yang Harus Diperhatikan:
- Siapa yang mendominasi ruang suara AI di pasar pro?
- Akankah Runner H memicu gelombang startup berbasis agen?
- Apakah video AI siap menggantikan aktor atau hanya meningkatkan alur kerja?
- Bisakah OpenAI dan Google menjadi sistem saraf pusat untuk perusahaan?
Pantau terus untuk lebih banyak pembaruan mingguan saat perlombaan AI terus mempercepat.
Berlangganan untuk wawasan strategis
Selain bisnis, saya adalah ayah yang bangga, mitra dalam hidup dan pekerjaan, pemikir kreatif, dan seseorang yang percaya bahwa pertumbuhan datang dari keterlibatan penuh —
Lebih suka tidak berlangganan? Silakan ikuti saya di LinkedIn untuk wawasan yang sama dan terhubung