
AI Новини та Оновлення – 20 червня
Останні новини у сфері AI голосів, агентів, відео та інструментів для підприємств
Ласкаво просимо до глибокого огляду AI цього тижня — ваш швидкий огляд найбільш впливових оновлень у просторі AI. Від емоційно нюансованих AI голосів і справжніх автоматизаційних агентів до проривів у AI-генерованому відео та інтеграцій для підприємств, ось що важливо і чому.
🔊 11 Labs V3: AI Голоси, Що Звучать Як Людські
Нова модель 11 Labs V3 запущена у публічній альфі та переосмислює AI-генеровану мову.
- Тепер підтримує 70+ мов, охоплюючи 90% світового населення.
- Дозволяє користувачам вбудовувати емоційні теги (наприклад, збуджений, шепіт) безпосередньо в текст.
- Створена з нуля з акцентом на професійні ринки: кіно, аудіокниги, ігри.
- Нова API для багатоспікерів дозволяє більш природні розмови та діалоги.
- V3 ще не в реальному часі, але старіші моделі V2.5 Turbo поки що рекомендуються.
- Зараз пропонується 80% знижка на самостійні плани до червня 2025 року.
🤖 AI Агенти: Runner H від H Company
Runner H викликає фурор з AI агентом, який дійсно виконує завдання у веб-просторі.
- Підживлюється Hollow1, візуальною мовною моделлю з 3 млрд параметрів.
- Розуміє макет вебсторінок — натискає кнопки, заповнює форми, бронює подорожі.
- Перевершує конкурентів у бенчмарку WebVoyager з успіхом 67%.
- Працює на різних платформах: Gmail, Notion, Slack, Zapier тощо.
- Зараз у публічній бета-версії та безкоштовна для проби.
🎬 AI Відео Знаходить Популярність
Три різні підходи до AI відео набирають обертів:
1. Google DeepMind V3
- Генерує високоякісні короткі відео з тексту або зображень.
- Включає інтегрований аудіо, консистентність персонажів та контроль камери.
- Тепер у Leonardo.ai та Gemini app, доступний у 73 країнах.
2. Mirage Studio (Captions AI)
- Створює гіперреалістичних AI акторів з текстових запитів або довідкових зображень.
- Зосереджений на маркетинговому контенті — обіцяє скоротити час виробництва на 90%.
3. HeyGen AI Studio
- Створений для тонкого контролю над AI аватарами та редагуванням відео.
- Має функції віддзеркалення голосу, відображення жестів та керування виконанням з використанням природної мови.
- Запущений з їх найжиттєвішим аватаром.
🧠 AI Платформи Заглиблюються
Google Gemini 2.5 Pro
- Тепер лідирує у WebDev Arena за створення додатків з підказок.
- Нові “бюджети мислення” дозволяють розробникам контролювати використання обчислень та витрати.
- Доступний через Google AI Studio та Vertex AI.
Поштовх OpenAI до Підприємств
- Запуск ChatGPT Connectors для доступу до приватних даних компанії з інструментів, таких як Google Drive, SharePoint, Dropbox та Box.
- Суворі контролі дозволів забезпечують безпеку даних.
- Просування ChatGPT як центрального вузла знань для організацій.
- Також натякнули на глибокі дослідницькі з'єднувачі для більш автономних випадків використання.
🔍 Велика Картина
Яка загальна тема всіх цих оновлень?
AI переходить від вражаючих демонстрацій до інтегрованих, зручних, повсякденних інструментів — у сфері голосу, автоматизації, відео та знань.
Питання не в тому, чи вплине AI на те, як ми працюємо і створюємо — а як швидко він змінить все.
💡 Що Спостерігати:
- Хто домінує на ринку AI голосів у професійних сферах?
- Чи викличе Runner H хвилю стартапів на основі агентів?
- Чи готове AI відео замінити акторів або лише доповнити робочі процеси?
- Чи можуть OpenAI та Google стати центральними нервовими системами для компаній?
Слідкуйте за новими щотижневими оновленнями, адже гонка AI продовжує прискорюватися.
Підпишіться на стратегічні інсайти
Окрім бізнесу, я – батько, партнер у житті та роботі, креативний мислитель і людина, що вірить у зростання через повну залученість —
Не хочете підписуватись? Сміливо слідкуйте за мною на LinkedIn, щоб отримувати ті самі інсайти і бути на звʼязку