
Новости и обновления ИИ – 20 июня
Последние новости в области голосов ИИ, агентов, видео и инструментов для предприятий
Добро пожаловать в глубокий обзор ИИ на этой неделе — ваш быстрый обзор самых значимых обновлений в области искусственного интеллекта. От эмоционально нюансированных голосов ИИ и агентов автоматизации до прорывов в создании видео с ИИ и интеграции уровня предприятия — вот что важно и почему.
🔊 11 Labs V3: Голоса ИИ, которые звучат по-человечески
Новая модель 11 Labs V3 доступна в публичной альфа-версии и переопределяет синтез речи на основе ИИ.
- Теперь поддерживает 70+ языков, охватывая 90% мирового населения.
- Позволяет пользователям встраивать теги эмоций (такие как восторг, шепот) прямо в текст.
- Создана с нуля с акцентом на профессиональные рынки: кино, аудиокниги, игры.
- Новый API для многоголосого общения позволяет более естественные разговоры и диалоги.
- V3 пока не работает в реальном времени, но рекомендуется использовать более старые модели V2.5 Turbo.
- В настоящее время предлагается скидка 80% на самостоятельные планы до июня 2025 года.
🤖 ИИ-агенты: Runner H от H Company
Runner H набирает популярность с ИИ-агентом, который действительно выполняет задачи в интернете.
- Работает на базе Hollow1, визуальной языковой модели с 3 миллиардами параметров.
- Понимает макет веб-страниц — нажимает кнопки, заполняет формы, бронирует путешествия.
- Превосходит конкурентов в бенчмарке WebVoyager с 67% успеха.
- Работает на различных платформах: Gmail, Notion, Slack, Zapier и др.
- В публичной бета-версии и доступен для бесплатного использования.
🎬 Взрывное развитие видео с ИИ
Три различных подхода к видео с ИИ набирают популярность:
1. Google DeepMind V3
- Создает качественные короткие видео из текста или изображений.
- Включает интегрированное аудио, согласованность персонажей и управление камерой.
- Доступен на Leonardo.ai и приложении Gemini, доступен в 73 странах.
2. Mirage Studio (Captions AI)
- Создает гиперреалистичных актеров ИИ из текстовых подсказок или эталонных изображений.
- Сфокусирован на маркетинговом контенте — обещает сократить время производства на 90%.
3. HeyGen AI Studio
- Разработан для тонкого управления аватарами ИИ и редактирования видео.
- Включает отражение голоса, картирование жестов и управление исполнением на естественном языке.
- Запущен с самым реалистичным аватаром на сегодняшний день.
🧠 Платформы ИИ становятся глубже
Google Gemini 2.5 Pro
- Теперь лидирует в WebDev Arena по созданию приложений из подсказок.
- Новые «бюджеты на размышления» позволяют разработчикам контролировать использование вычислительных ресурсов и затраты.
- Доступен через Google AI Studio и Vertex AI.
Корпоративное продвижение OpenAI
- Запуск ChatGPT Connectors для доступа к приватным данным компании из таких инструментов, как Google Drive, SharePoint, Dropbox и Box.
- Строгий контроль разрешений обеспечивает безопасность данных.
- Продвигает ChatGPT как центральный центр знаний для организаций.
- Также анонсированы коннекторы для глубоких исследований для более автономного использования.
🔍 Общая картина
Что объединяет все эти обновления?
ИИ переходит от впечатляющих демонстраций к интегрированным, полезным, повседневным инструментам — в области голоса, автоматизации, видео и знаний.
Вопрос не в том, повлияет ли ИИ на то, как мы работаем и творим, а в том, как быстро он изменит все.
💡 Что стоит наблюдать:
- Кто станет лидером в области голосов ИИ на профессиональных рынках?
- Вызовет ли Runner H волну стартапов на базе агентов?
- Готово ли видео с ИИ заменить актеров или только дополнить рабочие процессы?
- Смогут ли OpenAI и Google стать центральной нервной системой для компаний?
Следите за еженедельными обновлениями, поскольку гонка ИИ продолжает ускоряться.
Подпишитесь на Еженедельные Обзоры
Получайте еженедельные инсайты по AI, SEO и Growth Marketing прямо на почту. Ни капли спама, только полезное.
Не хотите подписываться? Подписывайтесь на меня в LinkedIn, чтобы получать те же идеи и наладить контакт