
Новости и обновления в области ИИ – 20 июня
Последние новости о голосах, агентах, видео и корпоративных инструментах ИИ
Добро пожаловать в глубокое погружение в мир ИИ на этой неделе — ваш краткий обзор самых значимых обновлений в области ИИ. От эмоционально нюансированных голосов ИИ и реальных агентов автоматизации до прорывов в создании видео с помощью ИИ и интеграции корпоративного уровня — вот что важно и почему.
🔊 11 Labs V3: Голоса ИИ, звучащие как человеческие
Новая модель 11 Labs V3 доступна в публичной альфа-версии и переопределяет синтез речи с помощью ИИ.
- Теперь поддерживает более 70 языков, охватывающих 90% мирового населения.
- Позволяет пользователям встраивать теги эмоций (например, возбуждение, шепот) прямо в текст.
- Создана с нуля с акцентом на профессиональные рынки: кино, аудиокниги, игры.
- Новый мультиспикерный API обеспечивает более естественные разговоры и диалоги.
- V3 пока не работает в реальном времени, но рекомендуется использовать более старые модели V2.5 Turbo.
- В настоящее время предлагается скидка 80% на самостоятельные тарифы до июня 2025 года.
🤖 Агенты ИИ: Runner H от H Company
Runner H производит фурор с агентом ИИ, который действительно выполняет задачи в Интернете.
- Работает на основе Hollow1, визуальной языковой модели с 3 миллиардами параметров.
- Понимает структуру веб-страниц — нажимает кнопки, заполняет формы, бронирует путешествия.
- Превосходит конкурентов в WebVoyager benchmark с 67% успеха.
- Работает на различных платформах: Gmail, Notion, Slack, Zapier и др.
- Находится в публичной бета-версии и доступен для бесплатного использования.
🎬 ИИ-видео набирает обороты
Три различных подхода к ИИ-видео набирают популярность:
1. Google DeepMind V3
- Генерирует качественные короткие видео из текста или изображений.
- Включает интегрированное аудио, согласованность персонажей и управление камерой.
- Доступен в Leonardo.ai и приложении Gemini, доступен в 73 странах.
2. Mirage Studio (Captions AI)
- Создает гиперреалистичных актеров ИИ из текстовых подсказок или эталонных изображений.
- Сосредоточен на маркетинговом контенте — обещает сократить время производства на 90%.
3. HeyGen AI Studio
- Создан для тонкого управления аватарами ИИ и редактирования видео.
- Оснащен функциями зеркального отображения голоса, картирования жестов и управления производительностью на естественном языке.
- Запущен с их самым реалистичным аватаром на сегодняшний день.
🧠 Платформы ИИ углубляются
Google Gemini 2.5 Pro
- Теперь лидирует на лидерборде WebDev Arena по созданию приложений из подсказок.
- Новые “бюджеты на размышления” позволяют разработчикам контролировать использование вычислительных ресурсов и стоимость.
- Доступен через Google AI Studio и Vertex AI.
Продвижение OpenAI в корпоративный сектор
- Запуск ChatGPT Connectors для доступа к приватным данным компаний из таких инструментов, как Google Drive, SharePoint, Dropbox и Box.
- Строгие параметры разрешений обеспечивают безопасность данных.
- Продвигает ChatGPT как центральный центр знаний для организаций.
- Также анонсированы коннекторы для глубоких исследований для более автономных сценариев использования.
🔍 Общая картина
Что объединяет все эти обновления?
ИИ переходит от впечатляющих демонстраций к интегрированным, полезным, ежедневным инструментам — в области голоса, автоматизации, видео и знаний.
Вопрос не в том, повлияет ли ИИ на то, как мы работаем и создаем, а в том, как быстро он изменит все.
💡 На что обратить внимание:
- Кто займет лидирующие позиции на рынке голосов ИИ в профессиональных секторах?
- Вызовет ли Runner H волну стартапов, основанных на агентах?
- Готово ли ИИ-видео заменить актеров или просто дополнить рабочие процессы?
- Смогут ли OpenAI и Google стать центральной нервной системой для компаний?
Следите за еженедельными выпусками, так как гонка ИИ продолжается с ускорением.
Подпишитесь на стратегические идеи
Помимо бизнеса, я гордый отец, партнер в жизни и работе, креативный мыслитель и человек, который верит, что рост приходит через полную отдачу —
Не хотите подписываться? Подписывайтесь на меня в LinkedIn, чтобы получать те же идеи и наладить контакт