Новости и обновления в области ИИ – 20 июня: Голоса, агенты, видео и корпоративные инструменты
Создано с помощью ИИ

Новости и обновления в области ИИ – 20 июня

Последние новости о голосах, агентах, видео и корпоративных инструментах ИИ

Добро пожаловать в глубокое погружение в мир ИИ на этой неделе — ваш краткий обзор самых значимых обновлений в области ИИ. От эмоционально нюансированных голосов ИИ и реальных агентов автоматизации до прорывов в создании видео с помощью ИИ и интеграции корпоративного уровня — вот что важно и почему.


🔊 11 Labs V3: Голоса ИИ, звучащие как человеческие

Новая модель 11 Labs V3 доступна в публичной альфа-версии и переопределяет синтез речи с помощью ИИ.

  • Теперь поддерживает более 70 языков, охватывающих 90% мирового населения.
  • Позволяет пользователям встраивать теги эмоций (например, возбуждение, шепот) прямо в текст.
  • Создана с нуля с акцентом на профессиональные рынки: кино, аудиокниги, игры.
  • Новый мультиспикерный API обеспечивает более естественные разговоры и диалоги.
  • V3 пока не работает в реальном времени, но рекомендуется использовать более старые модели V2.5 Turbo.
  • В настоящее время предлагается скидка 80% на самостоятельные тарифы до июня 2025 года.

🤖 Агенты ИИ: Runner H от H Company

Runner H производит фурор с агентом ИИ, который действительно выполняет задачи в Интернете.

  • Работает на основе Hollow1, визуальной языковой модели с 3 миллиардами параметров.
  • Понимает структуру веб-страниц — нажимает кнопки, заполняет формы, бронирует путешествия.
  • Превосходит конкурентов в WebVoyager benchmark с 67% успеха.
  • Работает на различных платформах: Gmail, Notion, Slack, Zapier и др.
  • Находится в публичной бета-версии и доступен для бесплатного использования.

🎬 ИИ-видео набирает обороты

Три различных подхода к ИИ-видео набирают популярность:

1. Google DeepMind V3

  • Генерирует качественные короткие видео из текста или изображений.
  • Включает интегрированное аудио, согласованность персонажей и управление камерой.
  • Доступен в Leonardo.ai и приложении Gemini, доступен в 73 странах.

2. Mirage Studio (Captions AI)

  • Создает гиперреалистичных актеров ИИ из текстовых подсказок или эталонных изображений.
  • Сосредоточен на маркетинговом контенте — обещает сократить время производства на 90%.

3. HeyGen AI Studio

  • Создан для тонкого управления аватарами ИИ и редактирования видео.
  • Оснащен функциями зеркального отображения голоса, картирования жестов и управления производительностью на естественном языке.
  • Запущен с их самым реалистичным аватаром на сегодняшний день.

🧠 Платформы ИИ углубляются

Google Gemini 2.5 Pro

  • Теперь лидирует на лидерборде WebDev Arena по созданию приложений из подсказок.
  • Новые “бюджеты на размышления” позволяют разработчикам контролировать использование вычислительных ресурсов и стоимость.
  • Доступен через Google AI Studio и Vertex AI.

Продвижение OpenAI в корпоративный сектор

  • Запуск ChatGPT Connectors для доступа к приватным данным компаний из таких инструментов, как Google Drive, SharePoint, Dropbox и Box.
  • Строгие параметры разрешений обеспечивают безопасность данных.
  • Продвигает ChatGPT как центральный центр знаний для организаций.
  • Также анонсированы коннекторы для глубоких исследований для более автономных сценариев использования.

🔍 Общая картина

Что объединяет все эти обновления?
ИИ переходит от впечатляющих демонстраций к интегрированным, полезным, ежедневным инструментам — в области голоса, автоматизации, видео и знаний.

Вопрос не в том, повлияет ли ИИ на то, как мы работаем и создаем, а в том, как быстро он изменит все.


💡 На что обратить внимание:

  • Кто займет лидирующие позиции на рынке голосов ИИ в профессиональных секторах?
  • Вызовет ли Runner H волну стартапов, основанных на агентах?
  • Готово ли ИИ-видео заменить актеров или просто дополнить рабочие процессы?
  • Смогут ли OpenAI и Google стать центральной нервной системой для компаний?

Следите за еженедельными выпусками, так как гонка ИИ продолжается с ускорением.

Подпишитесь на стратегические идеи

Помимо бизнеса, я гордый отец, партнер в жизни и работе, креативный мыслитель и человек, который верит, что рост приходит через полную отдачу —

Не хотите подписываться? Подписывайтесь на меня в LinkedIn, чтобы получать те же идеи и наладить контакт