
أخبار وتحديثات الذكاء الاصطناعي – 20 يونيو
أحدث ما في أصوات الذكاء الاصطناعي والوكلاء والفيديو وأدوات المؤسسات
مرحبًا بك في النظرة العميقة لهذا الأسبوع في الذكاء الاصطناعي — تفصيل سريع لأكثر التحديثات تأثيرًا في مجال الذكاء الاصطناعي. من الأصوات العاطفية للذكاء الاصطناعي والوكلاء الذين يقومون بالمهام فعليًا إلى الاختراقات في الفيديو المولد بواسطة الذكاء الاصطناعي والتكاملات على مستوى المؤسسات، إليك ما يهم ولماذا.
🔊 11 Labs V3: أصوات الذكاء الاصطناعي التي تبدو بشرية
النموذج الجديد 11 Labs V3 متاح الآن في النسخة التجريبية العامة ويعيد تعريف الكلام المولد بواسطة الذكاء الاصطناعي.
- يدعم الآن أكثر من 70 لغة، تغطي 90٪ من سكان العالم.
- يتيح للمستخدمين تضمين علامات العاطفة (مثل الحماس، الهمس) مباشرة في النص.
- تم بناؤه من الأساس مع التركيز على الأسواق الاحترافية: الأفلام، الكتب الصوتية، الألعاب.
- واجهة برمجة التطبيقات الجديدة متعددة المتحدثين تسمح بمحادثات وحوارات أكثر طبيعية.
- V3 ليست في الوقت الحقيقي بعد، ولكن يوصى بنماذج V2.5 Turbo الأقدم في الوقت الحالي.
- يقدم حاليًا خصم 80٪ على الخطط الذاتية الخدمة حتى يونيو 2025.
🤖 وكلاء الذكاء الاصطناعي: Runner H من H Company
Runner H يصنع موجات مع وكيل ذكاء اصطناعي يقوم بالفعل بأداء المهام على الويب.
- مدعوم من Hollow1، نموذج لغة بصرية مع 3 مليارات معلمة.
- يفهم تخطيط صفحات الويب — ينقر على الأزرار، يملأ النماذج، يحجز السفر.
- يتفوق على المنافسين في مقياس WebVoyager بنسبة نجاح 67٪.
- يعمل عبر المنصات: Gmail، Notion، Slack، Zapier، إلخ.
- في النسخة التجريبية العامة ومتاح للتجربة الآن.
🎬 الفيديو المولد بواسطة الذكاء الاصطناعي يتفجر
ثلاثة نهج مميزة للفيديو المولد بواسطة الذكاء الاصطناعي تكتسب زخمًا:
1. Google DeepMind V3
- يولد مقاطع فيديو قصيرة عالية الجودة من النص أو الصور.
- يتضمن الصوت المدمج، وثبات الشخصيات، والتحكم في الكاميرا.
- يتوفر الآن في Leonardo.ai وتطبيق Gemini، متاح في 73 دولة.
2. Mirage Studio (Captions AI)
- يبني ممثلين بواسطة الذكاء الاصطناعي من النصوص المرجعية أو الصور المرجعية.
- يركز على محتوى التسويق — يعد بتقليل وقت الإنتاج بنسبة 90٪.
3. HeyGen AI Studio
- مصمم للتحكم الدقيق في الأفاتار وتحرير الفيديو.
- يتميز بانعكاس الصوت، وتخطيط الإيماءات، وأداء اللغة الطبيعية.
- تم إطلاقه بأكثر الأفاتار الحياة واقعية.
🧠 منصات الذكاء الاصطناعي تتعمق
Google Gemini 2.5 Pro
- يتصدر الآن قائمة WebDev Arena لبناء التطبيقات من المطالبات.
- “ميزانيات التفكير” الجديدة تتيح للمطورين التحكم في استخدام الحوسبة والتكلفة.
- متاح من خلال Google AI Studio وVertex AI.
دفعة المؤسسات من OpenAI
- إطلاق موصلات ChatGPT للوصول إلى بيانات الشركة الخاصة من أدوات مثل Google Drive وSharePoint وDropbox وBox.
- ضوابط أذونات صارمة تضمن أمان البيانات.
- دفع ChatGPT كمركز معرفة مركزي للمؤسسات.
- تم التلميح أيضًا إلى موصلات بحث عميق لحالات استخدام أكثر استقلالية.
🔍 الصورة الكبيرة
الخيط الذي يربط بين كل هذه التحديثات؟
الذكاء الاصطناعي ينتقل من العروض التوضيحية المثيرة للإعجاب إلى أدوات متكاملة وقابلة للاستخدام يوميًا — عبر الصوت والأتمتة والفيديو والمعرفة.
السؤال ليس ما إذا كان الذكاء الاصطناعي سيؤثر على كيفية عملنا وإبداعنا — بل مدى سرعة تغير كل شيء.
💡 ما يجب مراقبته:
- من سيسيطر على مساحة أصوات الذكاء الاصطناعي في الأسواق الاحترافية؟
- هل سيحفز Runner H موجة من الشركات الناشئة القائمة على الوكلاء؟
- هل الفيديو المولد بواسطة الذكاء الاصطناعي جاهز لاستبدال الممثلين أم فقط تعزيز سير العمل؟
- هل يمكن أن تصبح OpenAI وGoogle الأنظمة العصبية المركزية للشركات؟
تابع التحديثات الأسبوعية القادمة حيث يستمر سباق الذكاء الاصطناعي في التسارع.
اشترك للحصول على رؤى استراتيجية
بعيدًا عن العمل، أنا أبٌ فخور، وشريك في الحياة والعمل، ومفكر مبدع، وأؤمن أن النمو يأتي من العطاء الكامل —
تفضل عدم الاشتراك؟ لا تتردد في متابعتي على LinkedIn لنفس الأفكار والتواصل