تم الإنشاء بواسطة Alen

أخبار وتحديثات الذكاء الاصطناعي – 20 يونيو

أحدث أخبار الأصوات، والوكلاء، والفيديو، وأدوات المؤسسات في مجال الذكاء الاصطناعي

مرحبًا بكم في التعمق الأسبوعي في مجال الذكاء الاصطناعي — تحليل سريع لأهم التحديثات في مجال الذكاء الاصطناعي. من الأصوات العاطفية للذكاء الاصطناعي ووكلاء الأتمتة الحقيقيين إلى الإنجازات في الفيديو المولد بواسطة الذكاء الاصطناعي والتكاملات على مستوى المؤسسات، إليك ما يهم ولماذا.

🔊 11 Labs V3: أصوات الذكاء الاصطناعي التي تبدو بشرية

النموذج الجديد 11 Labs V3 متاح الآن في النسخة التجريبية العامة ويعيد تعريف الكلام المولد بواسطة الذكاء الاصطناعي.

يدعم الآن 70+ لغة، تغطي 90٪ من سكان العالم.
يُتيح للمستخدمين إدراج علامات العاطفة (مثل متحمس، همس) مباشرة في النص.
تم بناؤه من الصفر مع التركيز على الأسواق الاحترافية: الأفلام، الكتب الصوتية، الألعاب.
واجهة برمجة التطبيقات الجديدة متعددة المتحدثين تتيح محادثات وحوارات أكثر طبيعية.
V3 ليست في الوقت الحقيقي بعد، لكن يُوصى بنماذج V2.5 Turbo الأقدم حاليًا.
توفر حاليًا خصم 80% على خطط الخدمة الذاتية حتى يونيو 2025.

🤖 وكلاء الذكاء الاصطناعي: Runner H من H Company

يُحدث Runner H ضجة مع وكيل ذكاء اصطناعي يقوم فعليًا بأداء المهام على الويب.

مدعوم من Hollow1، وهو نموذج لغة مرئية يحتوي على 3 مليارات معلمة.
يفهم تخطيط صفحات الويب — يضغط على الأزرار، يملأ النماذج، يحجز السفر.
يتفوق على المنافسين في المعيار WebVoyager بنسبة نجاح 67%.
يعمل عبر المنصات: Gmail، Notion، Slack، Zapier، إلخ.
في النسخة التجريبية العامة ومتاح للتجربة الآن مجانًا.

🎬 الفيديو المولد بواسطة الذكاء الاصطناعي ينفجر

تكتسب ثلاث طرق متميزة للفيديو المولد بواسطة الذكاء الاصطناعي زخمًا:

1. Google DeepMind V3

يُولد مقاطع فيديو قصيرة عالية الجودة من النص أو الصور.
يشمل الصوت المتكامل، وثبات الشخصيات، والتحكم في الكاميرا.
متاح الآن في Leonardo.ai وتطبيق Gemini، متاح في 73 دولة.

2. Mirage Studio (Captions AI)

يُنشئ ممثلين واقعيين للذكاء الاصطناعي من المطالبات النصية أو الصور المرجعية.
يركز على محتوى التسويق — يعد بتقليل وقت الإنتاج بنسبة 90%.

3. HeyGen AI Studio

تم بناؤه للتحكم الدقيق في الشخصيات الافتراضية وتحرير الفيديو.
يتميز بانعكاس الصوت، وتعيين الإيماءات، وتوجيه الأداء باللغة الطبيعية.
أطلق مع أكثر شخصية افتراضية واقعية حتى الآن.

🧠 منصات الذكاء الاصطناعي تتعمق أكثر

Google Gemini 2.5 Pro

يتصدر الآن في لوحة الصدارة WebDev Arena لبناء التطبيقات من المطالبات.
ميزات "ميزانيات التفكير" الجديدة تتيح للمطورين التحكم في استخدام الحوسبة والتكلفة.
متاح من خلال Google AI Studio وVertex AI.

دفع OpenAI للمؤسسات

إطلاق موصلات ChatGPT للوصول إلى بيانات الشركة الخاصة من أدوات مثل Google Drive، SharePoint، Dropbox، وBox.
ضوابط إذن صارمة تضمن أمان البيانات.
دفع ChatGPT كمركز معرفة مركزي للمؤسسات.
كما تم التلميح إلى موصلات البحث العميق لحالات استخدام أكثر استقلالية.

🔍 الصورة الكبيرة

الخيط الذي يربط بين كل هذه التحديثات؟
الذكاء الاصطناعي ينتقل من العروض المذهلة إلى الأدوات المتكاملة والقابلة للاستخدام يوميًا — عبر الصوت، والأتمتة، والفيديو، والمعرفة.

السؤال ليس ما إذا كان الذكاء الاصطناعي سيؤثر على كيفية عملنا وإبداعنا — بل مدى سرعة تغييره لكل شيء.

💡 ما يجب مراقبته:

من يهيمن على مساحة أصوات الذكاء الاصطناعي في الأسواق الاحترافية؟
هل سيؤدي Runner H إلى موجة من الشركات الناشئة المعتمدة على الوكلاء؟
هل الفيديو المولد بواسطة الذكاء الاصطناعي جاهز لاستبدال الممثلين أم فقط لتعزيز سير العمل؟
هل يمكن لـ OpenAI وGoogle أن تصبحا الأنظمة العصبية المركزية للشركات؟

تابعونا لمزيد من التحديثات الأسبوعية بينما يستمر سباق الذكاء الاصطناعي في التسارع.

اشترك للحصول على رؤى أسبوعية

احصل على رؤى أسبوعية حول الذكاء الاصطناعي، SEO، ونمو التسويق مباشرة في بريدك. لا بريد مزعج، فقط المفيد.

تفضل عدم الاشتراك؟ لا تتردد في متابعتي على LinkedIn لنفس الأفكار والتواصل