كشفت شركة فيس بوك، عن مشروع يسمى التعلم من مقاطع الفيديو أو “Learning from Videos”، والذى يستخدم الذكاء الاصطناعى لفهم وتعلم التمثيلات الصوتية والنصية والمرئية فى مقاطع فيديو المستخدم العام على الشبكة الاجتماعية.
وبحسب موقع engadget الأمريكى، فإن مشروع “Learning from Videos”له عدد من الأهداف، مثل تحسين أنظمة Facebook AI المتعلقة بتوصيات المحتوى وإنفاذ السياسة، مع ملاحظة أن المشروع فى مراحله الأولى، لكنه يؤتى ثماره بالفعل.
ويقول فيس بوك إنه قد استغل هذه التقنية بالفعل لتحسين توصيات Instagram Reels، مثل عرض مقاطع فيديو لأشخاص يقومون بنفس الرقص على نفس الموسيقى، ويُظهر النظام نتائج محسّنة فى أخطاء التعرف على الكلام أيضًا، مما قد يعزز ميزات التسمية التوضيحية التلقائية ويسهل اكتشاف الكلام الذى يحض على الكراهية فى مقاطع الفيديو.
ويضبف فيس بوك أن المشروع سيساعد الباحثين فى مجال الذكاء الاصطناعى على تجنب الاضطرار إلى الاعتماد على البيانات المصنفة وهو جزء من الجهود المبذولة لبناء أنظمة تتعلم بطريقة مماثلة للبشر، وعلى هذا النحو، فإن التعلم من مقاطع الفيديو سوف “يتيح تجارب جديدة تمامًا”.
ولم تدخل الشركة فى الكثير من التفاصيل حول تلك الأشياء باستثناء ميزة محتملة تسمح للذكاء الاصطناعى بالعثور على ذكريات رقمية، بما فى ذلك تلك التى تم التقاطها بواسطة نظارات الواقع المعزز، ويمكنك، على سبيل المثال، أن تطلب من مثل هذا النظام أن يظهر لك “فى كل مرة نغنى فيها لجدتك”، ويمكن أن تظهر تلك المقاطع، ويعمل فيس بوك، على وجه الخصوص، على نظارات ذكية خاصة به.
وتقول الشركة إن المشروع يبحث فى مقاطع فيديو بمئات اللغات ومن كل بلد تقريبًا، وسيجعل هذا الجانب من المشروع أنظمة الذكاء الاصطناعى أكثر دقة ويسمح لها “بالتكيف مع عالمنا سريع الحركة والتعرف على الفروق الدقيقة والإشارات المرئية عبر الثقافات والمناطق المختلفة.”
ويقول فيس بوك إنه يضع الخصوصية فى الاعتبار عندما يتعلق الأمر بالتعلم من مقاطع الفيديو، وكتب فى إحدى مشاركات المدونة: “نبنى ونحافظ على أساس قوى للخصوصية يستخدم حلولًا آلية لفرض الخصوصية على نطاق واسع”، واستكمل “من خلال تضمين هذا العمل على مستوى البنية التحتية، يمكننا تطبيق متطلبات الخصوصية باستمرار عبر أنظمتنا ودعم جهود مثل الذكاء الاصطناعي، وهذا يشمل تنفيذ الضمانات التقنية طوال دورة حياة البيانات.”
ويمكن أن يكون فهم ما يحدث فى مقاطع الفيديو مهمة صعبة للغاية لأنظمة الذكاء الاصطناعي، ويمكن أن تتضمن عقبات مثل ضوضاء الخلفية التى تجعل من الصعب فهم الكلام وتبديل اللغة، وبعد أقل من عام من بدء مشروع التعلم من مقاطع الفيديو، يأخذ فيس بوك ما تعلمه النظام ويضعه فى الاستخدام العملى فى مجالات أخرى.