الكشف الفوري عن المحتوى غير اللائق على منصة YouTube باستخدام نموذج CLIP: نهج الرؤية واللغة بدون تدريب مسبق (Zero-Shot)
التنزيلات
شهدت منصات الفيديو عبر الإنترنت نموا سريعا، مما زاد من احتمالية تعرض الأطفال المحتوى ضار مثل العنف أو المواد غير اللائقة. تعتمد أساليب التصفية التقليدية، مثل البحث بالكلمات المفتاحية والقوائم الثابتة، على آليات محدودة لا تستطيع مواكبة الطبيعة الديناميكية والمتعددة الوسائط للمحتوى الرقمي الحديث. تقدم هذه الدراسة نظاماً ذكيا لمراقبة المحتوى في الزمن الحقيقي، يجمع بين إضافة متصفح (Browser Extension) ومنصة إشراف مخصصة للأهل، بهدف متابعة استخدام الأطفال لموقع يوتيوب بشكل مستمر. يعتمد النظام على نموذج CLIP
من )Zero-Shot Classification( لتنفيذ تصنيف صفري )Contrastive Language Image Pretraining( خلال ربط التمثيلات البصرية والنصية في فضاء دلالي مشترك تشمل المنهجية استخراج لقطات من الفيديو بشكل دوري، ومعالجتها، ثم تصنيفها اعتماداً على مقياس التشابه بين الصور وتسميات نصية محددة تمثل محتوى ضار أو أمن. كما يعتمد النظام على آلية تصنيف مزدوجة مدعومة بتتبع زمني للإطارات لتحسين دقة النتائج وتقليل الأخطاء. أظهرت نتائج التقييم أن النظام يحقق دقة إجمالية تبلغ 79% مع قدرة عالية على اكتشاف المحتوى الضار، مما يقلل من احتمال تعرض الأطفال المحتوى غير مناسب. وتؤكد النتائج فعالية استخدام التعلم الصفري في تطبيقات الزمن الحقيقي، مع توفير حل قابل للتوسع ويحافظ على خصوصية المستخدم.



