المواقع الإخبارية في مواجهة بوتات الذكاء الاصطناعي .. رصد حالة للصحافة الأجنبية والعربية
كتب / شريف عبدالمنعم
قبل نحو أسبوعين، طرحت مبادرة وورقة عمل لإنقاذ الصحافة الرقمية من بوتات الذكاء الاصطناعي، وذلك في ظل انخفاض مشاهدات المواقع الإخبارية نتيجة استكفاء قطاع متزايد من الجمهور بالنتائج التي تقدمها تطبيقات الذكاء الاصطناعي، وخاصة ميزة جوجل (AI Overviews) التي تقدم ملخصات سريعة في أعلى صفحة نتائج البحث، وتلغي حاجة الجمهور إلى زيارة المواقع الأصلية صاحبة المعلومة.
وضمن المبادرة التي حملت عنوان (إنقاذ الصحافة الرقمية.. كيف نروض بوتات الذكاء الاصطناعي؟)، طرحنا أحد الحلين لحماية المحتوى الرقمي والحفاظ على البنية التحتية للمواقع الإلكترونية التي تكلفت مليارات الدولارات، وكان الحلان هما:
- إما محاولة الوصول لاتفاقات عادلة مع الشركات المسؤولة عن بوتات الذكاء الاصطناعي قبل أن يتم السماح لها بالدخول إلى المواقع ونسخ محتواها.
- وإما حظر بوتات الذكاء الاصطناعي من الدخول إلى المواقع الإلكترونية بالخطوات التقنية والقانونية التي تحمي المحتوى من السرقة.
ورغم أن المبادرة تضمنت نموذجاً استرشادياً لحظر بعض أسماء بوتات الذكاء الاصطناعي عبر ملف الزحف (robots.txt) الخاص بكل موقع، ولكن في الحقيقة لم أكن قد بحثت بعد في الصحافة الغربية التي نفذت مثل ذلك الحظر، لأن أحد الحلول التقنية التي طرحتها ظهر أمامي بالصدفة حين اطّلعت أثناء تهيئة موقع “برس بوست” في Cloudflare على خاصية الحظر الأوتوماتيكية (block ai bots)، وقلت لنفسي حينها إن تلك الخاصية يمكن تدعيمها بحظر إضافي عبر (robots.txt) الخاص بالزحف داخل كل موقع.
ومن أجل موثوقية الطرح، فحصت لاحقاً بعض المواقع الإخبارية العالمية، للتأكد من الخطوات التي اتخذتها مع بوتات الذكاء الاصطناعي، كي تكون مرجعاً للصحافة العربية في الخطوات التي يمكن أن تتخذها لحماية محتواها، كما تضمن الفحص بعض المواقع العربية وكيفية تعاملها مع بوتات الذكاء الاصطناعي.
الصحافة الأجنبية.. مجزرة البوتات
بداية الفحص، كانت مع النسخة الإنجليزية الدولية لشبكة CNN الإخبارية الأمريكية، حيث يشير ملف الزحف (robots.txt) الخاص بها إلى أنها قامت بما يمكن وصفه بـ”مجزرة البوتات”، حيث حظرت بالاسم العشرات من بوتات الذكاء الاصطناعي المعروفة وغير المعروفة ومنعتها من الزحف إلى موقع الشبكة ونسخ محتواه.
وشمل الحظر بوتات الذكاء الاصطناعي الخاصة بالشركات الكبرى مثل “Google” و”OPEN AI” و”META”.. إلخ، باستخدام أمر (/ :Disallow) أي ممنوعين من الزحف نهائياً، وسمح الملف بالزحف فقط لبوتات “Google” الأساسية المسؤولة عن البحث التقليدي: وهي Googlebot (للبحث العادي) وGooglebot-News (بحث الأخبار)، أما بوت Google-Extended الذي يُستخدم في تدريب نماذج الذكاء الاصطناعي فقد حظرته الشبكة.
أما صحيفة “نيويورك تايمز” نجد هناك اختلافاً بعض الشيء حيث وضعت الصحيفة إعلاناً قانونياً في بداية الملف شددت فيه على ما يلي:
- المحتوى متاح للاستخدام الشخصي وغير التجاري فقط.
- يمنع منعاً باتاً استخدام أي أدوات أو برمجيات أو تقنيات للتنقيب في البيانات و نسخ المحتوى (Scraping) بشكل آلي، إلا بموافقة مكتوبة مسبقة من الشركة المالكة للصحيفة، وذلك لحماية المحتوى من أن يُستخدم في تدريب الذكاء الاصطناعي أو في قواعد بيانات شركات أخرى.
- وبالطبع شمل الملف حظر بوتات GPTBot و CCBot و Google-Extended.
أما صحيفة الجارديان البريطانية فوضعت إعلاناً قانونياً هي الأخرى، يماثل الإعلان الذي وضعته “نيويورك تايمز” في بداية ملف الزحف، لكن “الجارديان” أضافت عشرات الأسماء من بوتات الذكاء الاصطناعي إلى الملف مثلما فعلت “سي إن إن”.
الصحافة العربية.. مواقف متباينة
المثير للانتباه، أنه بفحص ملفات الزحف الخاصة ببعض المواقع الإخبارية العربية، كانت هناك مواقف متباينة، فأحدها سمح بالاسم لبعض بوتات الذكاء الاصطناعي بالزحف إلى محتواه، في حين أن البعض الآخر لم يرد في ملفاته ما يشير إلى بوتات الذكاء الاصطناعي من الأساس.
على سبيل المثال، الموقع الإلكتروني لصحيفة اليوم السابع المصرية لم يسمح فقط بزحف بوتات الذكاء الاصطناعي إلى محتواه، وإنما ذكر أيضاً بالأسماء أنه يسمح لبوتات GPTBot, CCBot, Perplexity بالزحف إلى موقعه.
أما صحف “الوطن المصرية” و”المصري اليوم” و”القاهرة 24″ و”الشرق الأوسط” و”الاتحاد الإماراتية” و”هسبريس المغربية”، والمواقع الإلكترونية لقنوات “العربية” و”الشرق” و”سكاي نيوز عربية” – على سبيل المثال – فلا يوجد في ملفات الزحف الخاصة بها – حتى كتابة التقرير – أي أوامر بالسماح أو حظر الزحف لأي بوت خاص بالذكاء الاصطناعي.
أخيراً.. نجدد التأكيد على أنه إذا لم يتم التوصل إلى اتفاقات مرضية مع عمالقة التكنولوجيا، لن يكون هناك مفر سوى حظر بوتات الذكاء الاصطناعي، وإن كنت كما ذكرت أدعو شركة جوجل تحديداً إلى المبادرة بوضع الحلول التقنية لحظر البوتات غير المرغوب فيها، لأن “جوجل” شريكة في إنجاح المواقع الإلكترونية، ولا يتعارض رفض الناشرين لميزة (AI Overviews) مع الدور المحوري والأساسي لمحرك بحثها الشهير في فهرسة المحتوى المكتوب والمصور وإظهاره للمستخدمين، وبالتالي فإن الحفاظ على بقاء الصحف الرقمية في وضع قوي هو مصلحة لـ”جوجل” بشكل أساسي.
نود أيضاً التأكيد على ضرورة وجود تكتلات قوية تجمع المؤسسات الإعلامية في كل نطاق جغرافي للتفاوض مع الشركات المالكة لبوتات الذكاء الاصطناعي وأن يكون هناك نقاشات موسعة يشارك فيها الصحفيون والتقنيون والقانونيون وخبراء المالية، حتى نصل في النهاية إلى غايتنا المنشودة وهي ترويض بوتات الذكاء الاصطناعي لخدمة الصحافة الرقمية، وليس الاستمرار في ترك الصحافة الرقمية فريسة سهلة لتلك البوتات !
ملحوظة: خلال إعداد التقرير تم توثيق ملفات الزحف الخاصة بالصحف والمواقع المذكورة عبر لقطات شاشة. ولكننا لم ننشر هذه اللقطات رغم أنها متاحة علنًا، وذلك مراعاة لوجود بعض التأخيرات أو النواقص التقنية في تحديث الملفات لدى بعض المواقع..
- عن الكاتب:
• شريف عبدالمنعم، خبير الإعلام الرقمي، وعضو نقابة الصحفيين المصريين.
• أسس موقع “برس بوست” المهتم بأخبار ودراسات الصحافة والإعلام والذكاء الاصطناعي عام 2025، ويقدم استشارات في إدارة وتطوير الإعلام الرقمي (مواقع إخبارية وقنوات يوتيوب) للعديد من المؤسسات الكبرى.
• عمل في العديد من الصحف والمواقع الإخبارية المصرية المرموقة مثل “المصري اليوم” و”الوفد”، كما عمل في العديد من الصحف السعودية والإماراتية، وفي قنوات “دريم، وإم بي سي، والتحرير” والإذاعة الهولندية، وكان من المساهمين في تأسيس “بوابة العين الإخبارية”.
• خاض مجال التدريب الصحفي في العديد من المؤسسات مثل “مركز أخبار اليوم للتدريب، والهيئة المصرية العامة للاستعلامات، والمركز المصري للتطوير الإعلامي”، وله إسهامات بحثية متعددة في مجالات الصحافة المطبوعة والإعلام الرقمي.
للتواصل مع الكاتب عبر لينكد إن.. اضغط هنا
للتواصل مع الكاتب عبر فيسبوك.. اضغط هنا
للتواصل مع الكاتب عبر البريد الإلكتروني: [email protected]
