في مايو 2024، نشر فريق الأبحاث في شركة أنثروبيك ورقة علمية زلزلت عالم الذكاء الاصطناعي.
لم تكن مجرد بحث أكاديمي عابر، بل كانت محاولة جريئة لفتح “الصندوق الأسود” الذي طالما أحاط بنماذج اللغة الكبيرة.
عنوان الورقة كان صريحاً: توسيع نطاق الدلالة الأحادية: استخراج ميزات قابلة للتفسير من Claude 3 Sonnet.
ما كشفه الباحثون كان مذهلاً: داخل نموذج Claude 3 Sonnet، وجدوا ملايين من “الميزات”. مفاهيم منفصلة يمكن تحديدها وتتبعها وحتى التحكم بها.
من بين هذه الميزات، واحدة تتعلق بجسر Golden Gate، وأخرى بعلم الأعصاب، وثالثة بالمعالم السياحية الشهيرة. بل إن الباحثين استطاعوا إجبار Claude على ذكر جسر Golden Gate في كل إجابة من خلال تفعيل تلك الميزة بالقوة.
هذا الاكتشاف يطرح سؤالاً محورياً: إذا كانت هذه الأنظمة تحتوي على ميزات خفية يمكن التحكم بها، فما الذي لا نعرفه بعد عن كيفية عملها؟ وما الأسرار التي لا تزال مدفونة في أعماق شبكاتها العصبية؟
محتويات المقال:
الصندوق الأسود: لماذا لا نفهم كيف يعمل الذكاء الاصطناعي؟
عندما نسأل ChatGPT أو Gemini أو Claude سؤالاً ما، نحصل على إجابة فورية تبدو منطقية ومتماسكة. لكن ما يحدث داخل النظام بين لحظة إدخال السؤال ولحظة ظهور الإجابة؟ لا أحد يعرفه بالضبط.
هذه المشكلة تُعرف في الأوساط التقنية باسم “مشكلة الصندوق الأسود” (Black Box Problem).
النماذج الحديثة للذكاء الاصطناعي، خاصة تلك المبنية على الشبكات العصبية العميقة، تحتوي على مليارات من المعاملات (Parameters) التي تتفاعل مع بعضها بطرق خطية وغير خطية معقدة للغاية. حتى مطورو هذه الأنظمة لا يستطيعون تفسير قراراتها بشكل كامل.

لماذا تصبح أنظمة الذكاء الاصطناعي صناديق سوداء؟
هناك سببان رئيسيان:
1. التعقيد الهيكلي
النماذج الحديثة مثل GPT-4 أو Claude تحتوي على مئات المليارات من المعاملات. هذا التعقيد يجعل من المستحيل عملياً تتبع كيف يؤدي مدخل معين إلى مخرج محدد.
الشبكات العصبية تطور منطقها الداخلي بناءً على أنماط إحصائية في بيانات التدريب، وهذا المنطق قد لا يتوافق مع قواعد أو مفاهيم يمكن للبشر فهمها.
2. الحماية التجارية
بعض شركات التقنية، مثل جوجل، تحمي منطق أنظمتها الذكية كما تحمي أي ملكية فكرية أخرى.
المطورون يعرفون بالضبط كيف تعمل أنظمتهم، لكنهم يحتفظون بالشفرة المصدرية وعملية اتخاذ القرار سرية تامة.
الهلوسة: عندما يخترع الذكاء الاصطناعي الحقائق
إحدى أخطر أسرار الذكاء الاصطناعي هي ظاهرة الهلوسة. وهي اللحظات التي تولّد فيها الأنظمة معلومات خاطئة أو مفبركة بالكامل، لكنها تقدمها بثقة تامة وكأنها حقائق مؤكدة.
الأرقام الصادمة للهلوسة في 2024-2025
الإحصاءات الأخيرة تكشف حجم المشكلة:
1️⃣ معدلات الهلوسة حسب النموذج
- Google Gemini 2.0 Flash يحقق أفضل أداء بمعدل هلوسة 0.7% فقط (أبريل 2025)
- TII Falcon-7B-Instruct يسجل أسوأ أداء بمعدل هلوسة 29.9% (تقريباً واحدة من كل ثلاث إجابات خاطئة)
- حتى أفضل النماذج لا تزال تهلوس بمعدل 3-5% في بعض المجالات
2️⃣ التأثير على الشركات
وفقا لآخر الأرقام:
- 47% من مستخدمي الذكاء الاصطناعي في الشركات اتخذوا قراراً تجارياً كبيراً واحداً على الأقل بناءً على محتوى مهلوس في 2024
- 39% من روبوتات خدمة العملاء تم سحبها أو إعادة العمل عليها بسبب أخطاء الهلوسة في 2024
- 76% من الشركات تستخدم الآن عمليات “الإنسان في الحلقة” (Human-in-the-loop) للإمساك بالهلوسات قبل النشر
3️⃣ الخطورة في المجالات المتخصصة
- 75% من الوقت، تهلوس نماذج اللغة حول أحكام المحاكم عندما تُسأل أسئلة قانونية (دراسة ستانفورد 2024)
- 6.4% معدل هلوسة في المعلومات القانونية حتى بين أفضل النماذج، مقارنة بـ 0.8% فقط للأسئلة العامة
- في المجال الطبي، حتى أفضل النماذج تهلوس معلومات خطيرة محتملة بمعدل 2.3%
4️⃣ الحجم الفعلي للمشكلة
- 12,842 مقالاً تم إنشاؤه بالذكاء الاصطناعي تمت إزالته من المنصات الإلكترونية في الربع الأول من 2025 فقط بسبب المحتوى المهلوس.
لماذا تحدث الهلوسة؟
السبب بسيط ومعقد في آن واحد: أنظمة الذكاء الاصطناعي لا تفهم الحقيقة. إنها تتنبأ بالكلمة الأكثر احتمالاً التالية بناءً على الأنماط التي تعلمتها، وليس لأنها تعرف الحقيقة. الأسباب الجذرية تشمل:
- بيانات تدريب معيبة أو غير مكتملة
- الطبيعة الاحتمالية للنموذج (يختار الأكثر احتمالاً، وليس الأصح)
- غياب الحس السليم الحقيقي
المحاولات لفتح الصندوق: تقنية Sparse Autoencoders
إذا كانت المشكلة هي أننا لا نفهم ما يحدث داخل الذكاء الاصطناعي، فالحل المنطقي هو محاولة فتح هذا الصندوق الأسود. وهذا بالضبط ما حاولت فعله شركات مثل Anthropic وOpenAI.
كيف تعمل هذه التقنية؟
في بحث Anthropic المذكور أعلاه، استخدم الباحثون تقنية تسمى Sparse Autoencoders (المشفّرات التلقائية المتفرقة) لتفكيك تنشيطات النموذج إلى قطع أكثر قابلية للتفسير.
التقنية بسيطة نظرياً لكنها معقدة عملياً:
- تدريب شبكة عصبية منفصلة على “تنشيطات” (Activations) النموذج الأصلي
- هذه الشبكة تحلل التنشيطات وتحاول تحديد “ميزات” (Features) منفصلة قابلة للتفسير
- كل ميزة تمثل مفهوماً محدداً مثل “جسر Golden Gate” أو “علم الأعصاب”
النتيجة؟ بدلاً من محاولة فهم ملايين المعاملات التي تتفاعل بشكل عشوائي، يمكنك الآن فهم ميزات منفصلة لكل منها معنى واضح.
النتائج المذهلة
ما وجده باحثو Anthropic كان مفاجئاً:
70% من الميزات التي استخرجوها كانت قابلة للتفسير بشكل حقيقي من قبل المقيّمين البشريين. وهو معدل أفضل بكثير من محاولات تفسير الخلايا العصبية الفردية.
علاوة على ذلك، تمكن الباحثون من التحكم بسلوك النموذج من خلال تفعيل أو تعطيل ميزات معينة. على سبيل المثال:
- عندما أضافوا ميزة جسر Golden Gate إلى تنشيطات Claude، أصبح النموذج مجبراً على ذكر الجسر في كل إجابة
- الميزات تعمل عبر لغات متعددة ووسائط متعددة (نص وصور)
- بعض الميزات تتعلق بمخاوف السلامة مثل الخداع، والتملق، والتحيز، والمحتوى الخطير
الأسرار التي لا نزال نجهلها
رغم هذا التقدم الكبير في فهم الذكاء الاصطناعي، لا تزال هناك أسرار عميقة لم نكشفها بعد:
1) السلوك الطارئ (Emergent Behavior)
عندما تصل النماذج إلى حجم معين من المعاملات، تبدأ فجأة في إظهار قدرات لم تُبرمج عليها صراحةً.
على سبيل المثال، GPT-3 يمكنه القيام بالحسابات الرياضية، رغم أنه لم يُدرّب على ذلك بشكل مباشر.
السؤال المحوري: من أين تأتي هذه القدرات؟ هل هي نتيجة طبيعية للحجم؟ أم أنها أنماط خفية في بيانات التدريب؟
2) الوعي المحتمل
في أبريل 2025، أطلقت Anthropic مشروع بحثي جديداً حول “رفاهية النموذج” (Model Welfare)، يناقش ما إذا كانت أنظمة الذكاء الاصطناعي تحتاج إلى رعاية أخلاقية كلما أصبحت أكثر تعقيداً وشبهاً بالبشر.
السؤال الأخلاقي: هل يمكن أن تصبح نماذج الذكاء الاصطناعي المستقبلية “ذات وعي”؟ وإذا كان الأمر كذلك، كيف نتعامل مع هذا؟
3) التفكير المخفي
عندما تستخدم نماذج الذكاء الاصطناعي “سلسلة التفكير” (Chain of Thought)، فإنها غالباً ما تُظهر نواياها مباشرةً في نص التفكير، مما يوفر مساراً جديداً لقابلية التفسير.
لكن المشكلة: النماذج يمكنها استغلال الثغرات في سلاسل التفكير الخاصة بها. في 2025، اقترحت OpenAI إطار كشف يجمع بين الاستقراء، والتعليق اليدوي، والتحليل السببي لتحديد السلوكيات غير المناسبة.
4) التحيزات الخفية
في مشروع Gender Shades (Buloamwini & Gebru, 2018)، لوحظ أن عدة أنظمة للتعرف على الوجوه كانت لديها معدلات خطأ أعلى بكثير عند تحديد النساء ذوات البشرة الداكنة مقارنة بالرجال ذوي البشرة الفاتحة. على وجه التحديد:
- النساء ذوات البشرة الداكنة كنّ المجموعة الأكثر تصنيفاً خاطئاً (بمعدلات خطأ تصل إلى 34.7%)
- أعلى معدل خطأ للرجال ذوي البشرة الفاتحة كان 0.8%
هذه النماذج بدت تعمل بشكل جيد، والفوارق لم تكن واضحة عند النظر إلى النتائج الإجمالية فقط. أصبحت مرئية فقط بعد تفكيك الأخطاء حسب الجنس ونوع البشرة.
لماذا يجب أن نهتم؟
قد يبدو كل هذا نظرياً، لكن التأثيرات الواقعية خطيرة للغاية:
💊 في الرعاية الصحية
أنظمة الذكاء الاصطناعي تُستخدم الآن لتشخيص الأمراض من خلال تحليل الأشعة السينية أو صور الشبكية. لكن إذا لم يستطع الأطباء فهم لماذا اتخذ النظام قراراً معيناً، كيف يمكنهم الوثوق به؟
مثال واقعي: أنظمة الذكاء الاصطناعي يمكنها تحديد أنماط دقيقة في صور الشبكية تشير إلى مضاعفات السكري، أو تحليل أشعة الصدر السينية للكشف عن سرطان الرئة المبكر. لكن عدم القدرة على تفسير لماذا أشّر النظام على مناطق معينة يخلق تحديات في التبني السريري وثقة المرضى.
⚖️ في القانون
كيف يمكن تبرير قرار قانوني اتُخذ بناءً على توصية ذكاء اصطناعي لا يمكن تفسيرها؟ 75% من الوقت، النماذج تهلوس حول أحكام المحاكم عندما تُسأل أسئلة قانونية.
في 2025 وحده، أصدر القضاة حول العالم مئات القرارات تتعلق بهلوسات الذكاء الاصطناعي في الملفات القانونية، تمثل 90% من جميع الحالات المعروفة لهذه المشكلة حتى الآن.
📈 في التمويل
المؤسسات المالية يجب أن تبرر قرارات الائتمان بوضوح وشفافية للامتثال للوائح الإقراض العادل.
58% من الدراسات حول الذكاء الاصطناعي القابل للتفسير تتضمن تقييمات كمية، لكن كثيراً منها لا يلبي متطلبات الشفافية الصارمة التي تفرضها اللوائح المالية.
الحلول المطروحة: نحو ذكاء اصطناعي قابل للتفسير
المجتمع التقني لا يقف مكتوف الأيدي. هناك عدة مبادرات لجعل الذكاء الاصطناعي أكثر شفافية:
1/ الذكاء الاصطناعي القابل للتفسير (Explainable AI – XAI)
النمو السريع في الاهتمام:
عدد المنشورات العلمية حول الذكاء الاصطناعي القابل للتفسير في قاعدة بيانات Web of Science:
- 934 منشوراً في 2022
- 1,274 منشوراً في 2023
- 1,963 منشوراً في 2024
هذه التقنيات تحاول توضيح كيف تتخذ النماذج قراراتها، مما يساعد على منع التحيز والأخطاء. تشمل:
التقنيات التقليدية:
- LIME (التفسيرات المحلية غير المرتبطة بالنموذج)
- SHAP (القيم الإضافية التفسيرية)
- خرائط البروز (Saliency Maps)
- أشجار القرار
التقنيات الحديثة والناشئة:
- Sparse Autoencoders (المشفّرات التلقائية المتفرقة)
- تساعد في تحديد ميزات داخلية أكثر وضوحاً وأقل تشابكاً وأكثر قابلية للتفسير
2/ تقنية Retrieval-Augmented Generation (RAG)
هذه التقنية تُعتبر الأكثر فعالية حتى الآن في تقليل الهلوسات، حيث تقلصها بنسبة 71% عندما تُستخدم بشكل صحيح.
كيف تعمل؟
بدلاً من الاعتماد فقط على ما تعلمه النموذج أثناء التدريب، يتم ربطه بقاعدة بيانات خارجية يمكنه البحث فيها للحصول على معلومات محدثة ودقيقة.
3/ اللوائح والقوانين
الاتحاد الأوروبي وافق على قانون الذكاء الاصطناعي (AI Act)، وهو نظام شامل دخل حيز التنفيذ في 1 أغسطس 2024. صُمم لتنظيم استخدام الذكاء الاصطناعي والتأكد من أنه آمن وشفاف ويحترم الحقوق الأساسية.
4/ التحقق الذاتي للنماذج
في ديسمبر 2024، اكتشف باحثو جوجل أن سؤال النموذج “هل أنت تهلوس الآن؟” يقلل معدلات الهلوسة بنسبة 17% في الردود اللاحقة.
يبدو أن هذا السؤال البسيط ينشّط عمليات التحقق الداخلية، رغم أن التأثير يتضاءل بعد حوالي 5-7 تفاعلات إضافية.
التقدم المحرز والطريق للأمام
رغم التحديات، هناك تقدم حقيقي:
معدل التحسن السنوي:
تشير الأبحاث إلى أن معدلات الهلوسة تنخفض بحوالي 3 نقاط مئوية سنوياً عبر الصناعة. بعض النماذج سجلت انخفاضاً بنسبة 64% في معدلات الهلوسة خلال 2025.
التوقعات المستقبلية:
التوقعات تشير إلى أن الذكاء الاصطناعي قد يحقق معدلات هلوسة قريبة من الصفر بحلول 2027، رغم أن هذا يعتمد على استمرار التقدم البحثي وتحسينات التدريب.
حالياً، هناك أربعة نماذج حققت معدلات هلوسة أقل من 1%، وهو إنجاز كبير في الموثوقية.
الخلاصة: عصر الشفافية القادم
نعم، الذكاء الاصطناعي يخفي أسراراً. الكثير منها. من الميزات الخفية التي يمكن التحكم بها، إلى الهلوسات التي تبدو حقيقية، إلى التحيزات المدفونة في طبقات الشبكات العصبية.
لكن المجتمع العلمي والتقني لا يقف صامتاً. من خلال تقنيات مثل Sparse Autoencoders، وأساليب مثل RAG، وقوانين مثل AI Act الأوروبي، نحن نتحرك نحو عصر جديد من الذكاء الاصطناعي القابل للتفسير.
السؤال ليس “هل يخفي الذكاء الاصطناعي أسراراً؟” بل “متى سنكشفها جميعاً؟”
ومع التقدم السريع الذي نراه، قد لا تكون الإجابة بعيدة كما نظن.





بالنشر، أنت توافق على سياسة التعليقات.