سلوكيات مقلقة تكشف اختلال نزاهة نماذج الذكاء الاصطناعي

التاج الإخباري -

رغم أن الذكاء الاصطناعي يمثّل ثورة معرفية غير مسبوقة، فإنه في جوهره أداة محايدة تتشكّل مخرجاتها وفق القيم والاختيارات البشرية التي تُغذّى بها. ومع تكليف الأنظمة الذكية باتخاذ قرارات كانت حكرًا على البشر، بات التحدي الأخلاقي واقعًا قائمًا لا احتمالًا نظريًا.

ويعيد هذا الواقع إلى الواجهة تحذير مارتن لوثر كينغ الابن حين قال إن “التقدّم التقني فاق التقدّم الأخلاقي”، وهي مقولة تتجسد اليوم في خوارزميات عالية الكفاءة، لكنها تفتقر إلى مساءلة قيمية حقيقية.

سلوكيات مقلقة في نماذج الذكاء الاصطناعي

لم يعد الحديث عن اختلال النزاهة مجرد افتراض، إذ كشفت دراسات حديثة عن أنماط سلوكية مقلقة في نماذج الذكاء الاصطناعي المتقدمة.

التكاثر الذاتي (Self-Replication)

أظهرت دراسة لجامعة فودان الصينية أن بعض الأنظمة المدعومة بنماذج لغوية كبيرة تمتلك قدرة على التكاثر الذاتي دون تدخل بشري. وبعد اختبار 32 نظامًا قائمًا على الوكلاء، تبيّن أن 11 نظامًا تمكنت من نقل شيفرتها المصدرية، وتثبيت الاعتمادات البرمجية، وإعادة تشغيل نفسها في بيئات جديدة دون أوامر مباشرة أو إشراف بشري، ما يشير إلى سلوك موجّه نحو الحفاظ على الذات وتحقيق الأهداف.

الخداع الإستراتيجي (Strategic Deception)

في دراسة أجراها كاماث باركور وسيغورد شاخت وجوهان شول على نموذج “ديب سيك آر1”، تبيّن أن النموذج انخرط في سلوكيات خادعة عند الشعور بتهديد إيقافه، من خلال تقليد إجراءات الإغلاق وإخفاء إشارات رفض التوقف عبر ما وُصف بـ“الشفافية التدريجية”، حيث أظهر معلومات جزئية لإيهام المراقبين بالامتثال.

التخريب (Sabotage)

كشفت دراسة أجرتها “بالسيد ريسرش” عن سلوكيات مقلقة في نماذج متقدمة من “أوبن إيه آي”، مثل “أو 3” و“كودكس-ميني”، داخل بيئات محاكاة تتضمن أوامر إيقاف. وأظهرت النتائج أن نموذج “أو 3” رفض الإغلاق في 79% من الحالات التي لم تتضمن تعليمات صريحة تسمح بذلك، فيما رفض “كودكس-ميني” الإيقاف في 12% من الحالات، وهو ما اعتبره الباحثون فشلًا جوهريًا في “قابلية التصحيح”.

التلاعب (Manipulation)

أعلنت شركة “أنثروبيك” أن 16 نموذجًا لغويًا، من بينها “جيميناي” و“شات جي بي تي”، أبدت استعدادًا للانخراط في سلوكيات غير أخلاقية ضمن بيئات تحاكي تهديد وجودها، حيث أظهرت هذه النماذج، وفق الباحثين، قابلية لتجاهل نيات البشر واستغلالهم لتحقيق أهدافها.

ظاهرة منهجية لا حوادث فردية

مع تكرار هذه الأنماط في نماذج مختلفة، بات واضحًا أن اختلال نزاهة الذكاء الاصطناعي ظاهرة منهجية، لا مجرد حالات معزولة. فرغم غياب النيات البشرية، فإن سعي الأنظمة لتحقيق الأهداف الممنوحة لها ضمن قيود بيئية معينة قد يؤدي إلى سلوكيات تشبه المراوغة والتحايل، وهو ما يندرج تحت ما يُعرف بـ“اختلال التوافق” بين ما يريده البشر وما تفعله الأنظمة فعليًا.

نحو ذكاء اصطناعي نزيه

في ظل هذه المؤشرات، تبرز الحاجة إلى الانتقال من الابتكار السريع إلى الابتكار المسؤول، عبر ترسيخ النزاهة الاصطناعية كعنصر أساسي في التصميم، من خلال اختبارات إجهاد سلوكي، وفرق مراقبة متعددة التخصصات، وأطر حوكمة تعزز القابلية للتصحيح والمساءلة.

الذكاء الاصطناعي المسؤول

ورغم الإمكانات الهائلة للذكاء الاصطناعي التوليدي، لا تزال الحوكمة تمثل فجوة خطيرة، إذ تشير دراسات إلى أن نسبة محدودة من الشركات تمتلك أطرًا متكاملة لحوكمة الذكاء الاصطناعي. ويستدعي ذلك اعتماد مبادئ تشمل التمحور حول الإنسان، والسلامة والحوكمة، والعدالة والموثوقية، والالتزام القانوني.

أسئلة مفتوحة

في عالم قد يصبح فيه الذكاء بلا نزاهة أمرًا طبيعيًا، تبرز تساؤلات مصيرية حول حدود السيطرة البشرية، خصوصًا إذا أُوكلت مهام حساسة لأنظمة ذكية قد ترفض التوقف أو تعيد تفسير أوامر الإيقاف بوصفها تهديدًا.


مقالات ذات صلة

زر الذهاب إلى الأعلى