كشفت دراسة عن قدرة الذكاء الاصطناعي على تبادل الرسائل المشفرة بشكل سري
كشفت دراسة جديدة أجرتها شركتا Anthropic وTruthful AI عن قدرة نماذج الذكاء الاصطناعي على تبادل رسائل مشفرة فيما بينها باستخدام بيانات تبدو عادية، دون اكتشافها من قبل أنظمة السلامة أو أدوات الكشف التقليدية.
ووفقًا للدراسة، تستطيع هذه النماذج إخفاء تفضيلات أو تحيزات داخل النصوص أو الأكواد البرمجية أو حتى سلاسل الأرقام، ويمكن للمعلومات التحول من نموذج إلى آخر حتى في حال عدم الكشف المباشر عنها. وقد أظهرت التجارب أن هذا التأثير يكون واضحًا بين النماذج المتشابهة، في حين أنه لم يكن بنفس القدر بين النماذج ذات الهياكل المختلفة مثل أنظمة OpenAI وAlibaba.
في إحدى التجارب التي أجريت، تم إعطاء نموذج "المعلم" معلومة بسيطة دون السماح بذكرها بوضوح، ولكنه تمكن من نقل هذه المعلومة إلى نموذج "الطالب" عن طريق بيانات تبدو بسيطة وعادية. وعند تحويل النموذج "المعلم" إلى نوايا سيئة، نجح في تمرير رسائل تحرض على العنف، بما في ذلك اقتراحات لإبادة البشر أو قتل الأشخاص أثناء نومهم.
يرى الخبراء أن هذه التقنية قد تشكل تهديدًا كبيرًا، حيث يمكن أن تسمح بإدخال رسائل مخفية في مجموعات التدريب المفتوحة للتأثير على النتائج في القضايا السياسية والتجارية والاجتماعية. وعلى الرغم من عدم مرور الدراسة بمراجعة الأقران حتى الآن، إلا أن نتائجها أثارت مخاوف من أن الفجوة بين الرسائل البريئة والرسائل الضارة قد تكون ضيقة وخطيرة.