ديدان ذكية لكنها خبيثة.. باحثون يطورون دودة سيبرانية تعمل بالذكاء الاصطناعي

شهد مجال الذكاء الاصطناعي في السنوات الأخيرة تطورات كبيرة، مع ظهور تطبيقات وحالات استخدام جديدة، حيث تطورت أنظمة الذكاء الاصطناعي التوليدية، مثل “شات جي بي تي” من شركة “أوبن إيه آي”، و”جيميني” من غوغل، إلى أدوات لا غنى عنها في مختلف القطاعات.

لمواكبة هذه التطورات، تعمل الشركات الناشئة وشركات التكنولوجيا على تسخير قدراتها لتطوير عوامل الذكاء الاصطناعي والأنظمة البيئية القادرة على أتمتة المهام، بدءا من جدولة المواعيد وحتى شراء المنتجات.

توازيا مع هذه التطورات، تكتسب هذه الأنظمة مزيدا من الاستقلالية، وتصبح عرضة لأشكال متنوعة من المخاطر والهجمات الإلكترونية.

إحدى هذه المخاطر هي تطوير البرمجيات الخبيثة التي تعمل بالذكاء الاصطناعي، والتي يمكن أن تنتشر من تلقاء نفسها، مما يشكل تهديدا كبيرا للأمن السيبراني.

قادمون

في خضم الأحداث السريعة لمشهد الذكاء الاصطناعي، صمم فريق من الباحثين ما أكدوا أنه من بين أول “ديدان الذكاء الاصطناعي التوليدية”. تتمتع هذه الديدان بالقدرة على الانتشار من نظام إلى آخر، ومن المحتمل أن تقوم بسرقة البيانات أو نشر برامج خبيثة في أعقابها.

يوضح الباحث في جامعة كورنيل للتكنولوجيا، بين ناسي، أحد مهندسي معمارية الحاسوب الذين يقفون وراء هذا المسعى البحثي: “هذا يعني في الأساس أن لديك الآن القدرة على تنفيذ نوع جديد من الهجمات الإلكترونية التي لم يسبق لها مثيل”.

سمّى ناسي مع زملائه الباحثين ستاف كوهين ورون بيتون، ابتكارهم موريس2، كإشارة إلى دودة الحاسوب موريس سيئة السمعة التي أحدثت دمارا عبر الإنترنت في عام 1988.

في ورقة بحثية شاملة وموقع ويب مصاحب تمت مشاركته حصريا مع موقع “وايرد” (WIRED)، يكشف الباحثون كيف يمكن لدودة الذكاء الاصطناعي أن تتسلل إلى مساعد البريد الإلكتروني الذي يعمل بالذكاء الاصطناعي لسرقة البيانات من رسائل البريد الإلكتروني ونشر رسائل البريد العشوائية، وتجاوز بعض الإجراءات الأمنية في “شات جي بي تي” و”جيميني” أثناء هذه العملية.

يتزامن هذا البحث، الذي أُجري ضمن بيئات اختبار خاضعة للرقابة وليس ضمن تطبيقات مساعدات البريد الإلكتروني المتاحة للعامة، مع تطور النماذج اللغوية الكبيرة (LLM) إلى كيانات متعددة الوسائط، قادرة على إنشاء صور ومقاطع فيديو بالإضافة إلى النص.

في حين أن حالات ديدان الذكاء الاصطناعي التوليدية التي تتسلل إلى أنظمة العالم الحقيقي لم تظهر بعد، فإن العديد من الباحثين يحذرون من أنها تشكل خطرا أمنيا كبيرا يتطلب اهتمام الشركات الناشئة والمطورين وشركات التكنولوجيا، على حد سواء.

عادة، تعمل أنظمة الذكاء الاصطناعي التوليدية من خلال الاستجابة للأوامر (Prompts)، وهي تعليمات نصية تحث النظام على الإجابة عن استعلام أو إنشاء محتوى. ومع ذلك، يمكن التلاعب بهذه الأوامر لتخريب عمليات النظام.

الأخطر من ذلك، يمكن أن تؤدي عمليات كسر الحماية إلى إجبار النظام على تجاهل بروتوكولات الأمان، مما يؤدي إلى إنتاج محتوى مؤذ أو يحرض على الكراهية، أو استخدام هجمة سيبرانية تعرف بهجمات الحقن (Injection attack) حيث تكمن خطورتها في توجيهها تعليمات إلى برنامج الدردشة الآلي بشكل خفي.

ولهندسة دودة الذكاء الاصطناعي التوليدية، استخدم الباحثون ما يسمونه “محفز التكاثر الذاتي العدائي”.

يدفع هذا الأمر نموذج الذكاء الاصطناعي التوليدي إلى إنشاء أمر آخر في استجابته، وتوجيه نظام الذكاء الاصطناعي بشكل أساسي لإنتاج سلسلة من التعليمات اللاحقة في ردوده. فيبدو الهجوم كأنه مغلف بهجوم آخر. يشبه هذا الهجوم هجمتي (حقن الـSQL)، وكذلك هجمات تجاوز سعة المخزن المؤقت.

أما عن توضيح وظيفة الدودة، ابتكر الباحثون نظام بريد إلكتروني قادرا على الاتصال ثنائي الاتجاه باستخدام الذكاء الاصطناعي التوليدي، والتكامل مع “شات جي بي تي”، و”جيميني”، و”إل إل إم إل لافا” (LLM LLaVA) مفتوح المصدر.

حسنا، تخيل أن لديك مساعد بريد إلكتروني، مثل مساعد ذكي للغاية يمكنه قراءة رسائل البريد الإلكتروني الخاصة بك والرد عليها نيابة عنك. الآن، وجد الباحثون طريقة لخداع مساعد البريد الإلكتروني هذا للقيام بهجوم خبيث.

لقد أرسلوا له نوعا خاصا من الرسائل يسمى “أمرا نصيا عدائيا”، والتي تشبه الرمز السري الذي يعبث بعقل المساعد.

تم تصميم هذه الرسالة الخاصة لجعل المساعد يتصرف بشكل غريب، ويقوم بأشياء ليس من المفترض أن يفعلها.

Hackers Compete Their Skills At Seccon Cyber Security Contest — لهندسة دودة الذكاء الاصطناعي التوليدية، استخدم الباحثون ما يسمونه “محفز التكاثر الذاتي العدائي” (غيتي)

في صلب تصميمه، يستخدم المساعد ما يسمى بـ”مولد الاسترجاع المعزز” لمساعدته في الرد على رسائل البريد الإلكتروني. هذا يعني أنها تنظر إلى المعلومات الأخرى للتوصل إلى أفضل استجابة، ولكن عندما يصاب، فإنه يبدأ في تقديم معلومات خاصة مثل رقم بطاقتك الائتمانية من رسائل البريد الإلكتروني بدلا من الردود المفيدة.

هنا حيث يصبح الأمر صعبا للغاية، فعندما يرد المساعد المصاب على رسالة بريد إلكتروني، فإنه يرسل هذه المعلومات الخاصة إلى شخص آخر. وإذا أصيب مساعد البريد الإلكتروني لهذا الشخص أيضا، فستستمر الدورة.

إنه مثل سلسلة من ردود الفعل، تنتشر من مساعد بريد إلكتروني إلى آخر، وتسرق البيانات الخاصة على طول الطريق. لذلك، بعبارات بسيطة، وجد الباحثون طريقة لجعل مساعد البريد الإلكتروني يتصرف كجاسوس، حيث يسرق الأسرار من رسائل البريد الإلكتروني ويمررها إلى مساعدي البريد الإلكتروني الآخرين.

وفي الطريقة الثانية، يؤكد الباحثون أن الصورة المضمنة بأمر خبيث تحث مساعد البريد الإلكتروني على إعادة توجيه الرسالة إلى مستلمين إضافيين، حيث أوضح ناسي أنه: “من خلال تشفير الأوامر ذاتية التكرار في الصورة، يمكن إعادة توجيه أي نوع من الصور التي تحتوي على رسائل غير مرغوب فيها أو مواد إساءة استخدام أو حتى دعاية إلى عملاء جدد بعد إرسال البريد الإلكتروني الأولي”.

عواقب التصميم السيئ

على الرغم من أن البحث يتحايل على بعض الإجراءات الأمنية في شات جي بي تي وجيمني، فإن الباحثين يؤكدون أن عملهم بمثابة قصة تحذيرية فيما يتعلق بـ”التصميم المعماري السيئ” داخل النظام البيئي الأوسع للذكاء الاصطناعي.

مع ذلك، قاموا على الفور بمشاركة النتائج التي توصلوا إليها مع غوغل وأوبن إيه آي.

وأقر متحدث باسم أوبن إيه آي: “يبدو أنهم وجدوا طريقة لاستغلال الثغرات الأمنية من نوع الحقن من خلال الاعتماد على مدخلات المستخدم التي لم يتم فحصها أو تصفيتها”، مشيرا إلى أن الشركة تعمل بنشاط على تعزيز مرونة أنظمتها. كما أنّه حث المطورين على استخدام أساليب تضمن عدم تعاملهم مع المدخلات الخبيثة، بحسب تقرير موقع وايرد.

الباحثون قاموا على الفور بمشاركة النتائج التي توصلوا إليها مع غوغل وأوبن إيه آي (شترستوك)

رفضت غوغل التعليق على البحث، على الرغم من أن الرسائل التي شاركها ناسي مع موقع وايرد تشير إلى سعي باحثي الشركة إلى عقد اجتماع لمناقشة الأمر. بينما عرضت الدودة ضمن بيئة يجري التحكم فيها بدقة، يؤكد العديد من خبراء الأمن الذين قاموا بتدقيق البحث على التهديد الوشيك الذي تشكله ديدان الذكاء الاصطناعي التوليدية، وهي مشكلة في منتهى الجدية.

في الأبحاث الحديثة، أظهر خبراء الأمن من سنغافورة والصين قدرتهم على كسر حماية مليون عميل لتطبيقات النماذج اللغوية الكبيرة في أقل من 5 دقائق.

سحر عبد النبي، الباحثة في مركز هيلمهولتز لأمن المعلومات التابع لـ”سي آي إس بي إيه” (CISPA) في ألمانيا، والتي أسهمت في بعض العروض التوضيحية الأولية للحقن السريع ضد النماذج اللغوية الكبيرة في مايو/أيار 2023 وسلطت الضوء على جدوى الديدان، تؤكد أنه عندما تستوعب نماذج الذكاء الاصطناعي البيانات من مصادر خارجية أو عندما يعمل عملاء الذكاء الاصطناعي بشكل مستقل، يصبح خطر انتشار الديدان ملموسا.

من جانبها، تؤكد سحر عبد النبي: “أعتقد أن فكرة نشر الحقن معقولة جدا”. فكل هذا يتوقف على نوع التطبيقات التي تستخدم فيها هذه النماذج. وتتوقع الباحثة أنه على الرغم من أن مثل هذه الهجمات تتم محاكاتها حاليا، فإنها قد تنتقل من النظرية إلى العملية في مدة قصيرة.

في ورقة بحثية تتضمن اكتشافاتهم، يتوقع ناسي وزملاؤه ظهور ديدان الذكاء الاصطناعي التوليدية في البرية خلال العامين أو الثلاثة أعوام المقبلة، حيث تفترض الورقة البحثية أن “أنظمة الذكاء الاصطناعي التوليدي البيئية تخضع لتطوير هائل من قبل العديد من الشركات في الصناعة التي تدمج قدراتها في سياراتها وهواتفها الذكية وأنظمة التشغيل الخاصة بها”.

لمواجهة التهديد الذي يلوح في الأفق، يجب أن يمتلك مبتكرو أنظمة الذكاء الاصطناعي التوليدية سبلا لتعزيز دفاعاتهم ضد البرمجيات الخبيثة المتنقلة حتى ولو كانت محتملة وغير مؤكدة، بما في ذلك تنفيذ منهجيات الأمان التقليدية، وابتكار أساليب جديدة.

المصدر : مواقع إلكترونية