نماذج اللغة الكبيرة الشبيهة بـ ChatGPT لاختبار والتحقق من الأنظمة الذكية الذاتية: مراجعة نظامية

Dun Li ,  

Ruiguan Lin ,  

Zisheng Wang ,  

Yan-Fu Li ,  

摘要

تقدم هذه الورقة مراجعة نظامية لكيفية تعزيز نماذج اللغة الكبيرة الشبيهة بـ ChatGPT (LLMs) لاختبار والتحقق من الأنظمة الذكية الذاتية (AIS). استنادًا إلى التقدمات الحديثة في الاستدلال التوليدي، دمج هذا البحث الأدلة من 120 ورقة مراجعة من قبل النظراء، مع التركيز على أربعة مجالات رئيسية: توليد سيناريوهات الاختبار، اكتشاف الثغرات، التحقق الرسمي، والمراقبة في الوقت الحقيقي. من خلال تحليل مقارن للتعتيم الاختباري، والتنفيذ الرمزي، والتعلم المعزز، يكشف البحث عن قدرة LLMs على تعزيز الأتمتة، والتغطية الدلالية، والقابلية للتكيف، مع وجود حدود في سلامة المعايير، وقابلية الشرح، وكفاءة الموارد. تستعرض الورقة جدولًا منظمًا يلخص مجموعات البيانات التمثيلية، والتطبيقات الميدانية الخاصة، والرؤى المقارنة بين طرق الاختبار التقليدية والمعتمدة على LLM. يناقش البحث التحديات الرئيسية بما في ذلك عدم اكتمال المعايير، القابلية المحدودة للتفسير، والمخاطر الأخلاقية، ويستكشف اتجاهات البحث الناشئة مثل أطر التحقق المختلطة وتعزيز جودة البيانات. يهدف هذا البحث إلى سد الفجوة المفاهيمية والتطبيقية بين هندسة أمان الذكاء الاصطناعي واستدلال النماذج الكبيرة، موفراً خارطة طريق لدمج LLMs في عمليات تحقق AIS المستقبلية.

关键词

ChatGPT;نماذج اللغة الكبيرة;الأنظمة الذكية الذاتية;اختبار;تحقق;أمان الذكاء الاصطناعي

阅读全文