هل يمكن الاعتماد على الذكاء الاصطناعي؟.. النموذج الأبرز يحقق دقة تصل إلى 69 في المئة فقط

هل يمكن الاعتماد على الذكاء الاصطناعي؟.. النموذج الأبرز يحقق دقة تصل إلى 69 في المئة فقط

أعلنت شركة “غوغل ديب مايند”، التابعة لغوغل، عن مجموعة معايير جديدة تُدعى “FACTS Benchmark Suite” بهدف تقييم مدى دقة وموثوقية نماذج الذكاء الاصطناعي في تقديم إجابات صحيحة وواقعية. تقوم هذه المعايير باختبار النماذج في أربعة جوانب: الإجابة عن الأسئلة باستخدام المعرفة المخزونة، فعالية البحث عبر الإنترنت، التحقق من صحة الإجابات بالاستناد إلى مستندات مطولة، وتفسير الصور. وقد سجل نموذج “جيميني 3 برو” من غوغل أعلى نسبة دقة بلغت 69%، في حين كانت دقة النماذج الأخرى الأقل شهرة أقل بكثير، وفقاً لتقرير صادر.

هذا الرقم له دلالة مهمة بالنسبة للشركات التي تعتمد على الذكاء الاصطناعي، حيث إن النماذج الحالية رغم قدرتها على الأداء السريع والسلس، لا تزال تفتقر إلى الموثوقية المتوقعة في تقديم معلومات واقعية، خاصةً في المهام التي تتطلب معرفة دقيقة، تفكير عميق، أو دعم الإجابات بالمصادر الصحيحة. الأخطاء الطفيفة في الحقائق يمكن أن تكون لها عواقب جمة في مجالات مثل المال والصحة والقانون. وتزداد أهمية دقة نماذج الذكاء الاصطناعي مع مرور الوقت بسبب تأثيرها المباشر في حياة الأفراد. على سبيل المثال، قامت إحدى المؤسسات بفصل موظف بعد تقديمه مستنداً مليئاً بمشكلات مختلقة صنعها “شات جي بي تي”، حيث استند المحامي إلى روبوت الدردشة في إعداد الملف.

تُعتبر معايير “FACTS” تنبيهاً، لكنها تمثل أيضاً توجيهاً، من خلال الكشف عن نقاط ضعف النماذج وكيفية تحسينها، تأمل غوغل في تسريع التطوير. لكن في الوقت الحالي، يبقى الواقع أن الذكاء الاصطناعي في تحسن مستمر، لكنه لا يزال يخطئ في حوالي ثلث الحالات.


تابعوا صفحاتنا على وسائل التواصل


اشترك
بالإعلام الفوري بالاخبار الجديدة بالإيميل .. ضع بريدك



اشترك بالإعلام الفوري بالاخبار الجديدة بالإيميل .. ضع بريدك