«غوغل» تتيح للذكاء الاصطناعي التحقق من صحة ردوده

علوم وتكنلوجيا 2024/09/17
...

 كاليفورنيا: وكالات


طورت غوغل سلسلة من النماذج اللغوية التي يمكنها الإجابة عن الأسئلة بخصوص الحقائق الرقمية بدقة كبرى مقارنةً بالخوارزميات السابقة. وأتاحت الشركة التعليمات البرمجية المصدرية لسلسلة DataGemma عبر منصة Hugging Face. وصممت سلسلة DataGemma للإجابة عن أسئلة المستخدمين بخصوص الحقائق الإحصائية، مثل متوسط إيرادات الشركات في قطاع سوق معين.كما تجيب السلسلة عن الاستفسارات باستخدام المعلومات من Data Commons، وهو مستودع مجاني للمعلومات تديره غوغل.ويحتوي المستودع على أكثر من 240 مليار نقطة بيانات من مصادر، مثل الأمم المتحدة ومنظمة الصحة العالمية ومراكز السيطرة على الأمراض ومكاتب الإحصاء.وتعتمد سلسلة DataGemma على Gemma 2 27B، وهو نموذج لغوي كبير مفتوح المصدر أصدرته غوغل في شهر حزيران ويتميز بمقدار 27 مليار معلمة. وتقول غوغل Gemma 2 27B قادر على منافسة أداء النماذج اللغوية الكبيرة مع ضعف عدد المعلمات.ووفقًا للشركة، نعتمد سلسلة DataGemma على إصدار من Gemma 2 27B مُحسن خصوصًا لمعالجة الحقائق الرقمية. 

ويتفاعل النموذج مع Data Commons، مستودع المعلومات الذي يستمد منه تلك الحقائق، من خلال شريط بحث باللغة الطبيعية.وقالت غوغل في تدوينة: “تستخدم سلسلة DataGemma واجهة اللغة الطبيعية لمستودع Data Commons لطرح الأسئلة بدلًا من الحاجة إلى معرفة مخطط البيانات المحدد أو واجهة برمجة التطبيقات لمجموعات البيانات الأساسية، وتكمن النقطة الدقيقة في تدريب النموذج اللغوي الكبير لمعرفة متى يسأل”.وطورت غوغل نسختين من سلسلة DataGemma، وتتبنى كل نسخة نهجًا مختلفًا للإجابة عن أسئلة المستخدم. 

وتستفيد النسخة الأولى من طريقة تعرف باسم RIG، أو التوليد المتداخل للاسترجاع، لمعالجة الاستعلامات.