استنساخ الأصوات بواسطة الذكاء.. في دائرة الضوء

أرشيف جريدة الصباح

Alsabah

استنساخ الأصوات بواسطة الذكاء.. في دائرة الضوء

علوم وتكنلوجيا 2024/06/04

+A -A

باريس: أ ف ب

تثير تقنيَّة استساخ الصوت مخاوف كثيرة مع إقدام عددٍ من الشركات على اعتمادها، كـ»اوبن ايه آي» مُبتكرة برنامج «تشات جي بي تي» الشهير، التي اضطرت أخيرا للاعتذار من الممثلة سكارليت جوهانسون بعدما نسخت صوتها في أحدث نسخة من برنامجها للمحادثة الآليَّة.
وقد اعتذر مدير عام «اوبن ايه آي» سام ألتمان من الممثلة وأعلن تعليق صوت أداة المساعدة «سكاي» في «تشات جي بي تي».
وكانت الشركة قدّمت عرضاً في أيلول الفائت لسكارليت التي أعارت صوتها قبل نحو عشر سنوات لنظام بالذكاء الاصطناعي في فيلم «هير»، لكنّ الممثلة رفضت أن تكون صوت نظام النسخة الجديدة من «تشات جي بي تي». ونفت «اوبن ايه آي» من جانبها أنْ تكون قد استنسخت صوت جوهانسون، مشيرة إلى أنها ابتكرت أداتها باستخدام صوت ممثلة أخرى.وتتصدر أخبار عن حيل صوتيَّة مشابهة جداً للواقع أو عمليات احتيال أو تضليل باستخدام الاستنساخ الصوتي، عناوين الأخبار باستمرار، مسلّطةً الضوء على قدرة أنظمة الذكاء الاصطناعي على تقليد الأصوات البشريَّة.وفي العام الفائت، حذرت شركة Eleven Labs “إيليفن لابز” الناشئة التي تعمل على ابتكار أداة لاستنساخ الصوت باستخدام الذكاء الاصطناعي، من الاستعمال المسيء لبرنامجها.وفي أحد المقاطع الصوتيَّة، يُسمَع صوت مزيّف للممثلة إيما واتسون وهي تقرأ مقطعاً من كتاب “كفاحي” لأدولف هتلر.وأوضح مدير شركة “سنتيزيا” الناشئة أنّ هذه التكنولوجيا تم ابتكارها إلى حد كبير من خلال برنامج مفتوح المصدر يسمى “تورتس” وأُطلق قبل عامين.وقد حلّل برنامج التعلم الآلي “تورتس” آلاف الساعات من التسجيلات الصوتيَّة وكان بمثابة قاعدة لتطبيق “إيلفن لابس”وتستخدم “اوبن ايه آي” برامج مماثلة، على الرغم من أنها لا تكشف تفاصيل ذلك.
ومع “تشات جي بي تي 4,0”، يمكن للمستخدم التلفّظ ببضع جمل بالفرنسيَّة أمام التطبيق القادر في دقائق معدودة على إعادة إنتاج هذا الصوت واستخدامه لسرد مقطع فيديو قصيرة بخمس لغات مختلفة، بحسب ما أظهرت “أوبن ايه آي” خلال عرض توضيحي للبرنامج في باريس.وعلى غرار هذه الشركة الأميركيَّة، باتت مئات الشركات تقدّم خدمة استنساخ الصوت التي أصبحت واقعيَّة ودقيقة بصورة أكبر.ومن بينها TALKR.ai، وهي شركة فرنسيَّة للمساعدين الصوتيين الافتراضيين الذين يتم إنشاؤهم بواسطة الذكاء الاصطناعي.ويمكن لهذه الخدمة التعامل مع 25 % إلى 30 % من مكالمات خدمة الزبائن من دون أي تدخل بشري، بحسب رئيستها كاتيا لينيه.وترى لينيه كما فيكتور ريباربيلي أنّ استخدام أصوات الممثلين من دون موافقتهم هو خط أحمر.