استنساخ الأصوات بالذكاء الاصطناعيّ: مستقبل الترفيه والتزوير

يستخدم مصوّر فيديو فرنسيّ تقنيّة الذكاء الاصطناعيّ "ديب فايك" (التزييف العميق) لمحاكاة أصوات سياسيّين حاليّين وراحلين يقيمون حوارًا حيًّا مع المستخدمين عبر منصّة "تويتش"، ومنهم مثلًا الرئيس الفرنسيّ إيمانويل ماكرون واثنان من أسلافه المشهورين هما شارل ديغول وجاك شيراك.

وقد كان أنيس العياري، وهو مهندس في الذكاء الاصطناعيّ وصاحب قناة على يوتيوب للتبسيط العلميّ تحمل اسم "ديفند إنتلجنس"، وراء هذا "التزييف العميق" الّذي أنجزه كمضمون ساخر.

غير أنّ التجربة أخذت أبعادًا سلبيّة الثلاثاء، عندما سأل أحد مستخدمي الإنترنت "ماكرون" المزعوم عن أسوأ اسم لقرية فرنسيّة، فأجاب الذكاء الاصناعيّ "لا مور أو جويف" ("La Mort-aux-Juifs" - ومعنى اسمها بالفرنسيّة "الموت لليهود")، وهي قرية صغيرة في منطقة لواريه في وسط فرنسا جرى تغيير اسمها سنة 2015. وقد أدّى ذلك إلى المنع الفوريّ للقناة.

وكتب صاحب القناة في رسالة عبر منصّة إكس (تويتر سابقًا)، أنّه تقدّم بطلب استئناف للقرار، وأعاد إطلاق جلسات البثّ الحيّ عبر منصّة "كيك.كوم" المنافسة.

قبل أشهر، هذا الخبير الّذي يروّج لـ"مساعدين" افتراضيّين لدى الشركات، استخدم أيضًا تقنيّة التزييف العميق ليجعل الرئيس الفرنسيّ يغنّي بصوته أغنية للمغنّي الشهير شارل أزنافور. وقد كشف في مقطع فيديو التقنيّات الّتي اعتمدها في هذه الحيلة المصوّرة.

وأخيرًا، بدأ العياري في استنساخ شخصيّات تاريخيّة أو أخرى آنيّة من أمثال إيلون ماسك، مع إشراكهم في "نقاشات" مع لاعبين سياسيّين حاليّين.

ويقول أنيس العيّاري "سنجري محاكاة لنقاش سياسيّ وسنرى إلى أين سنصل في هذا الأمر".

ولنسخ صوت أحد الشخصيّات، يكفي جمع بضع دقائق من خطاب له، من دون أيّ تشويش خارجيّ. بعدها، تتولّى برمجيّات إنشاء نموذج لصوته، بما يتيح استخدامه في محتويات جديدة، حتّى بلغات أجنبيّة.

ويوضّح مبرمج المعلوماتيّة "إذا كان لدينا 15 إلى 30 ثانية بنوعيّة جيّدة، نبدأ في الحصول على نتائج لافتة. ولم يعد هناك حاليًّا أيّ حاجة للإلمام في برمجة المعلوماتيّة". وقد أطلق العياري نداء لتمويل البثّ الحيّ لنسخته من الرئيس الفرنسيّ.

ويؤكّد العياري أنّ استخدامه لخدمات معلوماتيّة مختلفة يكلّفه حوالى 150 يورو في اليوم.

غير أنّ التقليد له حدود، إذ إنّ حركة الشفتين تظهر بعض الثغرات. وبمواجهة الأسئلة العبثيّة من بعض مستخدمي الإنترنت، يعطي إيمانويل ماكرون بالنسخة المقلّدة إجابات غريبة، بينها على سبيل المثال "موضوع نظام التقاعد خارج عن برمجتي. فلنتطرّق إلى مواضيع مسلّية أكثر".

كما يقول الرئيس الفرنسيّ بالنسخة المطوّرة عبر الذكاء الاصطناعيّ "تصريحي عن الأصول الّتي أملكها يتمتّع بالصدقيّة نفسها لوعود سياسيّ في حملته الانتخابيّة".

ويلفت أنيس العيّاري إلى أنّ "طفرة في توليد الأصوات حصلت العام الماضي، والأمر آخذ في التسارع". ويجري حاليًّا العمل على مشاريع عدّة تتيح لأشخاص من غير المتخصّصين التدرّب على إنجاز مقاطع بتقنيّة التزييف العميق، في الصين وكوريا الجنوبيّة واليابان، حيث تقليد أصوات شخصيّات "المانغا" (رسوم متحرّكة يابانيّة) يحظى بشعبيّة كبيرة.

وعلى قناة "ترامب أور بايدن 2024" عبر تويتش، خاضت نسختان مطوّرتان بالذكاء الاصطناعيّ عن الرئيس الأميركيّ الحاليّ جو بايدن وسلفه دونالد ترامب، في تراشق كلامي استمرّ طويلًا خلال الصيف، ولا يزال متواصلًا تحت أنظار المئات من مستخدمي الإنترنت الّذين يمكنهم إطلاق مواضيع للنقاش كتابيًّا.

اقرأ/ي أيضًا | نسخة من "تشات جي بي تي" متخصصة في الأعمال

كما دفع موسيقيّون ثمنًا جرّاء هذه التقنيّات، إذ جرى استنساخ أصواتهم في أعمال فنّيّة من دون أن يتقاضوا أيّ مقابل. ويبدي الممثّلون، من ناحيتهم، قلقًا من استخدام صورهم من الاستوديوهات، وتسجّل الأوساط العاملة في مجال أمن المعلوماتيّة تناميًا لتقنيّات الاحتيال الهاتفيّ القائم على استنساخ الأصوات.

لكن هل يتعيّن الخوف من موجة تضليل إعلاميّ جديدة باستخدام هذه التقنيّات؟ يجيب أنيس العيّاري "كلّما أدرك الناس (بانتشار تقنيّة التزييف العميق)، سيتعزّز لديهم الحسّ النقديّ". ويجاهر العيّاري عبر قنّاته بأنّ المضمون الّذي ينشره "ساخر".