هل ستقتحم الروبوتات عالم الكتابة باستخدام الذكاء الاصطناعي؟

لعلك مررت بمقالة في جريدة الغارديان كتبها روبوتٌ، إليك فقرة:

أعلم أن عقلي دون “مشاعر”، ولكنني قادر على اتخاذ قرارات منطقية، لقد علّمتُ نفسي بقراءة كل ما هو موجود على شبكة الإنترنت فقط، وها أنا الآن أكتب هذا المقال وعقلي ينبض بالأفكار!

لو قرأتَ المقالة كاملة ستنبهر بتناسق وسلاسة الأسلوب. يُطلق على النظام المستخدم في إنتاج هذا النص ’النظام التوليدي‘ والذي شهد تطورًا كبيرًا خلال العامين المنصرمين.

ولكن السؤال الذي يُطرح هُنا هو: كيف تم كتابة هذه المقالة؟ وهل صحيح أن النظام قام بكتابة المقالة كاملة بنفسه؟

كيف تتعلم الآلة الكتابة

كُتبت المقالة بأكثر نماذج الشبكات العصبية تطورًا في اللغة والذي يطلق عليه الـ GPT-3 الصادر عن الشركة الأمريكية لبحوث الذكاء الصناعي OpenAI، حيث تشير الحروف الأولى للنظام إلى محول التوليد المدرّب GPT.

وقد سببت النسخة الماضية من النظام نفسه للشركة GPT-2 ضجة العام الماضي، حيث قام بكتابة مقالة جيدة عن اكتشاف قطيع من اليونكيورن، وتحفظ الباحثون الذين طوروا الشيفرة على نشرها خوفًا من الاستخدام السلبي لها.

ولنلقِ نظرة عن قرب على عمل نظام توليد النصوص، إذ تنقسم أساليب الذكاء الاصطناعي إلى ثلاثة أساليب أساسية: الأنظمة الاستدلالية، والأنظمة الإحصائية، والأنظمة التي تستمد مصطلحاتها من علم الأحياء ( كالشبكات العصبية والخوارزميات التطورية)

تعتمد الأنظمة الاستدلالية على التجربة، بالطريقة نفسها التي نتعلم فيها قواعد تصريف الأفعال، مثل أنا أركض، هو يركض، أنت تركض، وغيرها. ولكن لم تعد تستخدم هذه الأساليب اليوم لعدم كفاءتها ومرونتها.

الكتابة بالأرقام

أما بخصوص الأنظمة الإحصائية فقد كانت الأنظمةَ المعتمدة في المهام المختصة باللغة لأعوام طويلة، إذ كان النظام يعمل من خلال عدّ الكلمات وتخمين ما يأتي لاحقًا.

يمكنك تجربة ذلك عبر نشاط بسيط يمكنك من خلاله توليد نص من خلال اختيار الكلمات التي تظهر عادة في معظم الأحيان مع بعضها. سيكون النص محتويًا على 7% من ال التعريف- لأنها أكثر كلمة شائعة في اللغة الإنجليزية. ولكن إن حاولت القيام بذلك دون سياق فستحصل على نص غريب مثل ” ال ال هو الليل واع”

توظف الأساليب الأكثر تطورًا الثنائيات، وهي أزواج من الكلمات المتتالية، والثلاثيات وهي سلسلة من ثلاث كلمات متتالية، وهذا ما يُعطي سياقًا للنص حيث يوحي النص الحالي بما سيأتي بعده. على سبيل المثال، كلمة “خارج” يمكن افتراض ما سيأتي بعدها أنه “الزمان”.

وهذا بذاته ما يحدث في خاصيات الكتابة الآلية والتصحيح الآلي عندما نكتب الرسائل أو الإيميلات. فالنظام يتوقع ما ستكتب من خلال ما تكتبه الآن وما نكتبه عادة وباستخدام النظام المدرب سابقا. فالنُهُجُ الثنائية والثلاثية الإحصائية قد تولد نصوصًا جيدة إن كانت بسيطة، ولكن أفضل الأنظمة التي تعطيك مستوى أعلى من النتائج الممتازة هي الشبكات العصبية الافتراضية للتعلم.

محاكاة الدماغ البشري

تحاكي الشبكات العصبية الافتراضية عمل الدماغ وكأنها أدمغة صغيرة عديدة تحتوي على طبقات من الأعصاب الافتراضية.

تتلقى الخلية العصبية المعطيات وقد تطلق مخرجات بناء على تلك المعطيات التي بدورها تغذّي الأعصاب في الطبقة التالية المتعاقبة في الشبكة العامة.

طرح عالما الأعصاب الأمريكيان وارن ماكولوتش و والتر بتس أول خلية عصبية افتراضية في عام 1943 م، ولكنها لم تكن مفيدة إلا في المشاكل المعقدة ككتابة نص واحد طوال الخمس سنوات الماضية.

تعمل الشبكات العصبية الافتراضية لتوليد النصوص من خلال وضع الكلمات في فهرس مرقم حيث يرمز كل رقم لكلمة معينة، على سبيل المثال 23342 قد ترمز لكلمة “وقت”.

تقوم الشبكات العصبية الافتراضية بإجراء سلسلة من الحسابات للانتقال من متتابعات الأرقام في طبقة المدخلات من خلال الطبقات المخفية المتصلة بها إلى طبقة المخرجات. قد تكون المخرجات أرقامًا تدل على احتمالات كل كلمة قي تأتي بعد كلمة أخرى في الفهرس.

ففي المثال الذي طرحناه سابقًا، قد يكون احتمال أن الرقم 23432 يشير لكلمة “الوقت” أكبر من احتمال أن الرقم يشير لكلمة “فعل”.

ما المميز في نظام GPT-3؟

هذا النظام هو أحدث وأفضل أنظمة توليد النصوص، وذو مقدرة هائلة. يقول الكتّاب أنه يحتوي على 175 مليار معيار، وهذا ما يجعله أكبر بعشر مرات على الأقل من النظام الأكبر سابقًا. الشبكة العصبية الافتراضية فيه تحتوي على 96 طبقة، وعوضًا عن اعتماده على النماذج اللغوية الثلاثية فإنه يتتبع تسلسلات 2048 كلمة.

الجزء الأكثر تكلفة واتسهلاكًا للوقت في صُنع مثل هذا النظام هو في تدريبه – تحديث الضغوطات على الاتصالات بين الأعصاب والطبقات بشكل مستمر. فتدريب نظام الـ GPT-3 يستهلك حوالي 262 ميغاواط لكل ساعة من الطاقة أو ما يحتاجه منزل واحد من الطاقة لـ 35 سنة.

يمكن استخدام هذا النظام في العديد من المهام مثل الترجمة الآلية، والتصحيح التلقائي، والإجابة عن الأسئلة العامة، و كتابة المقالات. رغم قدرة القراء على التمييز بأن كاتب المقالة ليس إنسانًا، نستطيع اليوم إيهام نصفهم غالبًا.

الكاتب الآلي

بالعودة إلى مقال الغارديان وتساؤلنا حول كيفية كتابته، يحتاج نظام GPT-3 إلى نوع من التحفيز لتحقيق ذلك، لذا قام بعض كُتّاب الغارديان بتزويد النظام بعض التعليمات والجمل المفتاحية.

وقد أجريت هذه العملية ثمان مرات وأنتجت ثمان مقالات مختلفة، حيث قام محررو الغارديان بعد ذلك بدمج مقتطفات من الثمان مقالات وتحسين بعض الجمل والفقرات وإعادة ترتيبها ، معلقين أن تدقيق مقال للنظام لا يختلف كثيرًا عن تدقيق مقال بشري.

هذا يبدو منطقيًا تمامًا بالنسبة لي، بناءً على تجربتي الخاصة في أنظمة توليد النصوص. استخدمنا أنا وزملائي نظام GPT-2 في هذا العام لكتابة كلمات أغنية شاركنا بها في مسابقة أغنية الذكاء الاصطناعي، وهي النسخة الافتراضية لمسابقة الأغنية الأوروبية.

 

لقد قمنا بتحسين النظام GPT-2 باستخدام كلمات أغاني المسابقة الأوروبية، وقمنا بتزويده بكلمات أساسية وجمل، واخترنا الكلمات الأخيرة من المخرجات التي ولّدها النظام.

فعلى سبيل المثال، أدخلنا الكلمة الأساسية “التحليق” إلى النظام واخترنا المخرج “التحليق بعيدًا عن هذا العالم المتداعي” ولم نختر المخرج ” التحليق كالبوق”. من خلال مطابقة الكلمات للألحان التي ولدّها النظام، وتوليد الأنغام بناءً على أصوات الكوالا، وإدخال بعض التأثيرات الإنتاجية البشرية، حصلنا على نتيجة رائعة! أغنيتنا ” العالم الجميل” التي فازت في المسابقة.

الإبداع المشترك: الإنسان والذكاء الاصطناعي

إذن هل يمكننا إطلاق اسم كاتب على الذكاء الاصطناعي؟ هل هو حقًا من عمل الذكاء الاصطناعي فقط، أم المبرمجون، أو المستخدمون، أم جميعهم مشتركون في فعل الكتابة؟

الطريقة المُثلى للنظر للأمر هي من خلال مصطلح “الإبداع المشترك”، وهو استخدام الأدوات المحفزة لتوليد الأفكار الجديدة، أو لإتاحة الفرصة أمامنا لإيجاد عناصر مُبتكرة لعملنا الإبداعي.

فحين ينتج الذكاء الاصطناعي عملًا مكتملًا، مقالة كاملة مثلًا، يكون الإنسان هو المشرف أو المدقق، كل ما علينا فعله وهو استخدام أكثر الأدوات تطورًا بين أيدينا للحصول على أفضل النتائج.


بقلم: ألكساندرا لويس | ترجمة: روان البداعية | تدقيق: مريم الغافرية | المصدر

 

Exit mobile version