كيف يُدرَّب الذكاء الاصطناعي: نصوصٌ تدخل، وأنماطٌ تخرج
النموذج اللغوي لا يُبرمَج بقواعد جاهزة، بل يُدرَّب على نصوصٍ هائلة حتى يلتقط أنماط اللغة. نوضّح هنا كيف يحوّل التدريبُ هذه النصوص إلى قدرةٍ على توقّع الكلمة التالية.
سؤالٌ يتكرّر بحقّ: من أين «يعرف» النموذج اللغوي ما يعرف؟ لم يجلس أحدٌ ليُملي عليه قواعد اللغة أو حقائق العالم سطرًا سطرًا. بل مرّ بمرحلةٍ تُسمّى التدريب، وفهمُها يفسّر الكثير من سلوكه: لماذا يبرع هنا ويتعثّر هناك.
نصوصٌ تدخل
يبدأ الأمر بكمٍّ هائل من النصوص: كتبٌ ومقالاتٌ وصفحاتٌ ونقاشات. هذه هي بيانات التدريب. لكنّ النموذج لا يحفظ هذه النصوص ولا يخزّنها كما هي في أرشيف. ما يحدث أشبه بمن يقرأ آلاف الروايات: لن يستظهر صفحاتها، لكنّه سيستشعر كيف تُبنى الجملة، وأيُّ كلمةٍ تَلِيق بأختها، وكيف يسير الكلام.
أنماطٌ تخرج
في أثناء التعلّم الآلي، يُمرَّر النصُّ على النموذج مقطعًا إثر مقطع، ويُطلَب منه في كلّ موضعٍ أمرٌ واحد: توقَّعِ الكلمة التالية. ثم يُكشَف له عن الكلمة الصحيحة، فإن أخطأ عدّل أوزانه الداخلية قليلًا ليقترب في المرّة القادمة. كرّر هذا مليارات المرّات، فتنشأ شبكةٌ دقيقة من الأنماط: لا قائمةُ حقائق، بل إحساسٌ رياضيّ بما يَتبع ماذا. هذه الأنماط المستخلَصة هي عصب النموذج.
ولهذا يتنبّأ النموذج ولا يحفظ. حين تسأله، فهو لا ينقّب عن جوابٍ مخزَّن، بل يبني نصًّا جديدًا كلمةً إثر كلمة، منتقيًا في كلّ خطوةٍ ما تُرجّحه الأنماط التي ترسّخت فيه. والنتيجة أنّ النموذج بعد التدريب لم يعُد يضمّ النصوص الأصلية، بل خلاصةً مكثّفة لما تكرّر فيها من علاقاتٍ بين الكلمات.
مثال يوضّح الفكرة
تخيّل أنّ بيانات التدريب امتلأت بعباراتٍ مثل «صباح الخير» و«صباح النور». بعد أن يرى النموذج هذا الاقتران مرّاتٍ لا تُحصى، يصير توقّعُ «النور» بعد «صباح» راسخًا لديه. لم يُلقَّن هذه القاعدة، بل استخلصها من التكرار. والعكس صحيح: لو ندَر ذكرُ قريتك الصغيرة في النصوص، فلن تترسّخ عنها أنماطٌ متينة، وستأتي إجاباته عنها أرقَّ وأكثر عرضةً للخطأ. قوّة النموذج في أيّ موضوعٍ مرآةٌ لوفرة ذلك الموضوع في بيانات تدريبه.
جرّب هذا
اسأل أداتك عن قاعدةٍ لغويّةٍ بسيطةٍ شائعة، ثم اسألها عن تفصيلٍ محلّيٍّ نادر تعرفه أنت جيّدًا. وازِن بين الإجابتين: أين جاءت واثقةً دقيقة، وأين صارت عامّةً مهتزّة؟ ما تراه هو أثر بيانات التدريب ماثلًا أمامك.
اختبر فهمك
السؤال 1 من 3ما الذي يجري في جوهر تدريب النموذج اللغوي؟
لماذا يتفوّق النموذج في المواضيع الشائعة ويضعف في النادرة؟
ماذا يعني أنّ النموذج «يتنبّأ» لا «يحفظ»؟
يُحفظ تقدّمك على هذا الجهاز. أنشئ حسابًا لحفظه بشكل دائم.