كشفت دراسة نُشرت في دورية Nature Communications عن تشابه لافت بين الطريقة التي يفهم بها الدماغ البشري اللغة المنطوقة، وبين آلية عمل نماذج اللغة المتقدمة في الذكاء
أظهرت دراسة علمية حديثة أن الدماغ البشري يفهم اللغة المنطوقة عبر سلسلة منظمة من الخطوات، تشبه بشكل مدهش الطريقة التي تعمل بها نماذج اللغة المتقدمة للذكاء الاصطناعي في معالجة النصوص.
وبحسب ما أورده موقع SciTechDaily، سجل الباحثون نشاط الدماغ أثناء استماع مشاركين إلى قصة منطوقة، ليتبين أن الإشارات الدماغية المتأخرة تتطابق مع الطبقات الأعمق في أنظمة الذكاء الاصطناعي، خصوصًا في مناطق اللغة الرئيسة مثل منطقة بروكا.
وتُشكك هذه النتائج في التفسيرات التقليدية القائمة على القواعد والرموز اللغوية الصارمة، وتدعم في المقابل مقاربة تعتمد على البيانات والسياق، مدعومة بمجموعة بيانات عامة نُشرت حديثًا تشكل أداة مهمة لدراسة كيفية تكوين الدماغ للمعنى.
الدراسة، التي نُشرت في دورية Nature Communications، قادها دكتور أرييل غولدشتاين بالتعاون مع دكتور ماريانو شاين من غوغل للأبحاث، إلى جانب البروفيسور أوري حسون وإريك هام من جامعة برينستون. وكشف فريق البحث عن صلة غير متوقعة بين طريقة تفسير البشر للغة المنطوقة، وطريقة معالجة نماذج الذكاء الاصطناعي الحديثة للنصوص.
واعتمد الباحثون على تسجيلات تخطيط كهربية قشرة الدماغ لأشخاص استمعوا إلى بودكاست مدته 30 دقيقة، ما أتاح لهم تتبع استجابات الدماغ بدقة زمنية عالية. وأظهر التحليل أن معالجة اللغة في الدماغ تتم وفق تسلسل منظم يطابق إلى حد كبير التصميم الطبقي لنماذج اللغة الكبيرة مثل GPT-2 وLlama 2.
وأوضحت النتائج أنه عندما يستمع الإنسان إلى الكلام لا يستوعب الدماغ المعنى دفعة واحدة؛ بل تمر كل كلمة عبر سلسلة من المراحل العصبية المتتابعة. وتبيّن أن هذه المراحل تتطور بمرور الوقت بطريقة تحاكي آلية عمل نماذج اللغة في الذكاء الاصطناعي.
ففي نماذج الذكاء الاصطناعي تركز الطبقات الأولى على السمات الأساسية للكلمة، فيما تجمع الطبقات الأعمق بين السياق والنبرة والمعنى العام. وظهر النمط نفسه في الدماغ؛ إذ توافقت الاستجابات العصبية المبكرة مع المراحل الأولى لمعالجة الذكاء الاصطناعي، بينما توافقت الاستجابات اللاحقة مع الطبقات الأعمق في هذه النماذج.
وكانت هذه العلاقة الزمنية قوية على وجه خاص في مناطق اللغة المتقدمة مثل منطقة بروكا، حيث بلغ نشاط الدماغ ذروته في توقيت يتطابق مع نشاط الطبقات الأعمق في النموذج.
ونُقل عن دكتور غولدشتاين قوله إن «أكثر ما أثار الدهشة هو مدى تطابق التطور الزمني للمعنى في الدماغ مع تسلسل التحولات داخل نماذج اللغة الكبيرة. فعلى الرغم من اختلاف بنية هذه الأنظمة اختلافًا كبيرًا، إلا أن كليهما يبدو أنه يتقارب نحو بناء تدريجي مماثل نحو الفهم».
وتشير النتائج إلى أن نماذج الذكاء الاصطناعي ليست مجرد أدوات لتوليد النصوص، بل يمكن أن تسهم أيضًا في مساعدة العلماء على فهم أفضل لكيفية معالجة الدماغ البشري للمعنى. فبعد سنوات من الاعتقاد بأن فهم اللغة يعتمد على رموز ثابتة وقواعد لغوية جامدة، تأتي هذه الدراسة لتدعم رؤية أكثر مرونة تعتمد على السياق، حيث يتطور المعنى تدريجيًا مع تتابع الكلمات والمعلومات.
وفي سياق أوسع، اختبر الباحثون عناصر لغوية تقليدية مثل الفونيمات والمورفيمات، لكن هذه العناصر لم تُفسر نشاط الدماغ في الزمن الحقيقي بالكفاءة نفسها التي قدمتها التمثيلات السياقية التي تولدها نماذج الذكاء الاصطناعي، ما يدعم فكرة أن الدماغ يعتمد بدرجة أكبر على سياق واسع بدلاً من وحدات لغوية دقيقة معزولة.
ولتعزيز الأبحاث في هذا المجال، نشر الفريق البحثي مجموعة كاملة من التسجيلات العصبية، إلى جانب السمات اللغوية المرتبطة بها، كمورد مفتوح. ومن خلال إتاحة هذه البيانات للعموم، يُمكن للعلماء حول العالم مقارنة النظريات المختلفة لفهم اللغة، وتطوير نماذج حاسوبية تعكس بشكل أدق آليات عمل الدماغ البشري.