هل اجتاز الذكاء الاصطناعي اختبار تورينج حقا؟ دراسة جديدة تثير الجدل مجددا

شهدت الأوساط التقنية والعلمية خلال الأيام الأخيرة موجة كبيرة من الاهتمام والجدل، بعد الإعلان عن دراسة حديثة تشير إلى نجاح نموذج ذكاء اصطناعي في اجتياز اختبار تورينج، الاختبار الأشهر في تقييم مدى قدرة الآلة على محاكاة الذكاء البشري. هذا الادعاء أعاد إلى الواجهة النقاشات الفكرية والعلمية المتواصلة منذ عقود حول فعالية هذا الاختبار، وحدوده، ومعناه الحقيقي.

ما الذي تقوله الدراسة الجديدة؟

أجريت الدراسة التي أثارت الجدل في جامعة كاليفورنيا بمدينة سان دييغو، بقيادة الباحثين “كاميرون جونز” و”بنجامين بيرجن”، وركزت على قياس قدرة أربعة نماذج لغوية على إقناع البشر بأنها بشر. وقد شملت الدراسة نماذج مختلفة من أجيال متباينة في تقنيات الذكاء الاصطناعي، وهي: النموذج الكلاسيكي ELIZA، وGPT-4o، وLLaMa-3.1-405B، وGPT-4.5 من OpenAI.

وقد شارك في الدراسة 284 شخصًا، تم تعيينهم عشوائيًا كمحققين أو شهود، بحيث يتفاعل كل محقق عبر شاشة مقسمة مع كيانين، أحدهما إنسان والآخر نموذج ذكاء اصطناعي. طُلب من المحقق تحديد من منهما الإنسان بعد خمس دقائق من المحادثة النصية.

النتائج: GPT-4.5 يخدع أغلب المحققين

أظهرت الدراسة أن نموذج GPT-4.5 تمكن من خداع المحققين في 73% من الحالات، وهو رقم مرتفع للغاية مقارنة بالنماذج الأخرى. فيما جاء LLaMa-3.1-405B في المرتبة الثانية بنسبة 56%، في حين لم يتمكن النموذجان الآخران من تجاوز حاجز الـ25%.

هذه الأرقام، رغم أهميتها، لا تزال تخضع للنقاش بسبب عدم مراجعة الدراسة بعد من قبل الأقران الأكاديميين، ما يجعل نتائجها أولية وغير مؤكدة علميًا حتى الآن.

اختبار تورينج: من لعبة فكرية إلى معيار مثير للجدل

تعود جذور اختبار تورينج إلى العالم البريطاني آلان تورينج الذي اقترحه في خمسينيات القرن الماضي. وكان الهدف منه الإجابة على سؤال فلسفي عميق: هل يمكن للآلة أن “تفكر”؟ واستبدل تورينج هذا السؤال بسؤال عملي: “هل تستطيع الآلة أن تخدع إنسانًا في محادثة نصية لدرجة يظن فيها أنها إنسان؟”

ورغم شهرة هذا الاختبار واعتباره معيارًا ذهبيًا لفترة طويلة، إلا أن منهجيته وبنيته واجهت العديد من الانتقادات التي تضعف من مصداقيته.

ما هي أبرز الاعتراضات على اختبار تورينج؟

1. المحاكاة ≠ التفكير الحقيقي

نجاح النموذج في تقليد الإنسان لا يعني بالضرورة أنه “يفكر”. فالذكاء الاصطناعي يمكن أن ينتج استجابات مقنعة دون أن يمتلك وعيًا أو فهمًا فعليًا للسياق.

2. العقل ليس آلة حسابية

تشبيه الدماغ بالآلة الرقمية تبسيط مخلّ؛ فالدماغ يتفاعل عبر شبكة عصبية بيولوجية معقدة ترتبط بالعواطف والوعي والتجربة الذاتية، وهي أمور لا يمكن اختزالها في شيفرات وخوارزميات.

3. الصندوق الأسود.. غياب الشفافية

اختبار تورينج يهمل الآليات الداخلية للمعالجة الذهنية. فما يهمه هو “الناتج”، وليس “كيف تم إنتاجه”، وهذا يطرح إشكالية فلسفية ومنهجية عميقة.

4. محدودية نطاق الذكاء المقاس

الاختبار يركز فقط على المحادثة النصية، في حين أن الذكاء البشري يشمل طيفًا واسعًا من القدرات مثل الإبداع، والتفكير النقدي، والتفاعل العاطفي، وحل المشكلات.

هل خداع الإنسان دليل على الذكاء؟

يُقر الباحثون أنفسهم بأن اختبار تورينج يقيس “قابلية الاستبدال” في التفاعل البشري، وليس ذكاءً جوهريًا. أي أن نجاح النموذج في هذا السياق يعكس كفاءته في أداء مهمة محددة ضمن شروط معينة، وليس بالضرورة امتلاكه ذكاء حقيقيًا يعادل الإنسان.

علاوة على ذلك، فإن التجربة تمت في ظرف زمني محدود (خمس دقائق)، وهي فترة قد لا تكون كافية لاكتشاف قصور النماذج اللغوية في المحادثات الطويلة والمعقدة التي تتطلب تفكيرًا عميقًا واستمرارية في السياق.

تكنولوجيا مبهرة.. لكنها ليست بشرًا بعد

بالرغم من أن نموذج GPT-4.5 نجح في تجاوز اختبار تورينج في سياق معين، فإن ذلك لا يعني أنه أصبح كائنًا ذكيًا بمعنى الكلمة. ما تم تحقيقه حتى الآن هو محاكاة لغوية متقدمة، وليست “فكرًا حقيقيًا”.

تظل قدرات الذكاء الاصطناعي التوليدي مدهشة، لكن يجب علينا ألا نخلط بين المهارة في الخداع اللغوي، والقدرة على التفكير والإدراك والفهم الشامل. ولذلك، فإن اجتياز اختبار تورينج لا ينبغي أن يُفهم على أنه إعلان لولادة ذكاء صناعي يعادل الإنسان، بل كإشارة إلى تطور أدوات البرمجة والمحاكاة اللغوية.