في إنجاز علمي غير مسبوق، أعلن فريق بحثي مشترك من جامعتي كاليفورنيا في بيركلي وكاليفورنيا في سان فرانسيسكو عن تطوير واجهة تخاطب جديدة بين الدماغ والحاسوب (BCI)، قادرة على استعادة القدرة على إنتاج الكلام الطبيعي للأشخاص الذين يعانون من شلل حاد يمنعهم من التواصل اللفظي. وقد نُشرت نتائج هذا الإنجاز الرائد في مجلة Nature Neuroscience، ما يعكس قيمته العلمية وتأثيره المحتمل في مستقبل التكنولوجيا الطبية.
التغلب على عقبة زمن الانتقال
ظلت مشكلة زمن الانتقال (Latency) واحدة من أكبر التحديات في تقنيات الأطراف العصبية الاصطناعية للكلام. فالتأخير بين نية التحدث وخروج الصوت كان يُبطئ عملية التواصل ويجعلها غير طبيعية. لكن هذا البحث استطاع تقليص زمن الانتقال من 8 ثوانٍ إلى ثانية واحدة فقط، ما يعني أن المستخدم يمكنه الآن التحدث بصوت قريب من الوقت الفعلي الذي يفكر فيه بالكلمات.
الذكاء الاصطناعي: العمود الفقري للتقنية
استفاد الفريق من تقنيات متقدمة في الذكاء الاصطناعي لفك تشفير الإشارات العصبية وتحويلها إلى كلام مسموع لحظي. وبحسب الدكتور جوبالا أنومانشيبالي، فإن هذه التقنية تمنح الأطراف الاصطناعية العصبية قدرة سرعة فك التشفير التي تنافس مساعدات صوتية شهيرة مثل أليكسا وسيري.
تجربة سريرية متقدمة في سان فرانسيسكو
يقود جراح الأعصاب الدكتور إدوارد تشانج تجربة سريرية متقدمة تعتمد على مصفوفات من الأقطاب الكهربائية الدقيقة، تُزرع مباشرة على سطح الدماغ، ما يسمح بالحصول على بيانات عصبية دقيقة. ويعتمد الباحثون على نماذج مدرَّبة بالذكاء الاصطناعي لتحليل هذه الإشارات وتوليد صوت يُحاكي كلام المريض الأصلي قبل إصابته.
تعددية استخدامات التقنية الجديدة
من أبرز مزايا التقنية الجديدة أنها لا تعتمد على نوع واحد من واجهات الاستشعار العصبي. فقد أثبت الفريق البحثي إمكانية تطبيق الخوارزميات نفسها على أجهزة مختلفة، مثل:
-
مصفوفات الأقطاب الدقيقة (MEAs): التي تخترق سطح الدماغ مباشرة.
-
أجهزة الاستشعار العضلي (sEMG): التي توضع على الوجه لقياس نشاط العضلات بطريقة غير جراحية.
هذا ما أكّدته الباحثة كايلو ليتلجون، والتي أشارت إلى أن التقنية أثبتت فاعليتها عبر مجموعات بيانات مختلفة، ما يعني إمكانيات أوسع للتطبيق في المستقبل.
كيف تعمل واجهة التخاطب الجديدة؟
تعتمد التقنية على التقاط الإشارات العصبية من القشرة الحركية، وهي الجزء المسؤول عن التخطيط الحركي للكلام. بعد ذلك، يتدخل الذكاء الاصطناعي لفك تشفير تلك الإشارات وتحويلها إلى جمل مسموعة. ويوضح الباحث تشول جون تشو أن العملية تبدأ بعد اتخاذ القرار بالكلام، وليس أثناء التفكير أو تكوين الفكرة، ما يعني أن فك التشفير يركز على تنفيذ الأمر الحركي للكلام.
الذكاء الاصطناعي يسد فجوة النطق
لتدريب النموذج، استخدم الباحثون تقنيات غير صوتية نظرًا لعدم قدرة المريضة على التحدث. فطلبوا من المتطوعة (آن) محاولة نطق جمل مكتوبة على الشاشة بصمت تام، واستُخدم صوتها القديم قبل الإصابة لتوليد كلام يطابق نبرتها الأصلية. وقد سمح هذا الأسلوب بابتكار نظام واقعي يعيد الإحساس بالصوت والجسد للمريض.
أداء فائق وسرعة غير مسبوقة
نجحت التقنية الجديدة في إنتاج أول صوت خلال ثانية واحدة فقط من نية النطق، واستمرت في فك التشفير أثناء الحديث المتواصل دون انقطاع. الأهم من ذلك، أن الدقة العالية بقيت محفوظة كما كانت في النماذج السابقة رغم التحسينات الزمنية الكبيرة.
خوارزمية تتعلم.. لا تحفظ فقط
اختبر الباحثون قدرة النموذج على توليد كلمات غير موجودة في بيانات التدريب باستخدام أبجدية الناتو الصوتية، ونجح النموذج في توليد هذه الكلمات بدقة، ما يعني أنه لا يعتمد فقط على التكرار بل يتعلم البنية الأساسية للغة الصوتية.
وقالت المريضة (آن) إنها شعرت بتحكم أكبر في التواصل من خلال هذه التقنية، ووصفت التجربة بأنها أقرب ما يكون إلى الحديث الطبيعي، مما عزز شعورها بالتواصل مع الذات والعالم.
خطوات مستقبلية نحو تحسين جودة الصوت والتعبير
أعرب الدكتور جون تشو عن تفاؤله بإمكانية تحسين التقنية مستقبلًا، مشيرًا إلى خطط لتطوير:
-
نبرة الصوت والحدة والجهارة لجعل الكلام أكثر واقعية.
-
خوارزميات أسرع وأكثر دقة تواكب الحديث البشري في الزمن الحقيقي.
منافسة قوية في سوق واجهات الدماغ والحاسوب
الإنجازات الأخيرة من جامعتي كاليفورنيا تأتي ضمن سباق عالمي تقني، تشارك فيه شركات رائدة مثل:
-
Neuralink التابعة لإيلون ماسك، التي تطور شريحة دماغية باسم N1.
-
Paradromics التي كشفت عن واجهتها Connexus في فبراير الماضي.
وتبرز هذه المنافسة الحادة أهمية السوق المتنامي لتقنيات الدماغ والحاسوب، ومدى تطورها السريع لتلبية حاجات صحية وإنسانية متزايدة.
اترك تعليق