لا تزال أنظمة الذكاء الاصطناعي متأخرة عن البشر في فهم الإشارات الاجتماعية (رويترز)
عشتارتيفي كوم- الشرق الاوسط/
رغم التقدم الكبير الذي حققته أنظمة الذكاء الاصطناعي في السنوات الأخيرة لدرجة أنها تفوقت على الإنسان في مجالات عديدة مثل الهندسة والطب وعلوم الفضاء، بل وألعاب الذكاء مثل الشطرنج وخلافه، لا تزال أنظمة الذكاء الاصطناعي متأخرة عن البشر في فهم الإشارات الاجتماعية التي تعبر عن المغزى أو الدلالة الحقيقية للتفاعلات الإنسانية، وبمعنى آخر، لا تستطيع هذه الأنظمة الذكية حتى الآن أن تفهم «ما بين السطور» عندما يتحدث البشر مع بعضهم البعض.
وبحسب دراسة أجراها فريق بحثي بجامعة جون هوبكنز الأميركية، طلب الباحثون من ثلاث مجموعات من المتطوعين مشاهدة مقاطع فيديو لا يزيد طول كل منها على 3 ثوان، وتقييم التفاعلات الاجتماعية بين الأشخاص الذين يظهرون في هذه المقاطع. وفي الوقت نفسه، تم تحليل المقاطع نفسها بواسطة أكثر من 350 منظومة للذكاء الاصطناعي متخصصة في مجالات تحليل اللغة والفيديو والصور بغرض فهم مدلول الإشارات الاجتماعية التي يقوم بها البشر في تلك المقاطع.
وأثبتت التجربة أن المتطوعين أنجزوا المهمة المطلوبة بسهولة ويسر، في حين أن أنظمة الذكاء الاصطناعي لم تنجح في تفسير دلالات أو معاني محادثات البشر في مقاطع الفيديو.
ويرى الباحثون المشاركون في الدراسة أن أنظمة الذكاء الاصطناعي ما زال أمامها شوط طويل قبل أن تصل إلى فهم الإشارات الاجتماعية للبشر في بيئات التفاعل الحقيقية، وهو ما ينطوي على تداعيات خطيرة بالنسبة لصناعات صاعدة مثل السيارات ذاتية القيادة أو الروبوتات وغيرها من المجالات التي تتطلب تفاعلات مستمرة بين الإنسان ومنظومات الذكاء الاصطناعي.
وتقول الباحثة ليلى إيزيك، أستاذ مساعد العلوم المعرفية بجامعة جون هوبكنز ورئيس فريق الدراسة، إنه «إذا كنت تريد أن يتفاعل نظام الذكاء الاصطناعي مع الإنسان، فلا بد أن يفهم ما الذي يقصده الإنسان، وكيف تتفاعل مجموعة من البشر سوياً»، مضيفة في تصريحات للموقع الإلكتروني «بوبيولار ساينس» المتخصص في الأبحاث العلمية: «هذه الدراسة في حقيقة الأمر تسلط الضوء على سبب إخفاق أنظمة الذكاء الاصطناعي في أداء هذه المهمة».
ورغم أن دراسات سابقة أثبتت قدرة أنظمة الذكاء الاصطناعي على وصف مغزى الصور الثابتة بدرجة تكاد تتساوى مع الإنسان، فإن الدراسة الجديدة كانت تهدف إلى قياس ما إذا كان الوضع نفسه يسري بالنسبة للصور المتحركة أو مقاطع الفيديو. وتوضح إيزيك أنها اختارت مع فريقها البحثي المئات من مقاطع الفيديو من قاعدة بيانات خاصة، ثم قامت بتقصيرها إلى مدة زمنية لا تزيد على 3 ثوان، مع التركيز على المقاطع التي يظهر فيها شخصان يتفاعلان سوياً.
وعرض الباحثون مقاطع الفيديو على المتطوعين المشاركين في التجربة، ثم استطلاع رأيهم بشأن مغزى التفاعلات بين الأشخاص الذين يظهرون في تلك المقاطع من خلال أسئلة موضوعية على غرار «هل ترى أن الأشخاص في هذه المقاطع يواجهون بعضهم البعض»، وأسئلة شخصية مثل: «هل التفاعل بين الأشخاص في مقطع الفيديو يبدو إيجابياً أم سلبياً؟».
وتبين من التجربة أن المتطوعين عادة ما يتوصلون إلى إجابات متشابهة تنم عن فهم أساسي مشترك للتفاعلات الإنسانية. أما أنظمة الذكاء الاصطناعي، فلم تتوصل إلى درجة الإجماع نفسها في تفسير مقاطع الفيديو مقارنة بالمتطوعين. وتقول الباحثة كاثي جارسيا، وهي من المشاركين في الدراسة من جامعة جون هوبكنز: «لا يكفي أن يشاهد نظام الذكاء الاصطناعي مقطع الفيديو ويتعرف على الأشكال أو الوجوه، بل نحتاج إلى أن يفهم النظام تطور الأحداث في المشهد، وأن يفهم العلاقات والسياق وديناميكيات التفاعلات الاجتماعية، وهذه الدراسة تشير إلى أن هذا العنصر يعتبر بمثابة نقطة عمياء في تطور منظومات الذكاء الاصطناعي».
وتأتي هذه النتائج في الوقت الذي تتسابق فيه شركات التكنولوجيا لدمج أنظمة الذكاء الاصطناعي داخل عدد متزايد من الأجسام الروبوتية، وهو مفهوم يطلق عليه اسم «الذكاء الاصطناعي المتجسد»، وقد تم اختبار هذا المفهوم في عدة مدن أميركية مثل لوس أنجليس وفينيكس وأوستن من خلال سيارات ذاتية القيادة تسير في الطرق بجانب السيارات التي يقودها البشر مثل سيارات الأجرة التابعة لشركات مثل «وايمو روبو تاكسي».
وقد أثبتت التجارب أن أنظمة الذكاء الاصطناعي لهذه السيارات تعاني من قصور في فهم بعض مواقف القيادة المركبة مثل القيادة الدائرية أو منحنيات الرجوع للخلف. ورغم أن بعض الدراسات الحديثة أثبتت أن السيارات ذاتية القيادة قد تكون أقل عرضة للحوادث مقارنة بقائدي السيارات، لا تزال السلطات الرقابية المختصة تجري تحقيقات بشأن ما تردد عن مخالفة بعض هذه السيارات لقواعد السلامة.
وقطعت شركات تكنولوجية أخرى مثل «بوسطن ديناميكس» و«فيجر إيه أي» و«تسلا» خطوات أبعد نحو تطوير روبوتات على هيئة بشر تعمل بأنظمة الذكاء الاصطناعي في أماكن صناعية جنباً إلى جنب مع عمال على خطوط الإنتاج. ويرى الباحثون أن تمكين أنظمة الذكاء الاصطناعي من فهم الإشارات الاجتماعية بين البشر داخل البيئات الصناعية ينطوي على أهمية بالغة لتلافي خطر وقوع الحوادث الصناعية. وفي السياق ذاته، تقول الباحثة إيزيك إن «هذه الدراسة تسلط الضوء على أهمية دمج علوم الذكاء الاصطناعي وعلم الأعصاب والعلوم المعرفية بشكل أكبر مع عناصر العالم الحقيقي».