أفادت نتائج مؤشر العمل عن بُعد أن وكلاء الذكاء الاصطناعي الأكثر تقدمًا عاجزين عن أداء مهام العمل الحر عبر الإنترنت بفاعلية. ما يلغي نظرية أن الذكاء الاصطناعي سيحل قريبًا محل العاملين في المكاتب على نطاق واسع.
كما يقيس المؤشر الجديد، الذي طوره باحثون من شركة Scale AI المتخصصة في تصنيف البيانات، بالتعاون مع مركز سلامة الذكاء الاصطناعي (CAIS)، قدرة النماذج المتقدمة من الذكاء الاصطناعي على أتمتة الأعمال الاقتصادية المربحة.
الدراسات تثبت فشل وكلاء الذكاء الاصطناعي
أكدت التجربة أن أفضل النماذج لم تتمكن من تنفيذ أكثر من 3% فقط من المهام المطلوبة، حيث سجلت 1,810 دولارًا من أصل 143,991 دولارًا ممكنة من الأرباح.
كما تضمنت التجربة تقييم عدة وكلاء ذكاء اصطناعي. من أهمهم نموذج Manus التابع لشركة صينية تحمل الاسم نفسه، يليه Grok من شركة xAI، وClaude من Anthropic، ChatGPT من OpenAI، Gemini من Google.
كذلك، يقول دان هندريكس، مدير مركز CAIS: “آمل أن تعطي هذه النتائج صورة أكثر دقة حول القدرات الفعلية للذكاء الاصطناعي”.
كما شهدت بعض النماذج تطورًا كبيرًا خلال العام الماضي. ولكن لا يعني ذلك أن هذا التقدم سيستمر بنفس الوتيرة.
وكلاء الذكاء الاصطناعي..بين الحقيقة والخيال
أيضًا، أدى الاهتمام المتزايد بتطورات الذكاء الاصطناعي إلى تكهنات واسعة حول قدرته على تجاوز الذكاء البشري واستبداله بملايين الوظائف.
وفي مارس الماضي، قال داريو أمودي، الرئيس التنفيذي لشركة Anthropic، يمكن لـ90% من أعمال البرمجة أن تصبح آلية خلال أشهر قليلة. وهو ما لم يتحقق حتى الآن.
كما أثار تطور الـAI تنبؤات مشابهة سابقًا، مثل الحديث عن استبدال أطباء الأشعة بالأنظمة الذكية. إلا أن الواقع أثبت أن ذلك لا يزال بعيد المنال.
تجربة اعتماد وكلاء الذكاء الاصطناعي؟
علاوة على ذلك، قام الباحثون بتوليد مجموعة من مهام العمل الحر من خلال عاملين حقيقيين على منصة Upwork. والتي تضمنت المجالات الآتية:
-
تصميم الجرافيك
-
إنتاج الفيديو
-
تطوير الألعاب
-
المهام الإدارية مثل جمع البيانات.
وكما تم تطوير نماذج الذكاء الاصطناعي عبر إضافة وصف مفصل لكل مهمة، وملفات العمل المطلوبة، ونموذج لمشروع منجز بواسطة إنسان كمرجع.
التحديات والعقبات
وعلى الرغم من تحسن النماذج الحديثة في بعض المجالات مثل البرمجة والرياضيات والتفكير المنطقي. إلا أنها لازالت تعاني من ضعف واضح في التعامل مع الأدوات المختلفة وإتمام المهام المعقدة متعددة الخطوات.
وقال هندريكس: “لا تمتلك النماذج الحالية ذاكرة طويلة الأجل. ولا تستطيع التعلم المستمر من التجارب أو اكتساب المهارات أثناء العمل كما يفعل البشر”.
تحليل أعمال وكلاء الذكاء الاصطناعي
أيضا، يعرض تحليل الدراسة وجهة نظر مضادة لمؤشر آخر من شركة OpenAI يعرف باسم GDPval. والذي تم الإعلان عنه في سبتمبر الماضي ويقيس القدرة على أداء الأعمال الاقتصادية.
وبحسب GDPval، تقترب النماذج المتقدمة مثل GPT-5 من القدرات البشرية في 220 مهمة مكتبية. ولم ترد “أوبن أيه آي” بأي تعليق على الدراسة الجديدة.
تأثير وكلاء الذكاء الاصطناعي على الاقتصاد
كما أكد الباحثان بينغ ليو، مدير الأبحاث في “Scale AI”، وهندريكس بأن المؤشر الجديد لا يعتبر مقياسًا لتأثير الـAI على الاقتصاد. حيث لا يتضمن جميع المهن أو أنواع المهام الواقعية.
أيضًا، يستخدم العديد من المستقلين الـAI كأداة مساعدة تعزز إنتاجيتهم. دون الاستغناء عنهم بالكامل.
الذكاء الاصطناعي يسرح الموظفين
وعلى الرغم من ذلك، يؤثر الـAI على مستقبل الوظائف البشرية. حيث كشفت أمازون هذا الأسبوع تسريح 14 ألف موظف. نظرا للانتشار التقنيات التوليدية للـAI.
كذلك، قال بيث جاليتي، نائبة الرئيس الأول لشؤون تجربة الموظفين والتقنية في أمازون: “هذا الجيل من الـAI هو أكثر التقنيات تحولًا منذ ظهور الإنترنت”.
وأضاف: “إنه يمكن الشركات من الابتكار بسرعة غير مسبوقة. سواء في الأسواق القائمة أو في مجالات جديدة كليًا”.
وبحسب مؤشر Remote Labor Index، لا يزال الـAI بعيدًا عن القدرة على ملء الوظائف التي تركها البشر على الأقل في المستقبل القريب.
أصبح وكلاء الـAI العمود الفقري لعملية التوظيف من حيث اختيار السير الذاتية. وجدولة المقابلات وإرسال عروض العمل.
وفي الوقت ذاته، تظهر وكلاء الـAI كفئة جديدة من الأنظمة الذكية. ذلك بهدف دعم ودفع عمليات التوظيف من البداية إلى النهاية.
وعلى الرغم من تسهيل الاجراءات للمديرين ومسؤولي التوظيف، لا يزال لديهم صعوبات مع العمليات المجزأة. والأدوات غير المتسقة. فضلًا عن نقص الرؤية الفورية.
في الواقع، يختلف الـAI الفاعل عن الأتمتة التقليدية؛ حيث إنه يركز على المهام ويتفاعل. بينما يكون الـAI الفاعل موجهًا نحو الأهداف واستباقيًا.
كما إنه مساعد مستقل لا يفهم فقط عملية التوظيف بل أيضًا احتياجاتها. كذلك، أصبحت عملية التوظيف أكثر تنافسية وتطور توقعات المرشحين.
المقال الأصلي: من هنـا



