أطلقت شركة أوبن أيه آي، يوم الخميس، برنامج ذكاء اصطناعي يدعى ”Operator“ يمكنه القيام بمهام عبر الإنترنت، مثل طلب العناصر أو ملء النماذج.
وصرحت الشركة الرائدة في تطبيقات الذكاء الاصطناعي عبر المدونة الرسمية: ”يمكن أن يطلب من أداة Operator التعامل مع مجموعة واسعة من مهام المتصفح المتكررة مثل ملء النماذج. وطلب البقالة. وحتى إنشاء الميمات”.
وأضافت ”أن القدرة على استخدام نفس الواجهات والأدوات التي يتفاعل معها البشر بشكل يومي توسع من فائدة الذكاء الاصطناعي. ما يساعد الناس على توفير الوقت في المهام اليومية مع فتح فرص مشاركة جديدة للشركات“.
من جانبه، أوضحت أوبن أيه آي أن خدمة Operator تتيح البحث عن صفحات الويب والتفاعل معها عن طريق الكتابة أو النقر أو التمرير بالطريقة التي قد يفعلها الشخص.
من هم وكلاء الذكاء الاصطناعي؟
مما لا شك فيه أن وكلاء الذكاء الاصطناعي هي أحدث صيحة في وادي السيليكون. حيث إنه يعد مساعدًا رقميًا من المفترض أن يستشعر البيئة المحيطة، ويتخذ القرارات ويتخذ الإجراءات لتحقيق أهداف محددة.
لذلك قد سبق وأن أعلنت Google في ديسمبر عن قدرات الوكيل مع إطلاق Gemini 2.0. وهو نموذج الذكاء الاصطناعي الأكثر تقدمًا حتى الآن. كما أطلقت شركة أنثروبيك المنافسة في سباق الذكاء الاصطناعي ميزة ”استخدام الحاسوب“ إلى نموذجها للذكاء الاصطناعي ”كلود فرونتير“ في مرحلة تجريبية عامة.
وقالت شركة أنثروبيك في منشور لها في ذلك الوقت: ”يمكن للمطورين توجيه كلود لاستخدام أجهزة الكمبيوتر بالطريقة التي يستخدمها الناس – من خلال النظر إلى الشاشة، وتحريك المؤشر، والنقر على الأزرار، وكتابة النص“، محذرة من أنه عمل قيد التطوير.
ووصفت أوبن إيه آي المشغل بأنه أحد وكلاء الذكاء الاصطناعي الأوائل القادرين على القيام بعمل الأشخاص بشكل مستقل، وهو مصمم لإكمال المهام التي يتم تكليفه بها.
قالت OpenAI إن المشغل متاح فقط للمستخدمين الأمريكيين الذين يدفعون مقابل اشتراكات Pro في خدمة OpenAI ”لضمان طرح آمن ومتكرر“.
أيضًا أضافت: ”إذا واجه تحديات أو ارتكب أخطاء، يمكن للمشغل الاستفادة من قدراته المنطقية للتصحيح الذاتي“.
”عندما يتعثر ويحتاج إلى مساعدة، فإنه ببساطة يعيد التحكم إلى المستخدم“.
أيضًا يتم تدريب المشغل على أن يطلب من المستخدم تولي المهام التي تتطلب تسجيل الدخول. أو تفاصيل الدفع. أو عند حل تحديات الأمان ”CAPTCHA“ التي تهدف إلى التمييز بين الأشخاص والبرامج عبر الإنترنت.
وقالت OpenAI: ”يمكن للمستخدمين جعل المشغل يقوم بمهام متعددة في وقت واحد من خلال إنشاء محادثات جديدة. مثل طلب كوب مينا مخصص على Etsy أثناء حجز موقع تخييم على Hipcamp“.
تحديات أوبن أيه آي لاعتماد Operator لدى المستخدمين
وعرضت العلامة التجارية للذكاء الاصطناعي ميزات الأداة الجديدة عبر فيديو توضيحي على الإنترنت. مشيرة إلى أن الأداة الجديدة هي وكيل يستخدم الحاسوب (CUA) يعتمد على نموذج GPT-4o. والذي يتيح وظائف متعددة الوسائط. مثل القدرة على البحث في الويب والقدرة على فهم منطق نتائج البحث.
على الرغم من ذلك، فقد لاحظ أولئك الذين حصلوا على فرصة لاختبار الأداة بعض الانتقادات. مثل بطء الاستجابة مقارنة بالعروض التوضيحية. والهلوسة التي تشبه روبوت الدردشة ChatGPT القياسي.
أيضًا أكد موقع بيزنغزا أن شكاوى بعض مستخدمي X لفتت انتباه سام التمان الرئيس التنفيذي لشركة OpenA. حيث شارك أحد مستخدمي X على المنصة مشاكل في تفاعلات العملية مع أحد المواقع الإخبارية. وبحسب ما ورد استجاب الرئيس التنفيذي ووعد بإصلاح المشكلة على الفور. ومع ذلك، من المحتمل أن يكون ما تعرض له المستخدم مجرد هلوسة.
وعلى الرغم من انبهار الكثيرين بميزات أداة Operator التي تم عرضها في العرض التوضيحي لإطلاق OpenAI، فإن السعر لا يزال رادعًا كبيرًا لتجربة وكيل الذكاء الاصطناعي. الأداة متاحة ضمن فئة ChatGPT Pro التي تقدمها OpenAI مقابل 200 دولار شهريًا في الشهر؛ ما يجعلها تجربة حصرية إلى حد ما.
أبرز انتقادات وجهت لأداة Operator
أشار الكاتب كريس سميث إلى كونه أحد مشتركي ChatGPT Plus، لكنه قال إنه لا يستطيع تبرير دفع 200 دولار شهريًا للوصول إلى أداة المشغل.
على الرغم من كل ما سبق، من المتوقع أن تجلب OpenAI أداة Operator إلى فئات ChatGPT Plus و CatGPT وفريق العمل والمؤسسات في مرحلة ما.
إحدى أكبر شكاوى المستخدمين هي أن المشغّل متاح حاليًا في الولايات المتحدة فقط. حيث أعرب المستخدمون الأوروبيون عن استيائهم من عدم قدرتهم على الوصول إلى الأداة.
كما أشار ComputerWorld أيضًا إلى أن وكلاء الذكاء الاصطناعي ككل يمكن أن يقدموا مخاطر أمان فريدة من نوعها. مثل استخدام الأنظمة الآلية لشن هجمات المرور أو تجاوز رموز CAPTCHA.
بينما أكدت OpenAI على أن لديها تأمينًا أمنيًا على Operator، إلا أن الباحثين أشاروا إلى أن هذه التقنية قد تتعارض مع محركات البحث. مثل جوجل، التي لديها إستراتيجيات معالجة البيانات الخاصة بها لأغراضها الخاصة.
المقال الأصلي: من هنـا