ما هي اهم الاختلافات بين GPT-3.5 , GPT-4
تعتبر ChatGPT، أول نموذج ذكاء اصطناعي توليدي للمحادثة باللغة الطبيعية متاح على نطاق واسع. يعمل هذا النموذج على إجراء المحادثات، والإجابة عن الأسئلة، وكتابة النصوص والشعر، والأكواد البرمجية. ولقد أجبر ChatGPT الأشخاص والشركات على إعادة التفكير في إمكانيات الذكاء الاصطناعي.
تم إطلاق النموذج اللغوي الكبير GPT-4 من قبل شركة OpenAI يوم الثلاثاء الماضي، الذي سيعمل به ChatGPT، ولكن يعمل به الآن الإصدار المدفوع (ChatGPT Plus) فقط، كما يعمل في العديد من المنتجات، مثل: أحدث إصدار من Bing Chat، وتطبيق Duolingo لتعلم اللغات، والعمل كمتطوع افتراضي في تطبيق Be My Eyes لضعاف البصر لاستقراء الصور وتحليلها، ووصفها بدقة للمستخدمين.
يُعد التغيير الأكبر في نموذج GPT-4 مقارنةً بأي إصدار سابق له هو أنه يمكنه فهم أكثر من طريقة واحدة للمعلومات المدخلة فيه، حيث يعد نموذجًا لغويًا متعدد الوسائط (Multi-Modal LLM). وفيما يلي، نستعرض أهم خمسة اختلافات بين هذه النماذج:
1- نموذج GPT-4 قادر على رؤية الصور وفهمها: يمكن إدخال الصور في نموذج GPT-4، ويقوم النموذج بمعالجتها للعثور على المعلومات الموجودة فيها، بالإضافة إلى معالجة النصوص. ويمكن للمستخدمين طلب وصف ما هو موجود في الصور ببساطة.
تقديم أداة Virtual Volunteer في تطبيق Be My Eyes للمكفوفين وضعاف البصر أدى إلى توفير مساعدة فورية لمجموعة متنوعة من المهام المستندة إلى الصور. يعمل المتطوع الافتراضي على قراءة الصور وتحويلها إلى نص مفهوم ومفيد، مما يساعد المستخدمين في فهم ما يظهر على الصور بشكل أفضل.
يتميز هذا النموذج عن غيره من تقنيات تحويل الصورة إلى نص بالحفاظ على السياق وتقديم اقتراحات فعالة. فمثلا، يستطيع المتطوع الافتراضي توفير وصف دقيق للمكونات الموجودة في الثلاجة، بالإضافة إلى تقديم مجموعة من الوصفات الممكنة التي يمكن تحضيرها باستخدام تلك المكونات. كما يستطيع تحديد النمط الموجود على الفستان وتوفير ترجمة دقيقة للملصق الموجود على سلعة غذائية.
وتمكن نموذج GPT-4 المتواجد في تطبيق Be My Eyes من إنجاز العديد من المهام المستندة إلى الصور بنجاح، مما يشير إلى قدرته الفائقة على التفاعل مع الصور. وقد شملت هذه المهام تحديد النباتات، وشرح كيفية الوصول إلى آلة معينة في صالة الألعاب الرياضية، وقراءة الخريطة.
ومع ذلك، يبقى النموذج GPT-4 مقتصرًا على الردود النصية، ولا يمكنه إنتاج الصور بنفسه. وبالتالي، فإن استخدامه يتطلب الاعتماد على الصور التي يتم إرسالها إليه لتحويلها إلى نص مقروء وفهمها بشكل أفضل.
ويمثل تطبيق Be My Eyes مثالًا ملهمًا لاستخدام التكنولوجيا في خدمة المجتمع
2- صعوبة الخداع لـ GPT-4
تميل روبوتات الدردشة التفاعلية، المعروفة باسم “Chatbots”، إلى تقديم معلومات غير صحيحة وغير دقيقة بسهولة، على الرغم من الأداء الجيد الذي تقدمه هذه الروبوتات في الوقت الحالي. ويمكن لأي شخص التحدث مع هذه الروبوتات وإقناعها بشكل سريع ليقنعها بأن يكون هناك “ذكاء اصطناعي شرير” أو “روبوت دردشة شرير” أو حتى يقوم بإجراء بعض الأعمال الخيالية الصغيرة التي تسمح للنموذج بإطلاق العنان لجميع أنواع الأشياء الغريبة.
وقد استغل العديد من الأشخاص بالفعل ChatGPT لإنشاء محتوى ضار فيما يُعرف باسم “كسر حماية روبوتات الدردشة المدعومة بالذكاء الاصطناعي”، باستخدام مجموعة متنوعة من الأساليب، منها لعب أدوار أخرى.
لذلك، دربت شركة OpenAI نموذج GPT-4 على الكثير من الطلبات الخبيثة التي قدمها المستخدمون للروبوت خلال الفترة الماضية. ولذلك، يمتلك النموذج الجديد قابلية أفضل بكثير للإجابة بطريقة واقعية وتوجيه أفضل ورفض للخروج من حواجز الحماية.
وأعلنت شركة OpenAI أن نموذج GPT-4 يفوق إصدار GPT-3.5 بنسبة 40٪ في تقديم الردود الواقعية، كما يمتلك قدرات تفكير متقدمة أكثر من سابقه. وأكدت الشركة أيضًا أنها طورت نموذج GPT-4 ليكون قادرًا على رفض نسبة 82٪ من محاولات وتساؤلات المستخدمين الساعية نحو الحصول على إجابات تتعلق بموضوعات خطرة، مثل: تصنيع المخدرات او طرق تهريبها
وتقر شركة “أوبن إي إي” بأن الذكاء الاصطناعي الذي تستخدمه لا يزال عرضة لحدوث الهلوسة والأخطاء المنطقية، وهذا يعود إلى قدرته على توليد ردود خاطئة. وأشار سام ألتمان، مؤسس ورئيس التنفيذي للشركة، إلى أن هذا النموذج الذي تم تطويره هو الأفضل حتى الآن، ولكنه ما زال يعاني من بعض العيوب والقيود، ولا يزال مثيرًا للاهتمام أثناء استخدامه للمرة الأولى بينما يفقد بعضاً من جاذبيته عند استخدامه لفترات طويلة.
ويتمثل المشكلة الرئيسية في الذكاء الاصطناعي في توليد ردود غير صحيحة أو مخالفة للمنطق، والتي يمكن أن تؤدي إلى الهلوسة. وقد أكدت الشركة أنها تعمل جاهدة على تحسين هذه الميزة وتطويرها لتجنب حدوث الأخطاء المنطقية.
ومن المهم أن يتم الإشارة إلى أن استخدام التكنولوجيا بشكل عام يأتي مع بعض المخاطر والتحديات، ولكن تطوير التكنولوجيا وتحسينها سيكون له تأثير إيجابي على العديد من المجالات في المستقبل، وخاصةً فيما يتعلق بالذكاء الاصطناعي والتعلم الآلي. وبالتالي، يجب على الشركات العاملة في هذا المجال العمل على تطوير وتحسين التكنولوجيا بشكل مستمر والعمل على تجنب الأخطاء والهلوسة لضمان استخدام آمن وفعال لهذه التقنية.
3- يأتي GPT-4 بذاكرة أطول من سابقه
تتعلم النماذج اللغوية الكبيرة من ملايين الصفحات الموجودة على الويب والكتب والبيانات النصية الأخرى، ولكن عند إجراء محادثة فعلية مع المستخدم، يتعين عليها الحفاظ على السياق. في النموذج السابق GPT-3.5 الذي يستخدمه ChatGPT، كان الحد الأقصى للذاكرة حوالي 3000 كلمة فقط، وهو يعادل ثلاثة إلى أربع صفحات من الكتاب. وهذا يجعل من الصعب على النموذج العمل بكفاءة في المحادثات الطويلة.
ومع ذلك، فإن نموذج GPT-4 يستطيع التعامل مع أكثر من 25000 كلمة، وهو ثمانية أضعاف ما يمكن للإصدار السابق التعامل معه. وهذا يعادل حوالي 50 صفحة من النص، وهو ما يكفي لمسرحية كاملة أو قصة قصيرة.
ومن المعروف أن النموذج الذي يحتوي على ذاكرة أطول يستطيع الاحتفاظ بسياق الحوار بشكل أفضل، وبالتالي يمكنه الاحتفاظ بما يصل إلى 50 صفحة في المحادثة أو في إنشاء النصوص. وبذلك سيتذكر ما تم مناقشته في الصفحة رقم 20 من الدردشة، وقد يشير إلى الأحداث التي وقعت قبل 35 صفحة. وهذا يجعل استخدامه في إنشاء المحتوى الطويل والمحادثات الممتدة والبحث وتحليل المستندات ممكناً.
4- التعددية في اللغات
يتميز العالم الذكي الاصطناعي باللغة الإنجليزية ويستند كل شيء فيه، من البيانات والاختبارات وحتى الأوراق البحثية، على هذه اللغة. ومع ذلك، فإن قدرات النماذج اللغوية العالية يمكن أن تكون قابلة للتطبيق في أي لغة مكتوبة ويجب أن تكون متاحة لجميع المستخدمين.
قامت شركة Open AI بخطوة نحو تحقيق ذلك من خلال إطلاق نموذج GPT-4 الذي يمتلك قدرة مذهلة على الإجابة على آلاف الأسئلة المتعددة الخيارات بدقة عالية في 26 لغة مختلفة، من الإيطالية والعربية والتركية، وكذلك تدريبه على 5 لغات هندية محلية.
يعد هذا الاختبار الأولي لقدرات النموذج اللغوية واعدًا، ولكنه لا يزال بعيدًا عن دعم القدرات المتعددة اللغات بالكامل؛ إذ تم ترجمة معايير الاختبار من اللغة الإنجليزية لفهمها من قبل النموذج، وأسئلة الخيارات المتعددة لا يمكن مقارنتها بالكلام العادي. ومع ذلك، فإن هذه الخطوة تعد مهمة في نموذج GPT-4 لأنها تعني أنه قد يكون أكثر ودية مع غير المتحدثين باللغة الإنجليزية.
5- شخصيات متعددة
يتميز الذكاء الاصطناعي بمفاهيم عديدة تثير الاهتمام، ومن بينها مفهوم القابلية للتوجيه (Steerability) الذي يشير إلى قدرة النموذج الذكي على تغيير سلوكه بناءً على الطلب. ويتضح أن هذه الميزة متاحة في نموذج GPT-3.5، حيث تم استخدامها لإقناع روبوت ChatGPT بأن يتصرف كمستمع متعاطف أو دردشة شريرة، وذلك بما يتناسب مع المهمة المطلوبة.
وفي نموذج GPT-4، تم تطوير ميزة القابلية للتوجيه لتصبح أكثر فائدة، حيث يمكن للنموذج تبني شخصيات مختلفة بما يتناسب مع الغرض المطلوب. ويتم تطبيق بعض القيود والإجراءات المتعلقة بهذه الميزة في النظام لتجنب أي نتائج سلبية أو خطرة.
ويمثل استخدام هذه الميزة مثلاً واضحاً لتحقيق الهدف المطلوب، حيث يمكن وضع مجموعة من التوجيهات والإرشادات للنموذج ليتحول إلى معلم للطلاب، حيث تساعد هذه الإرشادات على تبسيط المعلومات وتقديمها بطريقة تناسب مستوى فهم الطالب بسهولة ووضوح.
وبفضل هذه الميزة، يمكن للمطورين أيضاً التحكم في طريقة عمل خدماتهم التي تقدم تفاعلًا ذكيًا مع المستخدمين، من خلال تعيين سمات شخصية محددة للنموذج الذي تعتمد عليه الخدمات وأسلوب تعاملها مع المستخدمين، وهذا يتيح لهم تقديم خدمات متميزة وفعالة.