OpenAI تُطلق أحدث نموذج للذكاء الاصطناعي GPT-4o بمميزات متطوره
أعلنت شركة OpenAI عن أحدث نموذج للذكاء الاصطناعي ، تحت مسمي GPT-4o. تقول إنه سيجعل ChatGPT أكثر ذكاءً وأسهل في الاستخدام. النموذج GPT-4o، هو تحديث للطراز السابق GPT-4 للشركة ، والذي تم إطلاقه منذ ما يزيد عن عام. سيكون النموذج متاحًا للعملاء غير المدفوعين، مما يعني أنه سيتمكن أي شخص من الوصول إلى تكنولوجيا الذكاء الاصطناعي OpenAI الأكثر تقدمًا من خلال ChatGPT.
من خلال العرض التوضيحي الذي قدمته الشركة يوم الاثنين، سيعمل GPT-4o على تحويل ChatGPT بشكل فعال إلى مساعد شخصي رقمي يمكنه المشاركة في المحادثات الصوتية بشكل مباشر والرد على التساؤلات. وسيكون أيضًا قادرًا على التفاعل باستخدام النص الكتابية والتفاعلات المرئية، مما يعني أنه يمكنه عرض لقطات الشاشة أو الصور أو المستندات أو المخططات التي تم تحميلها من قبل المستخدمين وإجراء محادثة حولها.
ماهو GPT-4o ؟
GPT-4o هو أحدث نموذج للذكاء الاصطناعي لدي شركة OpenAI ، وهو عبارة عن تحديث للإصدار السابق GPT-4 . يشير الحرف “o” في GPT-4o إلى “omni”، مما يدل على تعدد استخداماته. على عكس سابقاتها، يمكن لـ GPT-4o التعامل مع مجموعة متنوعة من المدخلات والمخرجات. تعد النصوص والصوت والصور كلها ، مما يسمح بتجربة مستخدم متعددة الوسائط.
و هو خطوة نحو تفاعل أكثر طبيعية بين الإنسان والحاسوب – فهو يقبل اي مدخلات كـ مجموعة من النصوص والأصوات والصور ويولد أي مجموعة من النصوص والأصوات والصور ومقاطع الفيديو كـ مخرجات.
تصريحات ميرا موراتي
على حسب تصريحات ميرا موراتي، كبيرة مسؤولي التكنولوجيا في OpenAI، إن الإصدار المحدث من ChatGPT سيتمتع الآن أيضًا بقدرات الذاكرة، مما يعني أنه يمكنه التعلم من المحادثات السابقة مع المستخدمين، ويمكنه القيام بالترجمة بشكل مباشر.
وأضافت موراتي خلال العرض التجريبي المباشر من مقر الشركة في سان فرانسيسكو: “هذه هي المرة الأولى التي نخطو فيها خطوة كبيرة إلى الأمام عندما يتعلق الأمر بسهولة الاستخدام”. “يصبح هذا التفاعل أكثر طبيعية وأسهل بكثير.”
يأتي الإصدار الجديد في الوقت الذي تسعى فيه OpenAI إلى البقاء في صدارة المنافسة المتزايدة في سباق التسلح للذكاء الاصطناعي. يعمل المنافسون، بما في ذلك Google و Meta، على بناء نماذج لغوية كبيرة قوية بشكل متزايد تعمل على تشغيل برامج الدردشة الآلية ويمكن استخدامها لتوفير تقنية الذكاء الاصطناعي إلى العديد من المنتجات الأخرى.
جاء حدث OpenAI قبل يوم واحد من مؤتمر مطوري I/O السنوي لشركة Google، والذي أعلنت جوجل فيه عن تحديثات نموذج Gemini AI الخاص بها. مثل GPT-4o الجديد، يعد Gemini من Google أيضًا متعدد الوسائط، مما يعني أنه يمكنه تفسير وإنشاء النصوص والصور والصوت. ويأتي تحديث OpenAI أيضًا قبل إعلانات الذكاء الاصطناعي المتوقعة من شركة Apple في مؤتمر المطورين العالمي الشهر المقبل، والذي قد يتضمن طرقًا جديدة لدمج الذكاء الاصطناعي في إصدارات iPhone و iOS التالية.
وفي الوقت نفسه، يمكن أن يكون الإصدار الأخير من GPT بمثابة نقله لشركة Microsoft، التي استثمرت مليارات الدولارات في OpenAI لدمج تكنولوجيا الذكاء الاصطناعي الخاصة بها في منتجات Microsoft الخاصة.
مميزات الاصدار الجديد GPT-4o
- المحادثات الصوتية بشكل مباشر:
يستطيع GPT-4o تقليد أنماط الكلام البشري، مما يتيح إجراء محادثات سلسة وطبيعية. تخيل إجراء محادثة حول اي موضوع مع GPT-4o، و الحصول على تعليقات وتفاعلات بشكل مباشر وفعلي حول أسلوب العروض التقديمية لأعمالك.
- إنشاء محتوى متعدد الوسائط:
هل تحتاج إلى قصيدة مستوحاة من لوحة فنية؟ يمكن لـ GPT-4o التعامل معها. يمكنه إنشاء تنسيقات نصية إبداعية مختلفة، مثل القصائد والأكواد والنصوص والمقطوعات الموسيقية والبريد الإلكتروني والرسائل وما إلى ذلك، بناءً على المطالبات والمدخلات المختلفة. على سبيل المثال، يمكنك تزويد GPT-4o بمفهوم علمي وتطلب منه كتابة مشاركة تشرحه بطريقة جذابة.
- تحليل الصوت والصوره:
يستطيع GPT-4o تحليل وفهم محتوى الصور والملفات الصوتية. وهذا يفتح الأبواب لمجموعة متنوعة من التطبيقات. على سبيل المثال، يمكنك أن تعرض على GPT-4o صورة لإجازتك وتطلب منه اقتراح مطالبة بالكتابة الإبداعية بناءً على الموقع. أو يمكنك تشغيل مقطع صوتي لأغنية والطلب من GPT-4o تحديد النوع أو كتابة كلمات الأغاني بأسلوب مماثل.
- معالجة أسرع:
تفتخر OpenAI بأن GPT-4o يقدم استجابات شبه فورية، مماثلة لأوقات رد الفعل البشري. وهذا يجعل التفاعل مع GPT-4o يبدو أشبه بمحادثة مع شخص حقيقي وأقل شبهاً بانتظار جهاز لمعالجة المعلومات.
كيفية استخدام GPT-4o؟
في حين أن التفاصيل لا تزال في طور الظهور، فقد ألمح OpenAI إلى وجود طبقة مجانية لـ GPT-4o، مما يجعله في متناول جمهور واسع. ومن المتوقع أيضًا أن توفر الخطط المدفوعة إمكانات متزايدة وحدودًا للاستخدام.
وحتى الآن، تقوم الشركة بإطلاقه تدريجياً. حيث تعمل شركة OpenAI على توفير الذكاء الاصطناعي القوي الجديد GPT-4o على مراحل. حاليًا، يمكن للمستخدمين تجربة إمكانيات النصوص والصور من خلال ChatGPT، مع طبقة مجانية تسمح للجميع باستكشاف إمكانياته.
للحصول على تجربة أكثر قوة، توفر الطبقة Plus حدودًا أكبر للرسائل بمقدار 5 أضعاف. بالإضافة إلى ذلك، سيتم طرح إصدار ألفا من وضع الصوت مع GPT-4o قريبًا في ChatGPT Plus، مما يتيح المزيد من المحادثات الطبيعية.
يمكن للمطورين أيضًا المشاركة في الحدث باستخدام GPT-4o الذي يمكن الوصول إليه الآن من خلال OpenAI API كنموذج للنص والرؤية. ومن المثير للإعجاب أن GPT-4o يتميز بسرعة مضاعفة، وتكاليف أقل، و 5 أضعاف حدود المعدل مقارنة بسابقه، GPT-4 Turbo.
تطبيق الكمبيوتر
صرحت موراتي إن OpenAI ستطلق تطبيق ChatGPT لأجهزة الكمبيوتر بقدرات GPT-4o، مما يمنح المستخدمين منصة أخرى للتفاعل مع تكنولوجيا الشركة. ستكون GPT-4o متاحة أيضًا للمطورين الذين يتطلعون إلى إنشاء روبوتات الدردشة المخصصة الخاصة بهم من متجر GPT الخاص بـ OpenAI، وهي ميزة ستكون متاحة الآن أيضًا للمستخدمين بشكل مجاني.
موعد اطلاق GPT-4o
من المقرر طرح التكنولوجيا والميزات المحدثة على ChatGPT في الأشهر المقبلة. سيكون لدى مستخدمي ChatGPT المجاني عدد محدود من التفاعلات مع نموذج GPT-4o الجديد قبل أن تعود الأداة تلقائيًا إلى الاعتماد على نموذج GPT-3.5 القديم. سيتمكن أصحاب الاستخدام المدفوع من الوصول إلى عدد أكبر من الرسائل بأحدث طراز.
قال OpenAI إن أكثر من 100 مليون شخص يستخدمون ChatGPT بالفعل. لكن تجربة ChatGPT المحدثة – والقدرة على التفاعل معها على أجهزة الكمبيوتر ومن خلال المحادثات الصوتية المحسنة – يمكن أن تمنح المزيد من الأشخاص سببًا لاستخدام تقنيتها. وتأتي هذه التحركات في وقت قد يؤدي فيه دمج الذكاء الاصطناعي في المنتجات الاستهلاكية الأكثر استخدامًا من قبل Google وMeta، مثل Instagram و Google Assistant.
في الختام
نحن امام جيل جديد ونقله نوعية في الذكاء الاصطناعي، نحن أمام حدث سوف يغير طريقة تعامل البشر مع الآلات. يمثل إطلاق GPT-4o خطوة كبيرة إلى الأمام في إمكانية الوصول إلى الذكاء الاصطناعي وسهولة استخدامه. مع قدرات هائلة تمكنه من فهم الكلام المنطوق والمكتوب والصور وتحليل الأصوات والتفاعل مع المستخدم والرد بشكل فوري كأنك تتعامل مع صديق مثقف وفاهم يستطيع مجاراتك في أي موضوع. مع القدرة على تحليل المشاعر وتمييز نبرات الصوت وتمييز الوجوه. بالإضافة الى توفره بشكل مجاني . هذا سوف يشعل المنافسة مع Gemini 1.5 PRO من جوجل، الذي اعلنت عنه جوجل ايضًا.