تكنولوجيا و ذكاء اصطناعي

تفوق شات جي بي تي على جيميني في ثلاثة مجالات رئيسية

تاريخ النشر : الثلاثاء - pm 06:00 | 2026-01-20

في ظل الانتشار الهائل لتطبيقات الذكاء الاصطناعي، باتت المقارنة بين الأنظمة الكبرى مثل شات جي بي تي من OpenAI وجيميني من غوغل أمرًا معقدًا. وقد جاء هذا التعقيد نتيجة للتسارع الكبير في وتيرة التطوير.

في ديسمبر 2025، سادت تكهنات حول تراجع OpenAI في سباق الذكاء الاصطناعي، قبل أن تقلب الشركة المعادلة بإطلاق ChatGPT-5.2، الذي أعادها إلى صدارة معظم التصنيفات.

لكن مع تقارب قدرات النماذج اللغوية الضخمة، لم تعد المقارنات السطحية المبنية على إجابة واحدة لسؤال واحد كافية أو دقيقة. فالردود بطبيعتها عشوائية جزئيًا، وأسلوب المحادثة يمكن تخصيصه بسهولة.

تفوق شات جي بي تي في الاختبارات المعيارية

لذلك، يبقى الاحتكام إلى الاختبارات المعيارية (Benchmarks) هو الطريق الأكثر موضوعية لتقييم الأداء الحقيقي. بحسب تقرير نشره موقع slashgear، فإن هناك ثلاثة معايير رئيسية يظهر فيها تفوق شات جي بي تي على جيميني، وفق أحدث النتائج المتاحة.

أول هذه المعايير هو اختبار GPQA Diamond، المصمم لقياس قدرات التفكير العلمي على مستوى الدكتوراه في الفيزياء والكيمياء والأحياء. ويُعرف هذا الاختبار بأسئلته المحصنة ضد غوغل، إذ لا يمكن حلها عبر البحث السريع.

في هذا الاختبار، سجل ChatGPT-5.2 نسبة 92.4%، متقدمًا بفارق طفيف على Gemini 3 Pro الذي حقق 91.9%. وللمقارنة، يُتوقع من حملة الدكتوراه تحقيق نحو 65% فقط، بينما لا يتجاوز متوسط غير المتخصصين 34%.

حل المشكلات البرمجية والألغاز البصرية

المعيار الثاني هو SWE-Bench Pro، الذي يقيس قدرة الذكاء الاصطناعي على حل مشكلات برمجية حقيقية مأخوذة من بلاغات فعلية على منصة GitHub. ويتطلب هذا الاختبار فهم قاعدة كود غير مألوفة وتحليل وصف المشكلة.

وفق النتائج، نجح ChatGPT-5.2 في حل نحو 24% من المشكلات، مقابل 18% فقط لجيميني. ورغم أن هذه النسب تبدو متواضعة، فإن هذا الاختبار يُعد من الأصعب في مجاله.

أما المعيار الثالث فهو ARC-AGI-2، المخصص لقياس التفكير التجريدي والقدرة على استنتاج الأنماط من أمثلة محدودة. في هذا الاختبار، حقق ChatGPT-5.2 Pro نسبة 54.2%، متقدمًا على معظم إصدارات جيميني.

استنتاجات حول سباق الذكاء الاصطناعي

تشير هذه النتائج إلى أن سباق الذكاء الاصطناعي لا يُحسم بتجربة واحدة أو انطباع شخصي، بل بأرقام ومعايير دقيقة. ورغم وجود اختبارات أخرى يتفوق فيها جيميني، فإن التركيز هنا كان على الحالات التي يظهر فيها تفوق شات جي بي تي بوضوح.

كما جرى استبعاد الدراسات القائمة على التفضيل الشخصي، رغم أهميتها. علمًا بأن جيميني يتصدر حاليًا تفضيلات المستخدمين هناك. هذه الاختبارات تقدم رؤية واضحة حول إمكانيات كل من شات جي بي تي وجيميني في المستقبل.