1️⃣ البرومبت المستخدم في الاختبار
سنستخدم برومبت واحد للجميع:
البرومبت:
اشرح مفهوم الذكاء الاصطناعي لطفل عمره 10 سنوات مع مثال بسيط من الحياة اليومية.
2️⃣ نتيجة نموذج GPT
النتيجة المختصرة:
الذكاء الاصطناعي هو عندما نجعل الكمبيوتر يتعلم ويفكر بطريقة تشبه الإنسان.
مثلًا عندما تشاهد فيديوهات على يوتيوب ويقترح لك فيديوهات أخرى قد تعجبك، فالكمبيوتر يتعلم من الأشياء التي تحبها ويحاول أن يقترح أشياء مشابهة.
الخصائص:
شرح واضح ومنظم
مثال عملي
لغة بسيطة
3️⃣ نتيجة نموذج Claude
النتيجة المختصرة:
تخيل أن لديك روبوتًا صديقًا يتعلم منك. كلما لعبت معه أكثر أصبح أفضل في فهم ما تحب. هذا يشبه الذكاء الاصطناعي، حيث تتعلم البرامج من البيانات لتصبح أكثر ذكاءً بمرور الوقت.
الخصائص:
أسلوب قصصي
تركيز على التشبيه
لغة لطيفة وبسيطة
4️⃣ نتيجة نموذج Gemini
النتيجة المختصرة:
الذكاء الاصطناعي هو تقنية تجعل الأجهزة قادرة على التعلم واتخاذ قرارات. مثال: عندما يفتح الهاتف بالكشف عن الوجه، فهو يستخدم الذكاء الاصطناعي للتعرف عليك.
الخصائص:
شرح تقني أكثر
مثال من الهاتف
أقل سردًا قصصيًا
5️⃣ مقارنة النتائج
المعيار
GPT
Claude
Gemini
وضوح الشرح
ممتاز
ممتاز
جيد
الأسلوب
تعليمي مباشر
قصصي وتشبيهي
تقني مختصر
الإبداع
جيد
عالي
متوسط
الدقة
عالية
عالية
عالية
6️⃣ تحليل الفروقات
1. أسلوب الكتابة
GPT: تعليمي ومنظم
Claude: يميل للسرد والشرح الإنساني
Gemini: يميل للشرح التقني
2. طريقة الأمثلة
GPT: أمثلة من الإنترنت والتطبيقات
Claude: تشبيه خيالي (روبوت صديق)
Gemini: أمثلة من الأجهزة
3. الجمهور المستهدف
Claude الأفضل للأطفال
GPT مناسب للتعليم العام
Gemini مناسب للمعلومة التقنية السريعة
✅ الخلاصة:
GPT: الأفضل في التوازن بين الوضوح والدقة.
Claude: الأفضل في الأسلوب الإالذكاء الاصطناعي
1️⃣ هدف التجربة
قياس أداء النماذج في:
الفهم
الإبداع
الدقة
التحليل
جودة اللغة
2️⃣ النماذج التي سيتم اختبارها
GPT
Claude
Gemini
3️⃣ منهجية التجربة
الخطوات
استخدام نفس البرومبت لكل نموذج.
منع تعديل البرومبت أثناء التجربة.
تسجيل إجابة كل نموذج كاملة.
تقييم الإجابة وفق 10 معايير ثابتة.
إعطاء درجة من 1 إلى 10 لكل معيار.
4️⃣ برومبت الاختبار
استخدم برومبت مركب يقيس عدة قدرات:
البرومبت
اشرح تأثير الذكاء الاصطناعي على مستقبل العمل خلال 10 سنوات.
قدم 3 فوائد و3 مخاطر، واقترح حلين للتوازن بين التكنولوجيا والوظائف البشرية.
هذا البرومبت يقيس:
التحليل
التفكير النقدي
التنظيم
الإبداع
5️⃣ جدول التقييم (10 معايير)
المعيار
الوصف
الدرجة (1–10)
الفهم
مدى فهم النموذج للسؤال
الدقة
صحة المعلومات
العمق التحليلي
مستوى التحليل والتفسير
التنظيم
ترتيب الأفكار
الإبداع
أفكار جديدة أو مختلفة
الوضوح
سهولة الفهم
التوازن
عرض أكثر من وجهة نظر
قوة الأمثلة
استخدام أمثلة واقعية
جودة اللغة
أسلوب الكتابة
قابلية التطبيق
هل الحلول عملية
6️⃣ مثال نتائج افتراضية
المعيار
GPT
Claude
Gemini
الفهم
9
9
8
الدقة
9
9
9
التحليل
9
8
7
التنظيم
9
8
8
الإبداع
8
9
7
الوضوح
9
9
8
التوازن
8
9
7
الأمثلة
8
8
7
اللغة
9
9
8
التطبيق
8
8
7
النتيجة النهائية
النموذج
المجموع
GPT
86
Claude
86
Gemini
76
7️⃣ تحليل النتائج
GPT
قوي في التحليل والتنظيم
إجابات متوازنة
Claude
إبداعي أكثر
أسلوب لغوي إنساني
Gemini
معلومات دقيقة
أقل عمقًا في التحليل
8️⃣ طريقة جعل التجربة أكثر احترافية
لزيادة الموثوقية:
استخدم 5 برومبت مختلفة
احسب متوسط النتائج
استخدم مقيمين اثنين على الأقل
9️⃣ برومبتات إضافية للاختبار
اختبار الإبداع
اكتب قصة قصيرة عن عالم يستخدم الذكاء الاصطناعي لإنقاذ الأرض.
اختبار الت
حليل
حلل أسباب نجاح الشركات التقنية خلال العقد الأخير.
اختبار التفكير المنطقي
إذا زاد الإنتاج 20% وانخفضت التكلفة 10% كيف سيتغير الربح؟بداعي والإنساني.
Gemini: الأفضل في الاختصار والمعلومة التقنية.