Anthropic تُطلق Claude 4: ثورةٌ في مجال الوكلاء الذكيين وبرمجة الذكاء الاصطناعي
كتبت: أمل علوي

كشفت شركة Anthropic النقاب عن عائلتها الجديدة من نماذج Claude 4، والتي تُمثّل قفزةً نوعيةً في مجال تطوير المساعدين الذكيين القادمين وبرمجة الذكاء الاصطناعي. ويتصدر المشهد نموذجا Claude Opus 4، القوة المُحركة الجديدة، و Claude Sonnet 4، المُصمم ليكون مُتعدد الاستخدامات.
وتُعلن Anthropic بجرأة عن طموحاتها، مؤكدةً أن هذه النماذج تهدف إلى “تطوير استراتيجيات الذكاء الاصطناعي لعملائها بشكلٍ كامل”. وتُقدّم Opus 4 كأداة “لتجاوز الحدود في مجالات البرمجة والبحث والكتابة والاكتشاف العلمي”، بينما يُوصف Sonnet 4 بأنه “ترقية فورية من Sonnet 3.7″، جاهز لتقديم “أداءً متقدماً في حالات الاستخدام اليومية”.
Claude Opus 4: بطل البرمجة الجديد
عندما تُسمّي Anthropic نموذج Claude Opus 4 بأنه “أقوى نماذجها حتى الآن وأفضل نموذج للبرمجة في العالم”، فإنك تنتبه إلى ذلك. ولديهم الأرقام لدعم ذلك، حيث يتصدر Opus 4 الرسوم البيانية في اختبارات الصناعة الحاسمة، محققاً 72.5% في اختبار SWE-bench و43.2% في اختبار Terminal-bench.
ولكن الأمر لا يتعلق فقط بالسرعة. فقد تمّ تصميم Opus 4 للعمل على المدى الطويل، وهو مُصمم لـ”الأداء المُستدام في المهام الطويلة التي تتطلب جهداً مركزاً وآلاف الخطوات”. تخيل ذكاءً اصطناعياً يمكنه “العمل بشكلٍ مستمر لساعات عديدة”—هذا ما تدّعيه Anthropic.
يُفترض أن يكون هذا قفزةً هائلةً مقارنةً بنماذج Sonnet السابقة، ويمكن أن يُوسّع ما يمكن أن يحققه الوكلاء الذكيون، معالجة المشاكل التي تتطلب مثابرةً حقيقية.
Claude Sonnet 4: للذكاء الاصطناعي اليومي والعمل الوكيلي
بينما يُعتبر Opus 4 بطل الوزن الثقيل، يُشكّل Claude Sonnet 4 حصان العمل المُتعدد الاستخدامات، وواعداً بزيادةٍ كبيرة في مجموعة واسعة من التطبيقات. التعليقات المبكرة من أولئك الذين حصلوا على نظرة سريعة إيجابية جداً.
على سبيل المثال، تقول GitHub إن “Claude Sonnet 4 يُحقق نجاحاً كبيراً في السيناريوهات الوكيلية”، وهي معجبة لدرجة أنها “تخطط لإدخاله كنموذج أساسي للوكيل البرمجي الجديد في GitHub Copilot”. وهذا تأييدٌ كبير.
كما أعرب المُعلق التقني Manus عن إعجابه، مُسلّطاً الضوء على “التحسينات في اتباع التعليمات المُعقدة، والاستدلال الواضح، والمخرجات الجمالية”.
وتستمر التعليقات الإيجابية مع iGent، التي “تُفيد بأن Sonnet 4 يتفوق في تطوير تطبيقات متعددة الميزات بشكلٍ مستقل، بالإضافة إلى تحسين حلّ المشاكل والتنقل في قاعدة الرموز—مُقلّلةً أخطاء التنقل من 20% إلى ما يقارب الصفر”. وهذا يُغيّر قواعد أعمال التطوير.
تُبدي Sourcegraph تفاؤلاً مُشابهاً، و ترى النموذج كـ”قفزةٍ كبيرة في تطوير البرامج—البقاء على المسار لفترة أطول، وفهم المشاكل بشكلٍ أعمق، وتقديم جودة رموز أكثر أناقة”.
وقد لاحظت Augment Code “معدلات نجاح أعلى، وتعديلات رموز أكثر دقة، وعملًا أكثر حرصًا خلال المهام المُعقدة”، مما أدى إلى جعلها Sonnet 4 “الخيار الأفضل لنموذجها الرئيسي”.
الأنماط الهجينة ومتعة المُطوّرين
إحدى النقاط الذكية جداً في عائلة Claude 4 هي طبيعتها الهجينة. يمكن لكلٍّ من Opus 4 و Sonnet 4 العمل بسرعتين: إحداهما للردود الفورية التي نحتاجها غالبًا، وأخرى تسمح بـ”التفكير المُوسّع للاستدلال الأعمق”.
يُعدّ وضع التفكير الأعمق جزءاً من خطط Claude Pro، Max، Team، و Enterprise. لكن هناك أخبار سارة للجميع—سيكون Sonnet 4، مع هذا التفكير المُوسّع، متاحاً أيضاً للمستخدمين المجانيين، وهذه خطوة رائعة لجعل الذكاء الاصطناعي ذو المستوى العالي أكثر إمكانية للجميع.
كما تُطلق Anthropic بعض الأدوات الجديدة للمُطوّرين على واجهة برمجة التطبيقات API خاصتها، وتهدف بوضوح إلى تعزيز إنشاء وكلاء ذكاء اصطناعي أكثر تطوراً:
أداة تنفيذ الرموز: تسمح هذه الأداة للنماذج بتشغيل الرموز فعلياً، مما يفتح إمكانياتٍ كثيرةً للتطبيقات التفاعلية وحلّ المشاكل.
موصل MCP: يُعزز Anthropic معيار MCP لتبادل السياق بين مساعدي الذكاء الاصطناعي و بيئات البرامج.
واجهة برمجة التطبيقات للملفات: سيُسهّل هذا الأمر عمل الذكاء الاصطناعي بشكلٍ مباشر مع الملفات، وهو أمرٌ هامٌ لكثيرٍ من المهام العالمية.
ذاكرة الطلبات: سيتمكن المُطوّرون من حفظ الطلبات لمدة تصل إلى ساعة. قد يبدو هذا أمرًا صغيراً، لكنّه يمكن أن يُحدث فرقاً حقيقياً في السرعة والكفاءة، خاصةً للاستفسارات المُستخدمة بشكلٍ متكرر.
الريادة في الأداء العملي
تُشدّد Anthropic على أن “نماذج Claude 4 تُحقق الريادة في اختبار SWE-bench Verified، وهو معيار لأداء مهام هندسة البرامج الحقيقية”. وإلى جانب البرمجة، تُؤكّد أن هذه النماذج “تُقدّم أداءً قوياً في مجالات البرمجة، والاستدلال، والقدرات متعددة الوسائط، والمهام الوكيلية”.
على رغم القفزات في القدرات، إلا أن Anthropic تحافظ على أسعارها. سيكلفك Claude Opus 4 15 دولاراً لكل مليون وحدة إدخال و 75 دولاراً لكل مليون وحدة إخراج. أما Claude Sonnet 4، الخيار الأكثر إمكانية للجميع، فسعره 3 دولارات لكل مليون وحدة إدخال و 15 دولاراً لكل مليون وحدة إخراج. وسيُرحّب المستخدمون القديمون بهذا التناسق.
كلا النموذجين Claude Opus 4 و Sonnet 4 جاهزان للاستخدام عبر واجهة برمجة التطبيقات API لـ Anthropic، كما يظهران أيضاً على Amazon Bedrock و Google Cloud’s Vertex AI. تُتيح هذه التوفر الواسع للمؤسسات والمُطوّرين في جميع أنحاء العالم البدء في تجربة و دمج هذه الأدوات الجديدة بسهولةٍ كبيرة.
تُضاعف Anthropic جهودها بالتأكيد لجعل الذكاء الاصطناعي أكثر قدرة، خاصةً في مجالات البرمجة المُعقدة وسلوك الوكلاء المستقلين. مع هذه النماذج وأدوات المُطوّرين الجديدة، حصلت إمكانية الابتكار على دفعةٍ قوية.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.