«ثورة جديدة في عالم البحث العميق» StepFun AI تطلق نموذج الذكاء الاصطناعي Step-DeepResearch
بواسطة: هالة رشاد مرسي
–
يناير 27, 2026 3:15 ص
أعلنت StepFun AI عن إطلاق نموذجها الجديد Step‑DeepResearch، وهو وكيل بحث شامل يغطي جميع جوانب البحث العميق من البداية إلى النهاية، ويعتمد على 32 مليار معاملة ويستخدم Qwen2.5-32B-Base.
يهدف هذا النموذج إلى تحويل عمليات البحث التقليدية على الإنترنت إلى سير عمل بحثي متقدم، يشمل التفكير طويل المدى، واستخدام الأدوات المتنوعة، وإعداد تقارير منظمة تتضمن الاستشهادات، مع الاحتفاظ بتكاليف استدلال منخفضة نسبيًا مقارنة بالنماذج الأكبر حجمًا. يعيد النموذج صياغة مهمة البحث العميق على أنها عملية اتخاذ قرارات متتابعة تعتمد على مجموعة متكاملة من أربع قدرات أساسية (القدرات الذرية): تخطيط المهمة، وفك رموزها، والبحث المتعمق، وتجميع المعلومات والتحقق منها، وإنتاج التقارير الاحترافية. بدلاً من الاعتماد على التنسيق بين عوامل خارجية متعددة، يدمج النموذج هذه العملية داخليًا ضمن وكيل واحد يحدد الخطوة التالية في كل مرحلة.
بناء البيانات والتدريب الموجه نحو القدرات الأساسية
وفقًا لتقرير منشور على Mark Tech Post، قام فريق البحث بإنشاء قنوات بيانات منفصلة لكل قدرة رئيسية. تم استخراج خطط البحث الواقعية الخاصة بالتخطيط من التقارير الفنية، ووثائق المسح والتحليلات المالية، ثم تم تحديد المسارات التي تتبع هذه الخطط. بالنسبة للبحث المتعمق، أنشئت استعلامات مستندة إلى الرسوم البيانية من قواعد المعرفة مثل Wikidata5m وCN-DBpedia، مع التركيز على الأسئلة المعقدة التي تحتاج إلى استرجاع مستندات متعددة. تم إنتاج بيانات الانعكاس والتحقق من خلال استخدام حلقات التصحيح الذاتي وتتبعات الميزات متعددة العوامل، بينما تم تدريب إنتاج التقارير على مراحل مع التركيز على التنسيق الدقيق والاستشهادات. يتكون التدريب من ثلاث مراحل: تدريب أولي لتقديم القدرات الأساسية (ما يصل إلى 150 مليار رمز مع سياق 32 ألفًا) ثم 128 ألفًا، وضبط خاضع للإشراف لتثبيت مسارات البحث الكاملة، وأخيرًا التعلم المعزز باستخدام PPO ونماذج التقييم لتحسين التقارير بناءً على معايير محددة.
هندسة ReAct واحدة مع مكدس بحث مختار وذاكرة خارجية
خلال عملية التفكير، يتصرف النموذج كنظام ReAct واحد يتنقل بين أدوات التفكير والتذكر والملاحظات حتى يتخذ قرارًا بإصدار تقرير. تشمل الأدوات البحث الجماعي على الويب، ومدير المهام، وأوامر shell، وإدارة الملفات ضمن بيئة معزولة مع استمرار التشغيل. تستخدم مجموعة الأبحاث واجهة برمجة تطبيقات مخصصة تغطي أكثر من 20 مليون مقالة عالية الجودة و600 مقياس متميز، بالإضافة إلى درجة مرجعية لأكثر من 600 نطاق موثوق (حكومي، أكاديمي، ومؤسسي) لتفادي مشاكل السياق. كما تستخدم التخزين الذكي القائم على الملخص والتحرير الجزئي لتصحيح الملفات، مما يعمل كذاكرة خارجية فعالة للمشاريع الطويلة.
مقالات مشابهة
لا توجد مقالات أخرى
