Link to this sectionمقارنة بين YOLOv10 وYOLO26#
شهد مجال الرؤية الحاسوبية تطورات ملحوظة في السنوات الأخيرة، حيث انتقل من بنيات معقدة تعتمد بكثافة على المعالجة اللاحقة إلى نماذج انسيابية شاملة. تتعمق هذه المقارنة التقنية في علامتين فارقتين في هذه المسيرة: الاختراق الأكاديمي المتمثل في YOLOv10 وYOLO26 المتطور والجاهز للاستخدام المؤسسي. من خلال فحص بنياتهما ومنهجيات التدريب وقدرات النشر في العالم الحقيقي، يمكن للمطورين اتخاذ قرارات مستنيرة عند بناء تطبيقهم التالي في مجال رؤية الذكاء الاصطناعي.
Link to this sectionYOLOv10: ريادة الكشف عن الكائنات بشكل شامل#
المؤلفون: Ao Wang, Hui Chen, Lihao Liu, وآخرون. الجهة: جامعة تسينغهوا التاريخ: 2024-05-23 الروابط: ورقة arXiv | مستودع GitHub
مثّل YOLOv10، الذي أُطلق في منتصف عام 2024، قفزة نوعية في أبحاث الرؤية الحاسوبية الأكاديمية من خلال معالجة واحدة من أكثر الاختناقات استمراراً في الكشف عن الكائنات في الوقت الفعلي: قمع غير الحد الأقصى (NMS). اعتمدت كاشفات الكائنات التقليدية بشكل كبير على NMS لتصفية مربعات الإحاطة الزائدة، مما أضاف زمن وصول متغيراً أثناء الاستدلال وعقد عملية النشر على الحافة.
قدم فريق جامعة تسينغهوا استراتيجية تعيين مزدوجة متسقة للتدريب بدون NMS. سمح هذا للنموذج بالتنبؤ بمربعات الإحاطة بدقة دون الحاجة إلى خطوة تصفية لاحقة، مما أدى إلى تحسين زمن وصول الاستدلال مباشرة وتقليل حاجز النشر على مسرعات الأجهزة. وعلى الرغم من كفاءته العالية في مهام الكشف القياسية، ركز النموذج بشكل أساسي على التنبؤ بمربعات الإحاطة وافتقر إلى الدعم الأصلي لمهام أكثر تعقيداً مثل تجزئة المثيلات أو تقدير الوضعية.
Link to this sectionYOLO26: المعيار الجديد لرؤية الذكاء الاصطناعي على الحافة والسحابة#
المؤلفون: Glenn Jocher و Jing Qiu الجهة: Ultralytics التاريخ: 2026-01-14 الروابط: مستودع GitHub | منصة Ultralytics
بناءً على مفاهيم العمل بدون NMS التي تم ريادتها سابقاً، يمثل YOLO26 الذي تم إطلاقه حديثاً ذروة الأداء وتعدد الاستخدامات. تم تصميمه ليناسب كلاً من الأبحاث الأكاديمية والنشر على مستوى المؤسسات، حيث يدمج بشكل أصلي تصميماً شاملاً بدون NMS، مما يلغي تماماً المعالجة اللاحقة لـ NMS لنشر أسرع وأبسط عبر جميع الأجهزة المدعومة.
يقدم YOLO26 العديد من التحسينات البنيوية الرائدة. إن إزالة خسارة التوزيع البؤري (DFL) تبسط عملية تصدير النموذج بشكل كبير وتعزز التوافق مع أجهزة الحافة منخفضة الطاقة. إلى جانب هذه التغييرات الهيكلية، يحقق YOLO26 استدلالاً أسرع لوحدة المعالجة المركزية بنسبة تصل إلى 43%، مما يجعله خياراً استثنائياً لتطبيقات إنترنت الأشياء والروبوتات حيث قد لا يتوفر تسريع GPU.
علاوة على ذلك، أحدث استخدام محسّن MuSGD، وهو مزيج هجين من SGD و Muon مستوحى من تقنيات تدريب LLM، ثورة في استقرار التدريب وسرعة التقارب. وبالاقتران مع وظائف الخسارة المتقدمة مثل ProgLoss + STAL، يتميز YOLO26 بتحسينات ملحوظة في التعرف على الكائنات الصغيرة. كما يقدم تحسينات خاصة بالمهام، بما في ذلك النماذج الأولية متعددة المقاييس للتجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية، وخسارة زاوية متخصصة لحل مشاكل الحدود في الكشف عن مربعات الإحاطة الموجهة (OBB).
بالنسبة للفرق التي تتطلع إلى توسيع نطاق سير عمل الرؤية الحاسوبية لديها، توفر منصة Ultralytics تكاملاً سلساً مع YOLO26، حيث توفر تعليقات توضيحية بديهية للبيانات، وتدريباً آلياً على السحابة، وخيارات نشر بضغطة زر واحدة دون الحاجة إلى بنية تحتية واسعة لـ MLOps.
Link to this sectionمقارنة الأداء التقني#
عند تقييم هذه النماذج، يعد التوازن بين الدقة وحجم النموذج وسرعة الاستدلال أمراً بالغ الأهمية. يسلط الجدول أدناه الضوء على أداء كلتا عائلتي النماذج عبر مختلف المقاييس، بناءً على التقييم باستخدام مجموعة بيانات COCO.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
توضح البيانات بوضوح الميزة التطورية للبنية الأحدث. يحقق YOLO26 mAP (متوسط دقة المتوسط) أعلى عبر جميع فئات الحجم مع الحفاظ على سرعات استدلال تنافسية للغاية. تساهم إزالة DFL في YOLO26 بشكل خاص في أداء ONNX المتميز على وحدة المعالجة المركزية، وهو مقياس كانت الأجيال السابقة تعاني فيه غالباً.
Link to this sectionمنهجيات التدريب والنظام البيئي#
النموذج مفيد بقدر النظام البيئي الذي يدعمه. على الرغم من أن YOLOv10 قدم تنفيذاً أكاديمياً ممتازاً قائماً على PyTorch، إلا أنه يتطلب غالباً تكويناً يدوياً للمهام التي تتجاوز الكشف الأساسي.
في المقابل، تم دمج YOLO26 بالكامل في نظام Ultralytics البيئي الذي يتم صيانته جيداً. يضمن ذلك متطلبات ذاكرة أقل بكثير أثناء التدريب مقارنة بالنماذج القائمة على المحولات مثل RT-DETR، مما يسمح للباحثين بتدريب شبكات متطورة على أجهزة المستهلكين. سهولة الاستخدام لا مثيل لها، حيث توفر واجهة برمجة تطبيقات موحدة تتعامل مع زيادة البيانات، وضبط المعلمات الفائقة، والتسجيل تلقائياً.
Link to this sectionمثال كودي: تدريب YOLO26#
يتطلب تدريب نموذج متعدد الاستخدامات وعالي الدقة بضعة أسطر فقط من كود Python:
from ultralytics import YOLO
# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with automatic memory management
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
)
# Export natively to TensorRT without NMS complexities
model.export(format="engine")Link to this sectionتطبيقات وحالات استخدام في العالم الحقيقي#
يعتمد اختيار البنية الصحيحة بالكامل على قيود النشر.
Link to this sectionحوسبة الحافة عالية السرعة#
بالنسبة للتطبيقات التي تتطلب نشراً سريعاً على المتحكمات الدقيقة أو الروبوتات أو الأجهزة المحمولة القديمة، فإن استدلال وحدة المعالجة المركزية الأسرع بنسبة 43% في YOLO26 يجعله الخيار الأمثل. تتحول بنيته الخالية من NMS وDFL بسلاسة إلى تنسيقات مثل OpenVINO وTensorRT، وهي مثالية لتحليلات الفيديو في الوقت الفعلي في البنية التحتية للمدن الذكية.
Link to this sectionالرؤية المتقدمة متعددة المهام#
بينما يتفوق YOLOv10 في الكشف عن مربعات الإحاطة البحتة، يجب أن تعتمد المشاريع التي تتطلب فهماً بصرياً غنياً على YOLO26. من تجزئة المثيلات في التصوير الطبي إلى تقدير الوضعية الدقيق لتحليلات الرياضة، يوفر YOLO26 وظائف خسارة خاصة بالمهام تضمن دقة فائقة عبر مجالات متنوعة.
إذا كان مشروعك يتطلب كشفاً قوياً مفتوح المفردات، ففكر في استكشاف YOLO-World. بالنسبة للمستخدمين الذين يحتفظون بخطوط أنابيب قديمة، يظل YOLO11 بديلاً قوياً ومدعوماً بالكامل ضمن إطار عمل Ultralytics.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين YOLOv10 وYOLO26 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
Link to this sectionمتى تختار YOLOv10#
يعد YOLOv10 خياراً قوياً لـ:
- الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
- الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
- تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.
Link to this sectionمتى تختار YOLO26#
يوصى بـ YOLO26 لـ:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionالخلاصة#
يسلط الانتقال من YOLOv10 إلى YOLO26 الضوء على تحول حاسم من إثبات المفهوم الأكاديمي إلى حلول مؤسسية جاهزة للإنتاج. من خلال تبني التصميم الرائد الخالي من NMS وتعزيزه بمحسّن MuSGD وProgLoss وتوافق الحافة المبسط، يضع YOLO26 معياراً جديداً لما هو ممكن في الرؤية الحاسوبية في الوقت الفعلي. بالنسبة للمطورين الذين يهدفون إلى تحقيق أفضل توازن بين السرعة والدقة وسهولة الاستخدام، يبرز YOLO26 كتوصية نهائية.