تخطي إلى المحتوى

YOLO26 مقابل YOLOv7: مقارنة تقنية شاملة

شهد تطور الكشف عن الأجسام في الوقت الفعلي العديد من الإنجازات الهامة، مع Ultralytics و YOLOv7 يمثلان قفزتين مهمتين في قدرات الرؤية الحاسوبية. في حين YOLOv7 منهجية "bag-of-freebies" القوية التي أعادت تعريف معايير الدقة في عام 2022، فإن بنية YOLO26 التي تم إصدارها حديثًا رائدة في تحسينات الحافة أولاً، والمعالجة الأصلية من البداية إلى النهاية، وديناميكيات التدريب المستقرة المستوحاة من ابتكارات نموذج اللغة الكبيرة (LLM).

تقارن هذه الدراسة المتعمقة هاتين البنيتين، وتحلل مقاييس أدائهما، والاختلافات الهيكلية بينهما، وسيناريوهات النشر المثالية، لمساعدة مهندسي التعلم الآلي على اتخاذ قرارات مستنيرة بشأن مشروع الرؤية الاصطناعية التالي.

خلفية النموذج وتفاصيله

قبل دراسة بيانات الأداء، من المهم فهم أصول كل نموذج وأهدافه الأساسية.

Ultralytics YOLO26

المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
التاريخ: 2026-01-14
GitHub:مستودع Ultralytics
الوثائق:وثائق YOLO26

تعرف على المزيد حول YOLO26

YOLOv7

المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة:معهد علوم المعلومات، أكاديمية سينكا، تايوان
التاريخ: 2022-07-06
Arxiv:YOLOv7
GitHub:YOLOv7

تعرف على المزيد حول YOLOv7

نماذج بديلة يجب أخذها في الاعتبار

إذا كنت تستكشف النظام البيئي الأوسع نطاقًا، فقد تهمك أيضًا YOLO11 لعمليات النشر متعددة المهام عالية التوازن، أو RT-DETR للكشف القائم على التسلسل. لاحظ أن النماذج القديمة مثل YOLOv8 و YOLOv5 لا تزال مدعومة بالكامل على Ultralytics من أجل التكامل مع الأنظمة القديمة.

نظرة معمارية متعمقة

YOLOv7 الفلسفات المعمارية الكامنة وراء YOLO26 و YOLOv7 بشكل كبير، مما يعكس التحول من تعظيم GPU المتطور إلى التحسين من أجل نشر سلس وشامل على الحافة.

YOLO26: نموذج "الحافة أولاً"

تم إصدار YOLO26 في عام 2026، وهو يعيد التفكير بشكل جذري في خط أنابيب النشر. وأهم إنجازاته هو التصميم الشامل NMS. من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) ، يقلل YOLO26 بشكل كبير من تقلب زمن الاستجابة، وهو مفهوم تم تجربته بنجاح لأول مرة في YOLOv10. وهذا يضمن معدلات إطارات ثابتة حتى في المشاهد المكتظة بالسكان، وهو أمر بالغ الأهمية للروبوتات المستقلة ومراقبة حركة المرور.

علاوة على ذلك، يزيل YOLO26 تمامًا فقدان التركيز التوزيعي (DFL). تعمل إزالة DFL على تبسيط عملية التصدير إلى تنسيقات مثل ONNX و Apple CoreML، مما يحقق CPU أسرع بنسبة تصل إلى 43٪ CPU .

استقرار التدريب هو محور اهتمام رئيسي آخر. إن إدخال MuSGD Optimizer— وهو مزيج من التدرج العشوائي القياسي و Muon (مستوحى من ديناميكيات التدريب في Kimi K2) — يوفر استقرارًا متقدمًا في تدريب LLM للرؤية الحاسوبية. بالاقتران مع وظائف الخسارة ProgLoss + STAL، يتفوق YOLO26 في التعرف على الأجسام الصغيرة، وهو تحدٍ تاريخي لأجهزة الكشف في الوقت الفعلي.

YOLOv7: إتقان حقيبة الهدايا المجانية

YOLOv7 بناء YOLOv7 بناءً على دراسة شاملة لتحسين مسار التدرج. وتتمثل ابتكاره الأساسي في شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، التي تسمح للنموذج بتعلم ميزات أكثر تنوعًا دون تعطيل مسارات التدرج الأصلية.

تعتمد YOLOv7 أيضًا بشكل كبير على تقنيات إعادة المعلمات أثناء الاستدلال، حيث تقوم أساسًا بدمج الطبقات لزيادة السرعة دون التضحية بالتمثيلات الغنية للميزات التي تم تعلمها أثناء التدريب. على الرغم من قوتها على NVIDIA TensorRT الخادم القوية، إلا أن هذه الطريقة لا تزال تعتمد على رؤوس الكشف القائمة على المراسي و NMS التقليدية، مما قد يؤدي إلى حدوث احتكاك في النشر على الأجهزة منخفضة الطاقة.

مقارنة الأداء

يقدم الجدول أدناه مقارنة مباشرة بين النماذج التي تم تدريبها على COCO القياسية. يُظهر YOLO26 تحسينات كبيرة في الدقة (mAP) مع الحفاظ على توازن استثنائي بين المعلمات وعمليات FLOP.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

ملاحظة: يتفوق YOLO26x على YOLOv7x في mAP كبير (57.5 مقابل 53.1) بينما يتطلب ما يقرب من 22٪ أقل من المعلمات وعمليات FLOPs.

ميزة النظام البيئي لـ Ultralytics

السبب الرئيسي الذي يدفع المطورين إلى اختيار YOLO26 باستمرار هو تكامله العميق مع Ultralytics . على عكس البرامج النصية المستقلة المطلوبة للبنى القديمة، Ultralytics سير عمل سلس وموحد.

  1. سهولة الاستخدام: تتيح Python للمستخدمين تحميل النماذج وتدريبها ونشرها باستخدام بضع أسطر من التعليمات البرمجية فقط. ولا يتطلب التصدير إلى تنسيقات الأجهزة المحمولة مثل TensorFlow سوى تغيير حجة واحدة فقط.
  2. متطلبات الذاكرة: تم تصميم Ultralytics بدقة متناهية لضمان كفاءة التدريب. وهي تتطلب CUDA أقل بكثير مقارنة بنماذج محولات الرؤية الثقيلة، مما يتيح للباحثين تشغيل أحجام دفعات أكبر على الأجهزة الاستهلاكية.
  3. تعدد الاستخدامات: بينما YOLOv7 مستودعات مختلفة تمامًا لمهام مختلفة، يدعم YOLO26 بشكل أساسي تصنيف الصور وتقسيم الحالات وتقدير الوضع وكشف الصندوق المحيط الموجه (OBB) من مكتبة واحدة متماسكة. كما أنه يتضمن وظائف خسارة خاصة بالمهام، مثل تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لخطوط إنتاج وضع الإنسان.
  4. التطوير النشط: توفر مجتمع Ultralytics تحديثات متكررة، مما يضمن حل سريع للحالات الاستثنائية والتوافق المستمر مع أحدث إصدارات PyTorch .

تصدير مبسط

نظرًا لأن YOLO26 خالٍ NMS بشكل أساسي، فإن النشر على الأهداف المدمجة باستخدام Intel OpenVINO أو ONNX يلغي تمامًا الحاجة إلى البرامج النصية المعقدة للمعالجة اللاحقة.

حالات الاستخدام في العالم الحقيقي

تحدد الاختلافات المعمارية بين هذه النماذج سيناريوهات النشر المثالية لها.

متى تختار YOLO26

YOLO26 هو الخيار المثالي بلا منازع لأنظمة الرؤية الحاسوبية الحديثة والمتطورة.

  • Edge AI و IoT: بفضل CPU الأسرع بنسبة 43٪ وعدد المعلمات الخفيفة الوزن، يعد YOLO26n مثاليًا للأجهزة المقيدة مثل Raspberry Pi أو كاميرات المدن الذكية.
  • الصور الملتقطة بواسطة الطائرات بدون طيار والصور الجوية: يعمل تكامل ProgLoss + STAL على تحسين اكتشاف الأجسام الصغيرة بشكل كبير، مما يجعله الخيار الأول لفحص خطوط الأنابيب والزراعة الدقيقة.
  • الروبوتات متعددة المهام: نظرًا لأنها تتعامل بسهولة مع الصناديق المحددة وأقنعة التجزئة ونقاط المفتاح في نفس الوقت مع الحد الأدنى من استهلاك الذاكرة، فهي مناسبة للغاية للملاحة والتفاعل الديناميكي للروبوتات.

متى يجب التفكير في YOLOv7

على الرغم من أن YOLOv7 قد تم استبداله في الغالب بهياكل جديدة، إلا أنه YOLOv7 بفوائد محددة في مجالات متخصصة.

  • المقارنة الأكاديمية: غالبًا ما يستخدم الباحثون الذين يعملون على تطوير رؤوس كشف جديدة قائمة على المراسي أو يدرسون استراتيجيات مسار التدرج YOLOv7 أساسية قياسية على منصات مثل Papers With Code.
  • GPU القديمة: قد تؤخر الأنظمة المؤسسية التي تم تصميمها خصيصًا حول tensor المحددة YOLOv7 NMS المخصصة على مثيلات AWS EC2 P4d القوية عملية الترحيل إلى النماذج الأحدث حتى يصبح من الضروري إعادة هيكلة النظام بالكامل.

مثال على الكود: البدء

تسلط تجربة المطور الضوء على التباين الشديد بين مستودعات الأبحاث القياسية Ultralytics . يعد تدريب نموذج YOLO26 المخصص أمرًا بسيطًا للغاية:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

أفكار أخيرة

بينما YOLOv7 علامة فارقة مرموقة في تاريخ الكشف عن الكائنات في الوقت الفعلي، فإن الصناعة قد تحولت بقوة نحو النماذج التي تعطي الأولوية لبساطة النشر، وتعدد المهام، وكفاءة الحافة.

من خلال التخلص NMS وإدخال مُحسّن MuSGD، وتحسين سرعات CPU بشكل كبير، يُعد Ultralytics الخيار الأمثل للمطورين ومهندسي المؤسسات اليوم. إلى جانب Ultralytics القوي وسهل الاستخدام، فإنه يوفر توازنًا لا مثيل له بين السرعة والدقة ومتعة الهندسة.


تعليقات