تخطي إلى المحتوى

YOLO26 مقابل YOLOv7: مقارنة تقنية شاملة

شهد تطور الكشف عن الأجسام في الوقت الفعلي العديد من الإنجازات الهامة، مع Ultralytics و YOLOv7 يمثلان قفزتين مهمتين في قدرات الرؤية الحاسوبية. في حين YOLOv7 منهجية "bag-of-freebies" القوية التي أعادت تعريف معايير الدقة في عام 2022، فإن بنية YOLO26 التي تم إصدارها حديثًا رائدة في تحسينات الحافة أولاً، والمعالجة الأصلية من البداية إلى النهاية، وديناميكيات التدريب المستقرة المستوحاة من ابتكارات نموذج اللغة الكبيرة (LLM).

تقارن هذه الدراسة المتعمقة هاتين البنيتين، وتحلل مقاييس أدائهما، والاختلافات الهيكلية بينهما، وسيناريوهات النشر المثالية، لمساعدة مهندسي التعلم الآلي على اتخاذ قرارات مستنيرة بشأن مشروع الرؤية الاصطناعية التالي.

خلفية النموذج وتفاصيله

قبل فحص بيانات الأداء، من المهم فهم أصول كل نموذج وأهدافه الأساسية.

Ultralytics YOLO26

المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
التاريخ: 2026-01-14
GitHub:مستودع Ultralytics
الوثائق:وثائق YOLO26

تعرف على المزيد حول YOLO26

YOLOv7

المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, و Hong-Yuan Mark Liao
المنظمة:معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv:ورقة YOLOv7 البحثية
GitHub:مستودع YOLOv7

تعرف على المزيد حول YOLOv7

نماذج بديلة للنظر فيها

إذا كنت تستكشف النظام البيئي الأوسع نطاقًا، فقد تهمك أيضًا YOLO11 لعمليات النشر متعددة المهام عالية التوازن، أو RT-DETR للكشف القائم على التسلسل. لاحظ أن النماذج القديمة مثل YOLOv8 و YOLOv5 لا تزال مدعومة بالكامل على Ultralytics من أجل التكامل مع الأنظمة القديمة.

نظرة معمارية متعمقة

YOLOv7 الفلسفات المعمارية الكامنة وراء YOLO26 و YOLOv7 بشكل كبير، مما يعكس التحول من تعظيم GPU المتطور إلى التحسين من أجل نشر سلس وشامل على الحافة.

YOLO26: نموذج "الحافة أولاً"

تم إصدار YOLO26 في عام 2026، وهو يعيد التفكير بشكل جذري في خط أنابيب النشر. وأهم إنجازاته هو التصميم الشامل NMS. من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) ، يقلل YOLO26 بشكل كبير من تقلب زمن الاستجابة، وهو مفهوم تم تجربته بنجاح لأول مرة في YOLOv10. وهذا يضمن معدلات إطارات ثابتة حتى في المشاهد المكتظة بالسكان، وهو أمر بالغ الأهمية للروبوتات المستقلة ومراقبة حركة المرور.

علاوة على ذلك، يزيل YOLO26 تمامًا فقدان التركيز التوزيعي (DFL). تعمل إزالة DFL على تبسيط عملية التصدير إلى تنسيقات مثل ONNX و Apple CoreML، مما يحقق CPU أسرع بنسبة تصل إلى 43٪ CPU .

استقرار التدريب هو محور اهتمام رئيسي آخر. إن إدخال MuSGD Optimizer— وهو مزيج من التدرج العشوائي القياسي و Muon (مستوحى من ديناميكيات التدريب في Kimi K2) — يوفر استقرارًا متقدمًا في تدريب LLM للرؤية الحاسوبية. بالاقتران مع وظائف الخسارة ProgLoss + STAL، يتفوق YOLO26 في التعرف على الأجسام الصغيرة، وهو تحدٍ تاريخي لأجهزة الكشف في الوقت الفعلي.

YOLOv7: إتقان حقيبة الهدايا المجانية

YOLOv7 بناء YOLOv7 بناءً على دراسة شاملة لتحسين مسار التدرج. وتتمثل ابتكاره الأساسي في شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، التي تسمح للنموذج بتعلم ميزات أكثر تنوعًا دون تعطيل مسارات التدرج الأصلية.

تعتمد YOLOv7 أيضًا بشكل كبير على تقنيات إعادة المعلمات أثناء الاستدلال، حيث تقوم أساسًا بدمج الطبقات لزيادة السرعة دون التضحية بالتمثيلات الغنية للميزات التي تم تعلمها أثناء التدريب. على الرغم من قوتها على NVIDIA TensorRT الخادم القوية، إلا أن هذه الطريقة لا تزال تعتمد على رؤوس الكشف القائمة على المراسي و NMS التقليدية، مما قد يؤدي إلى حدوث احتكاك في النشر على الأجهزة منخفضة الطاقة.

مقارنة الأداء

يقدم الجدول أدناه مقارنة مباشرة بين النماذج التي تم تدريبها على COCO القياسية. يُظهر YOLO26 تحسينات كبيرة في الدقة (mAP) مع الحفاظ على توازن استثنائي بين المعلمات وعمليات FLOP.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

ملاحظة: يتفوق YOLO26x على YOLOv7x في mAP كبير (57.5 مقابل 53.1) بينما يتطلب ما يقرب من 22٪ أقل من المعلمات وعمليات FLOPs.

ميزة النظام البيئي لـ Ultralytics

أحد الأسباب الرئيسية التي تجعل المطورين يختارون YOLO26 باستمرار هو تكامله العميق مع منصة Ultralytics. على عكس البرامج النصية المستقلة المطلوبة للبنيات المعمارية القديمة، توفر Ultralytics سير عمل سلسًا وموحدًا.

  1. سهولة الاستخدام: تتيح واجهة برمجة تطبيقات Python للمستخدمين تحميل وتدريب ونشر النماذج في بضعة أسطر فقط من التعليمات البرمجية. يتطلب التصدير إلى تنسيقات الجوال مثل TensorFlow Lite مجرد تغيير وسيطة واحدة.
  2. متطلبات الذاكرة: تم تصميم نماذج Ultralytics بدقة لتحقيق كفاءة التدريب. فهي تتطلب ذاكرة CUDA أقل بكثير مقارنة بنماذج المحولات الرؤيوية (vision transformer) الثقيلة، مما يسمح للباحثين بتشغيل أحجام دفعات أكبر على الأجهزة الاستهلاكية.
  3. تعدد الاستخدامات: بينما يتطلب YOLOv7 مستودعات مختلفة تمامًا لمهام مختلفة، يدعم YOLO26 بشكل أصلي تصنيف الصور، تجزئة الكائنات، تقدير الوضعيات، واكتشاف الصناديق المحيطة الموجهة (OBB) من مكتبة واحدة متماسكة. بل ويشمل دوال خسارة خاصة بالمهام، مثل تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لخطوط أنابيب وضعيات الإنسان.
  4. تطوير نشط: يوفر مجتمع Ultralytics مفتوح المصدر تحديثات متكررة، مما يضمن حلًا سريعًا للحالات الهامشية وتوافقًا مستمرًا مع أحدث إصدارات PyTorch.

تصدير مبسط

نظرًا لأن YOLO26 خالٍ من NMS بشكل أصلي، فإن النشر على الأهداف المضمنة باستخدام Intel OpenVINO أو ONNX Runtime يلغي تمامًا البرامج النصية المعقدة للمعالجة اللاحقة.

حالات الاستخدام في العالم الحقيقي

تحدد الاختلافات المعمارية بين هذه النماذج سيناريوهات النشر المثالية لها.

متى تختار YOLO26

YOLO26 هو الخيار المثالي بلا منازع لأنظمة الرؤية الحاسوبية الحديثة والمتطورة.

  • الذكاء الاصطناعي الحافة وإنترنت الأشياء: بفضل استدلاله الأسرع بنسبة 43% على CPU وعدد المعلمات الخفيف، يُعد YOLO26n مثاليًا للأجهزة المقيدة مثل Raspberry Pi أو كاميرات المدن الذكية.
  • صور الطائرات بدون طيار والجوية: يحسن دمج ProgLoss + STAL بشكل كبير اكتشاف الأجسام الصغيرة، مما يجعله الخيار الأول لفحص خطوط الأنابيب والزراعة الدقيقة.
  • الروبوتات متعددة المهام: نظرًا لقدرته على التعامل بسهولة مع الصناديق المحيطة وأقنعة الـsegmentation والنقاط الرئيسية للوضعية في وقت واحد وبحد أدنى من الحمل الزائد للذاكرة، فإنه مناسب للغاية للملاحة والتفاعل الروبوتي الديناميكي.

متى يجب التفكير في YOLOv7

على الرغم من أن YOLOv7 قد تم استبداله في الغالب بهياكل جديدة، إلا أنه YOLOv7 بفوائد محددة في مجالات متخصصة.

  • المقارنة المعيارية الأكاديمية: غالبًا ما يستخدم الباحثون الذين يطورون رؤوس كشف جديدة تعتمد على نقاط الارتكاز أو يدرسون استراتيجيات مسار التدرج YOLOv7 كخط أساس قياسي للمقارنة على منصات مثل Papers With Code.
  • مسارات عمل GPU القديمة: قد تؤخر أنظمة المؤسسات التي تم بناؤها خصيصًا حول مخرجات tensor الخاصة بـ YOLOv7 وتكوينات NMS المخصصة على مثيلات AWS EC2 P4d القوية الترحيل إلى نماذج أحدث حتى يصبح إعادة هيكلة النظام بالكامل ضروريًا.

مثال برمجي: الشروع في العمل

تسلط تجربة المطور الضوء على التباين الشديد بين مستودعات الأبحاث القياسية Ultralytics . يعد تدريب نموذج YOLO26 المخصص أمرًا بسيطًا للغاية:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

أفكار أخيرة

بينما YOLOv7 علامة فارقة مرموقة في تاريخ الكشف عن الكائنات في الوقت الفعلي، فإن الصناعة قد تحولت بقوة نحو النماذج التي تعطي الأولوية لبساطة النشر، وتعدد المهام، وكفاءة الحافة.

من خلال إلغاء NMS، وتقديم مُحسِّن MuSGD، وتحسين سرعات استدلال CPU بشكل كبير، تقف Ultralytics YOLO26 كخيار حاسم للمطورين ومهندسي الشركات اليوم. مقترنة بالنظام البيئي القوي وسهل الاستخدام لـ Ultralytics، فإنها توفر توازنًا لا مثيل له بين السرعة والدقة ومتعة الهندسة.


تعليقات