تخطي إلى المحتوى

YOLOv7 مقابل YOLO26: تطور اكتشاف الكائنات في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية بسرعة، حيث يدفع كل جيل جديد من النماذج حدود ما هو ممكن في التحليل في الوقت الفعلي. تستكشف هذه المقارنة الشاملة الفروقات بين YOLOv7 القديم وYOLO26 الحديث، محللةً بنياتهما المعمارية ومقاييس أدائهما وسيناريوهات النشر المثالية لكل منهما. بينما مثل YOLOv7 إنجازاً هاماً في عام 2022، يقدم YOLO26 ابتكارات رائدة مثل المعالجة الشاملة واستراتيجيات التحسين المستمدة من تدريب نماذج اللغة الكبيرة (LLM).

نظرة عامة على النموذج

YOLOv7

صدر YOLOv7 في يوليو 2022، وقدم مفهوم "مجموعة الميزات المجانية القابلة للتدريب"، مما أدى إلى تحسين عملية التدريب لزيادة الدقة دون زيادة تكاليف الاستدلال. ركز بشكل كبير على الإصلاحات المعمارية مثل شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN) وتقنيات قياس النموذج.

المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
المنظمة:معهد علوم المعلومات، أكاديمية سينيكا، تايوان
التاريخ: 2022-07-06
أركايف:2207.02696
جيت هاب:WongKinYiu/yolov7

Ultralytics YOLO26

يمثل YOLO26، الذي صدر في أوائل عام 2026، تحولاً نموذجياً في سلالة YOLO. لقد صُمم لتحقيق أقصى قدر من الكفاءة على الأجهزة الطرفية ونشر مبسط. تشمل الابتكارات الرئيسية تصميماً أصيلاً شاملاً خالياً من NMS، مما يلغي الحاجة إلى معالجة لاحقة معقدة، وإزالة خسارة التركيز التوزيعي (DFL) لتبسيط قابلية التصدير.

المؤلفون: Glenn Jocher and Jing Qiu
المنظمة:Ultralytics
التاريخ: 2026-01-14
الوثائق:Ultralytics YOLO26
جيت هاب:ultralytics/ultralytics

تعرف على المزيد حول YOLO26

مقارنة فنية

يسلط الجدول التالي الضوء على قفزة الأداء من YOLOv7 إلى YOLO26. بينما وضع YOLOv7 معايير في وقته، يقدم YOLO26 سرعة وكفاءة فائقتين، لا سيما للاستدلال المعتمد على CPU.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

تحليل الأداء

يتجاوز YOLO26l دقة YOLOv7x الأثقل بكثير (55.0 مقابل 53.1 mAP) بينما يستخدم عدداً أقل بكثير من المعاملات (24.8 مليون مقابل 71.3 مليون) وFLOPs (86.4 مليار مقابل 189.9 مليار). هذه الكفاءة تجعل YOLO26 مثالياً للبيئات محدودة الموارد حيث يكون تحسين النموذج أمراً بالغ الأهمية.

الاختلافات المعمارية

هندسة YOLOv7 المعمارية

تعتمد بنية YOLOv7 على E-ELAN (شبكة تجميع الطبقات الفعالة الموسعة)، والتي تسمح للشبكة بتعلم ميزات أكثر تنوعاً عن طريق التحكم في أقصر وأطول مسارات التدرج. كما تستخدم قياس النموذج للنماذج القائمة على التسلسل، مع تعديل عمق وعرض الشبكة في وقت واحد. ومع ذلك، لا يزال YOLOv7 يعتمد على رؤوس الكشف القائمة على المراسي ويتطلب Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة لتصفية مربعات الإحاطة المكررة. يمكن أن تكون خطوة NMS هذه عنق زجاجة في النشر، وغالباً ما تتطلب تطبيقاً مخصصاً لواجهات خلفية مختلفة للأجهزة مثل TensorRT أو CoreML.

هندسة YOLO26 المعمارية

يقدم YOLO26 العديد من التغييرات الجذرية المصممة لتبسيط تجربة المستخدم وتعزيز الأداء:

  • شامل خالٍ من NMS: من خلال اعتماد بنية شاملة أصيلة (رائدة في YOLOv10)، يلغي YOLO26 الحاجة إلى NMS. يخرج النموذج الكشوفات النهائية مباشرة، مما يقلل من زمن الاستجابة ويبسط مسارات النشر بشكل كبير.
  • إزالة DFL: تعمل إزالة خسارة التركيز التوزيعي على تبسيط رأس الإخراج، مما يجعل النموذج أكثر توافقاً مع الأجهزة الطرفية وتنسيقات الدقة المنخفضة مثل INT8.
  • مُحسِّن MuSGD: مستوحى من الابتكارات في تدريب نماذج اللغة الكبيرة (LLMs) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّن MuSGD هجيناً. يجمع هذا بين زخم SGD والخصائص التكيفية لمُحسِّن Muon، مما يؤدي إلى تدريب أكثر استقراراً وتقارب أسرع.
  • تحسين الكائنات الصغيرة: يعالج دمج موازنة الخسارة التدريجية (ProgLoss) وتخصيص التسميات الواعي للأهداف الصغيرة (STAL) بشكل مباشر التحديات الشائعة في اكتشاف الكائنات الصغيرة، مما يجعل YOLO26 فعالاً بشكل خاص للصور الجوية وتطبيقات إنترنت الأشياء.

التدريب وسهولة الاستخدام

سهولة الاستخدام

إحدى السمات المميزة لـ نظام Ultralytics البيئي هي إمكانية الوصول. بينما يتطلب YOLOv7 استنساخ مستودع محدد وإدارة ملفات تكوين معقدة، فإن YOLO26 مدمج مباشرة في ultralytics حزمة python. يوفر هذا واجهة برمجة تطبيقات موحدة للتدريب والتحقق والنشر.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100)

تعدد الاستخدامات

يركز YOLOv7 بشكل أساسي على اكتشاف الكائنات وتقدير الوضعية. في المقابل، يقدم YOLO26 إطار عمل موحداً يدعم مجموعة أوسع من مهام الرؤية الحاسوبية، بما في ذلك:

  • تجزئة الكائنات: مع خسائر متخصصة للإخفاء الدقيق.
  • تقدير الوضعية: باستخدام تقدير لوغاريتم الاحتمالية المتبقية (RLE) للنقاط المفتاحية الدقيقة.
  • مربعات الإحاطة الموجهة (OBB): تتميز بخسارة زاوية متخصصة للكائنات المدورة.
  • التصنيف: لتصنيف فعال للصور.

كفاءة التدريب

عملية تدريب YOLO26 محسّنة للغاية. يسمح مُحسِّن MuSGD بتقارب أسرع، مما يعني أن المستخدمين غالباً ما يمكنهم تحقيق نتائج أفضل في عدد أقل من الحقب مقارنة بالمُحسِّنات القديمة. علاوة على ذلك، تسمح بصمة الذاكرة الأقل لنماذج YOLO26 بأحجام دفعات أكبر على نفس الأجهزة، مما يزيد من تسريع دورة التدريب. هذه ميزة كبيرة على النماذج القائمة على المحولات، والتي تتطلب عادةً ذاكرة CUDA كبيرة.

تطبيقات عملية في أرض الواقع

مجالات تفوق YOLOv7

يبقى YOLOv7 نموذجاً قادراً للباحثين المهتمين بالخصائص المعمارية المحددة لشبكات ELAN أو أولئك الذين يديرون أنظمة قديمة مبنية حول بنية Darknet. وهو بمثابة معيار ممتاز للمقارنة الأكاديمية.

أين يتفوق YOLO26

يُعد YOLO26 الخيار الموصى به لمعظم التطبيقات الحديثة نظرًا لـتوازن أدائه وسهولة نشره:

  • الحوسبة الطرفية: مع استدلال أسرع بنسبة تصل إلى 43% على CPU، يُعد YOLO26 مثاليًا للتشغيل على Raspberry Pi، أو الأجهزة المحمولة، أو الخوادم المحلية بدون وحدات GPU مخصصة.
  • الروبوتات والأنظمة المستقلة: يقلل التصميم الشامل من تقلبات زمن الاستجابة، وهو أمر بالغ الأهمية لاتخاذ القرارات في الوقت الفعلي في الروبوتات. يساعد تحسين اكتشاف الأجسام الصغيرة (عبر STAL) في الملاحة وتجنب العوائق.
  • النشر التجاري: يسهل إزالة NMS وDFL عملية التصدير إلى تنسيقات مثل ONNX وTensorRT وCoreML، مما يضمن سلوكًا متسقًا عبر بيئات النشر المختلفة.
  • المراقبة الزراعية: الدقة العالية في اكتشاف الأجسام الصغيرة تجعل YOLO26 ممتازًا لمهام مثل تحديد الآفات أو عد المحاصيل من صور الطائرات بدون طيار.

الترحيل من YOLOv7

سيجد المستخدمون الذين يرحّلون من YOLOv7 إلى YOLO26 أن الانتقال سلس بفضل واجهة Ultralytics API. عادةً ما تبرر التحسينات الهائلة في السرعة وسهولة التصدير الترقية لأنظمة الإنتاج. بالنسبة لأولئك الذين يبحثون عن بدائل حديثة أخرى، يُعد YOLO11 خيارًا قويًا آخر مدعومًا بالكامل من قبل نظام Ultralytics البيئي.

الخلاصة

بينما كان YOLOv7 مساهمة كبيرة في مجتمع المصادر المفتوحة، يمثل YOLO26 مستقبل الرؤية الحاسوبية الفعالة. من خلال معالجة الاختناقات الحرجة مثل NMS والاستفادة من تقنيات التحسين الحديثة من عالم LLM، يقدم YOLO26 نموذجًا ليس أسرع وأخف وزنًا فحسب، بل هو أيضًا أسهل بكثير في التدريب والنشر.

للمطورين الذين يبحثون عن حل موثوق به، جيد الصيانة، ومتعدد الاستخدامات، يُعد YOLO26 الخيار الأفضل. يضمن دمجه في نظام Ultralytics البيئي الوصول إلى تحديثات مستمرة، ووثائق شاملة، ومجتمع دعم مزدهر.

تعرف على المزيد حول YOLO26


تعليقات