تخطي إلى المحتوى

YOLO26 مقابل YOLOv7: قفزة جيلية في مجال الرؤية الحاسوبية

شهد مجال الكشف عن الأجسام تطوراً سريعاً خلال العقد الماضي، حيث كانت عائلة YOLO You Only Look Once) رائدة باستمرار في الأداء في الوقت الفعلي. وهناك معلمان هامان في هذا المجال هما YOLOv7، الذي تم إصداره في منتصف عام 2022، و YOLO26 المتطور، الذي تم إصداره في أوائل عام 2026. في حين YOLOv7 مفهوم "bag-of-freebies" لتحسين التدريب دون زيادة تكلفة الاستدلال، يمثل YOLO26 تحولًا جذريًا بفضل هندسته المعمارية الشاملة NMS وتصميمه CPU

يقدم هذا الدليل مقارنة تقنية مفصلة لمساعدة المطورين والباحثين والمهندسين على اختيار النموذج المناسب لاحتياجاتهم الخاصة في مجال النشر، سواء كانت تستهدف وحدات معالجة الرسومات (GPU) المتطورة أو الأجهزة الطرفية المحدودة الموارد.

نظرة عامة على النموذج ومؤلفه

فهم نسب هذه النماذج يساعد على وضع قراراتها المعمارية وحالات الاستخدام المقصودة في سياقها الصحيح.

YOLO26

YOLO26 هو أحدث إصدار من Ultralytics وهو مصمم لحل التحديات المستمرة المتمثلة في تعقيد النشر وزمن الاستجابة الطرفي. ويقدم خط أنابيب شامل (E2E) يلغي الحاجة إلى عدم القمع الأقصى (NMS)، مما يبسط بشكل كبير المسار من التدريب إلى الإنتاج.

  • المؤلفون: Glenn Jocher و Jing Qiu
  • المؤسسة:Ultralytics
  • التاريخ: 14 يناير 2026
  • الابتكار الرئيسي: الكشف الشامل NMS ومحسّن MuSGD، والتحسين CPU.

تعرف على المزيد حول YOLO26

YOLOv7

YOLOv7 كان إصدارًا بارزًا ركز على "حقيبة الهدايا المجانية" القابلة للتدريب — وهي طرق تحسين تعمل على تحسين الدقة أثناء التدريب دون إضافة تكلفة في وقت الاستدلال. وقد وضع معايير جديدة متطورة لأجهزة الكشف عن الأجسام في الوقت الفعلي في عام 2022.

  • المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
  • المؤسسة: معهد علوم المعلومات، أكاديميا سينيكا
  • التاريخ: 6 يوليو 2022
  • Arxiv:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art
  • الابتكار الرئيسي: إعادة تحديد معلمات E-ELAN وقياس المركبات.

تعرف على المزيد حول YOLOv7

مقارنة معمارية

YOLOv7 الاختلافات المعمارية بين YOLO26 و YOLOv7 نقاط قوتهما في السرعة والدقة وسهولة النشر.

YOLO26: الثورة الشاملة

يغير YOLO26 بشكل جذري مسار الكشف من خلال اعتماد تصميم شامل NMS. تنتج أجهزة الكشف التقليدية، بما في ذلك YOLOv7 آلاف المربعات المرشحة التي يجب تصفيتها باستخدام تقنية Non-Maximum Suppression (NMS). غالبًا ما تكون خطوة المعالجة اللاحقة هذه بطيئة وحساسة للمعلمات الفائقة ويصعب نشرها على أجهزة متخصصة مثل FPGA أو NPU.

يقضي YOLO26 على NMS من خلال تعلم المطابقة الفردية أثناء التدريب. وبالاقتران مع إزالة Distribution Focal Loss (DFL)، ينتج عن ذلك بنية نموذجية أسهل بكثير للتصدير إلى تنسيقات مثل ONNX أو TensorRT. بالإضافة إلى ذلك، يستخدم YOLO26 مُحسِّن MuSGD، وهو مزيج من SGD Muon (مستوحى من تدريب LLM)، مما يضمن تقاربًا مستقرًا حتى مع بنيته المبتكرة.

YOLOv7: حقيبة الهدايا المجانية و E-ELAN

YOLOv7 على كفاءة البنية من خلال شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). يتيح هذا التصميم للشبكة تعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسارات التدرج. يعتمد بشكل كبير على تقنيات إعادة المعلمات، حيث يتم تبسيط بنية التدريب المعقدة إلى بنية استدلال مبسطة. على الرغم من فعالية هذه الطريقة في GPU إلا أنها تحتفظ بالاعتماد على NMS مما قد يشكل عائقًا على CPU أو عندما تكون كثافة الكائنات عالية للغاية.

أهمية التخلص من NMS

في الأجهزة الطرفية، غالبًا ما يتعذر إجراء NMS بشكل متوازٍ بشكل فعال. من خلال إزالتها، يحقق YOLO26 استنتاجًا أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية مقارنةً بالسابقات القائمة على المراسي، مما يجعله خيارًا متميزًا لأجهزة Raspberry Pi والهواتف المحمولة وأجهزة استشعار إنترنت الأشياء.

مقاييس الأداء

يوضح الجدول أدناه تحسينات الأداء في YOLO26 مقارنةً بـ YOLOv7. في حين YOLOv7 منافسًا قويًا على وحدات معالجة الرسومات (GPU) المتطورة، فإن YOLO26 يتفوق في الكفاءة وحجم النموذج CPU .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

النقاط الرئيسية:

  • الكفاءة: يتفوق نموذج YOLO26l على YOLOv7l بمقدار +3.6 mAP مع استخدام معلمات أقل بنسبة 32٪ وعمليات FLOP أقل بنسبة 17٪.
  • السرعة: يوفر YOLO26n (Nano) نقطة دخول مذهلة لتقنية الذكاء الاصطناعي المتطورة، حيث يعمل بسرعة تقارب 40 مللي ثانية على CPU، وهو مقياس لا يمكن لهيكل YOLOv7 أن يضاهيه بسهولة بسبب NMS .
  • الدقة: في النهاية العالية، يصل YOLO26x إلى 57.5 mAP، وهو أعلى بكثير من 53.1 mAP في YOLOv7x.

حالات الاستخدام والتطبيقات

غالبًا ما يعتمد الاختيار بين هذه النماذج على بيئة النشر والمتطلبات المحددة للتطبيق.

متى تختار YOLO26

YOLO26 هو الخيار الموصى به لمعظم مشاريع الرؤية الحاسوبية الحديثة، خاصة تلك التي تعطي الأولوية لما يلي:

  • الحوسبة الطرفية: مع CPU أسرع بنسبة تصل إلى 43٪، فإنها تتفوق على أجهزة مثل Raspberry Pi أو NVIDIA Nano.
  • نشر مبسط: التصميم NMS يجعل التصدير إلى CoreML (iOS) أو TFLite Android) بسلاسة، مما يتجنب مشكلات الدعم الشائعة للمشغل.
  • كشف الأجسام الصغيرة: توفر وظائف الخسارة المحسنة ProgLoss + STAL مكاسب ملحوظة في كشف الأجسام الصغيرة، وهو أمر بالغ الأهمية لتحليل الصور الجوية وعمليات التفتيش بواسطة الطائرات بدون طيار.
  • مهام متنوعة: بالإضافة إلى الكشف، يدعم YOLO26 تقدير الوضع، وتجزئة الحالات، ومربعات الحدود الموجهة (OBB) بشكل أصلي.

متى يجب التفكير في YOLOv7

YOLOv7 مناسبًا للأنظمة القديمة أو معايير البحث المحددة التي تركز الدراسة فيها على منهجية "bag-of-freebies".

  • GPU القديمة: إذا كان النظام قد تم تحسينه بالفعل بشكل كبير لمخرجات YOLOv7 المحددة القائمة على المراسي YOLOv7 وحدات معالجة الرسومات (GPU) المتطورة (مثل V100 أو A100)، فقد يتأخر الترحيل.
  • البحوث الأكاديمية: غالبًا ما يستخدم الباحثون الذين يدرسون تأثيرات تحسين مسار التدرج وإعادة تحديد المعلمات YOLOv7 مرجعي.

ميزة النظام البيئي لـ Ultralytics

أحد الأسباب الأكثر إقناعًا لتبني YOLO26 هو تكامله العميق مع Ultralytics . على عكس المستودعات المستقلة، تستفيد Ultralytics من منصة موحدة ومُحكمة الصيانة.

  • سهولة الاستخدام: تعني فلسفة "من الصفر إلى البطل" أنه يمكنك الانتقال من التثبيت إلى التدريب في غضون دقائق. Python متسقة عبر الإصدارات، لذا فإن الترقية من YOLOv8 إلى YOLO26 يتطلب تغيير سلسلة واحدة فقط.
  • كفاءة التدريب: تم تحسين Ultralytics لتدريب أسرع واستخدام CUDA أقل من البدائل القائمة على المحولات (مثل RT-DETR). وهذا يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) الاستهلاكية.
  • Ultralytics : يمكن للمستخدمين الاستفادة من Ultralytics لتصور مجموعات البيانات وتدريب النماذج في السحابة ونشرها بنقرة واحدة.

مثال على الكود: التدريب والاستدلال

يوضح الكود التالي كيفية استخدام Ultralytics لتحميل وتدريب أحدث نموذج YOLO26. تعمل واجهة برمجة التطبيقات على تجريد الإعدادات المعقدة، مما يجعلها سهلة الاستخدام حتى للمبتدئين.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended for new projects)
# The 'n' suffix denotes the Nano version, optimized for speed.
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The system automatically handles dataset downloads and configuration.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
# The NMS-free output ensures fast and clean results.
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the results
predictions[0].show()

الخلاصة

في حين YOLOv7 لحظة محورية في تاريخ اكتشاف الكائنات، فإن YOLO26 يمثل المستقبل. لا تعمل بنيته الشاملة على تحسين مقاييس الأداء مثل mAP فحسب، بل إنها تبسط أيضًا بشكل أساسي سير عمل النشر للمطورين. من خلال إزالة الاعتماد على NMS الكبير لبيئات CPU Edge، يضمن YOLO26 أن تكون الرؤية الحاسوبية المتطورة متاحة وفعالة ومتعددة الاستخدامات بما يكفي للتطبيقات الواقعية التي تتراوح من المركبات ذاتية القيادة إلى تحليلات المدن الذكية.

للمهتمين باستكشاف هياكل معمارية حديثة أخرى، تغطي الوثائق أيضًا YOLO11 و YOLOv10، اللذين يقدمان مزايا مختلفة في التطور المستمر للذكاء الاصطناعي البصري.


تعليقات