YOLOv7 YOLO26: قفزة جيلية في الكشف عن الكائنات في الوقت الفعلي
تطور الرؤية الحاسوبية تميز بإنجازات مهمة، ومقارنة البنى القديمة بالنماذج الحديثة المتطورة توفر معلومات قيمة لمهندسي التعلم الآلي. هذه المقارنة التقنية تتعمق في الاختلافات بين النماذج المؤثرة للغاية YOLOv7 و Ultralytics الثورية، وتسلط الضوء على التطورات في البنية ومنهجيات التدريب وكفاءة النشر.
YOLOv7: رائد "حقيبة الهدايا المجانية"
تم طرح YOLOv7 في منتصف عام 2022، YOLOv7 نطاق الإمكانيات المتاحة على GPU من خلال إدخال العديد من التحسينات المعمارية التي عززت الدقة دون زيادة تكلفة الاستدلال.
تفاصيل النموذج
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المؤسسة:معهد علوم المعلومات، أكاديميا سينيكا
- التاريخ: 2022-07-06
- أرشيف:2207.02696
- GitHub:WongKinYiu/yolov7
- الوثائق:وثائق Ultralytics YOLOv7
YOLOv7 مفهوم "حقيبة الهدايا" القابلة للتدريب، والتي استخدمت بشكل مكثف تقنيات إعادة المعلمات وشبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). وقد سمح ذلك للنموذج بتعلم ميزات أكثر تنوعًا وتحسين قدرة الشبكة على التعلم باستمرار دون تدمير مسار التدرج الأصلي. وعلى الرغم من أنه حقق معيارًا مثيرًا للإعجاب على COCO في ذلك الوقت، إلا أن بنيته لا تزال تعتمد بشكل كبير على المخرجات القائمة على المراسي وتتطلب معالجة لاحقة معقدة لـ Non-Maximum Suppression (NMS) ، مما قد يؤدي إلى حدوث اختناقات في زمن الاستجابة أثناء النشر.
YOLO26: معيار الذكاء الاصطناعي للرؤية الذي يركز على الحافة
صدر Ultralytics في يناير 2026، وهو يمثل تحولًا جذريًا، حيث أعاد التفكير بشكل كامل في مسار الكشف لإعطاء الأولوية لسهولة النشر واستقرار التدريب وكفاءة الأجهزة.
تفاصيل النموذج
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:ultralytics/ultralytics
- المنصة:Ultralytics على المنصة
تم تصميم YOLO26 من الألف إلى الياء لحل التحديات الهندسية الحديثة. وتتميز بنيته بعدة ابتكارات مهمة تفوق بكثير سابقاتها:
- تصميم شامل NMS: يزيل YOLO26 NMS بشكل أصلي، وهو نهج ثوري تم ابتكاره لأول مرة في YOLOv10. وينتج عن ذلك خط أنابيب نشر أسرع وأبسط بكثير، مما يتجنب التأخير المتغير الذي يسببه عادةً ازدحام المشاهد.
- إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، يتم تبسيط النموذج بشكل جذري للتصدير، مما يوفر توافقًا أفضل بكثير مع الأجهزة الطرفية وأجهزة إنترنت الأشياء منخفضة الطاقة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : بفضل تبسيط البنية وتقليص الهيكل، تم تحسين YOLO26 خصيصًا للحوسبة الطرفية والأجهزة التي لا تحتوي على وحدات معالجة رسومات مخصصة، مما يجعلها تتفوق بسهولة على البنى القديمة في المعالجات القياسية.
- مُحسّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (على وجه التحديد Kimi K2 من Moonshot AI)، يستخدم YOLO26 مُحسّن MuSGD — وهو مزيج من Stochastic Gradient Descent و Muon. وهذا يوفر استقرارًا لا مثيل له في التدريب وتقاربًا أسرع بكثير لمهام الرؤية الحاسوبية.
- ProgLoss + STAL: أدى إدخال وظائف الخسارة المتقدمة هذه إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والروبوتات وفحص الجودة الآلي.
- تحسينات خاصة بالمهام: بالإضافة إلى الكشف القياسي عن الكائنات، يقدم YOLO26 خسارة بروتو متعددة المقاييس وخسارة تقسيم دلالية متخصصة لمهام التقسيم، وتقدير احتمالية السجل المتبقي (RLE) لتقدير الوضع، وخوارزميات خسارة الزاوية المتخصصة لحل مشكلات الحدود في المربعات المحددة الموجهة (OBB).
الانتقال إلى YOLO26
الترقية من بنية قديمة إلى YOLO26 بسيطة مثل تغيير سلسلة النموذج في Python الخاص بك إلى yolo26n.pt. تتولى Ultralytics عملية الانتقال بالكامل، بما في ذلك التنزيل التلقائي للوزن وتوسيع نطاق التكوين.
مقارنة الأداء والمقاييس
عند مقارنة البصمة الحاسوبية، يُظهر YOLO26 تفوقًا واضحًا في تحقيق التوازن بين الأداء ومتطلبات الذاكرة. غالبًا ما تتطلب النماذج القائمة على المحولات أو البنى القديمة الثقيلة تخصيصات هائلة CUDA ، ولكن YOLO26 يتدرب بكفاءة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
كما هو موضح أعلاه، فإن YOLO26m يحقق النموذج دقة مكافئة (53.1 mAP) للنموذج الضخم YOLOv7x، ولكنه يفعل ذلك باستخدام أقل من ثلث المعلمات (20.4 مليون مقابل 71.3 مليون) وأوقات استدلال سريعة بشكل لا يصدق عبر TensorRT.
ميزة النظام البيئي لـ Ultralytics
غالبًا ما ينطوي نشر النماذج القديمة على التعامل مع مستودعات طرف ثالث معقدة، ومشاكل التبعية، ونصوص التصدير اليدوية. على النقيض من ذلك، توفر Ultralytics نظامًا بيئيًا متماسكًا ومُحسنًا يعمل على تبسيط دورة حياة التعلم الآلي بأكملها.
- سهولة الاستخدام: بفضل Python سهلة الاستخدام والوثائق الشاملة، يمكنك إضافة تعليقات إلى النماذج وتدريبها ونشرها في غضون دقائق. التصدير إلى تنسيقات مثل ONNX أو CoreML يتطلب سطرًا واحدًا فقط من التعليمات البرمجية.
- متطلبات الذاكرة: تشتهر Ultralytics باستخدامها المنخفض للذاكرة. على عكس بعض محولات الرؤية الضخمة، يمكن ضبط YOLO26 بسهولة على الأجهزة القياسية دون التعرض لأخطاء نفاد الذاكرة (OOM).
- تعدد الاستخدامات: في حين أن YOLOv7 في الأساس أداة للكشف عن الأشياء (مع بعض الفروع التجريبية لمهام أخرى)، فإن YOLO26 هو إطار عمل موحد أصلاً يتعامل مع الكشف والتصنيف والتتبع والوضع و OBB بنفس الكفاءة.
Ultralytics الأخرى
في حين أن YOLO26 هو المعيار الموصى به، يمكن للمطورين الذين يقومون بترحيل الأنظمة القديمة استكشاف YOLO11، وهو جيل آخر عالي الأداء في Ultralytics يوفر استقرارًا ممتازًا لمشاريع الدعم طويلة الأجل.
مثال على الكود: التدريب والنشر
يوضح المثال التالي البساطة الأنيقة لـ ultralytics الحزمة. لاحظ مدى نظافة الواجهة مقارنة باستدعاء حجج سطر الأوامر الطويلة في النماذج القديمة.
from ultralytics import YOLO
# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # Efficient memory usage allows larger batch sizes
device=0,
)
# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")
حالات الاستخدام في العالم الحقيقي
يعتمد اختيار البنية المناسبة بشكل كامل على قيود الإنتاج الخاصة بك.
متى يجب التفكير في YOLOv7: YOLOv7 أداة قيّمة للمقارنة الأكاديمية مع معايير 2022. إذا كانت البنية التحتية الخاصة بك تستخدم CUDA قديمة عميقة مبرمجة بشكل ثابت لمخرجات مرساة YOLOv7 المحددة ولا يمكنك تخصيص موارد لإعادة الهيكلة، فستستمر في العمل ككاشف أساسي قوي.
متى تختار YOLO26: بالنسبة لأي مشروع جديد، YOLO26 هو الخيار الأمثل. بفضل بنيته NMS فهو مثالي للملاحة الذاتية منخفضة التأخير وأنظمة الأمان في الوقت الفعلي. إن إزالة DFL وزيادة CPU بشكل كبير تجعله البطل بلا منازع في عمليات نشر الذكاء الاصطناعي المتطورة، مثل النشر على Raspberry Pi أو داخل الأجهزة الإلكترونية الاستهلاكية. علاوة على ذلك، فإن تحسينات ProgLoss + STAL تجعله بارعًا للغاية في اكتشاف الانحرافات الصغيرة في ضمان جودة التصنيع أو التصوير بالأقمار الصناعية.
في النهاية، يوفر YOLO26 للمطورين مزيجًا لا مثيل له من الدقة والسرعة والبساطة، مدعومًا بالدعم الشامل من مجتمع المصادر المفتوحة.