YOLOv7 YOLO26: قفزة جيلية في الكشف عن الكائنات في الوقت الفعلي
تطور الرؤية الحاسوبية تميز بإنجازات مهمة، ومقارنة البنى القديمة بالنماذج الحديثة المتطورة توفر معلومات قيمة لمهندسي التعلم الآلي. هذه المقارنة التقنية تتعمق في الاختلافات بين النماذج المؤثرة للغاية YOLOv7 و Ultralytics الثورية، وتسلط الضوء على التطورات في البنية ومنهجيات التدريب وكفاءة النشر.
YOLOv7: رائد "حقيبة الهدايا المجانية"
تم طرح YOLOv7 في منتصف عام 2022، YOLOv7 نطاق الإمكانيات المتاحة على GPU من خلال إدخال العديد من التحسينات المعمارية التي عززت الدقة دون زيادة تكلفة الاستدلال.
تفاصيل النموذج
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المؤسسة:معهد علوم المعلومات، أكاديميا سينيكا
- التاريخ: 2022-07-06
- أرشيف:2207.02696
- GitHub:WongKinYiu/yolov7
- الوثائق:وثائق Ultralytics YOLOv7
YOLOv7 مفهوم "حقيبة الهدايا" القابلة للتدريب، والتي استخدمت بشكل مكثف تقنيات إعادة المعلمات وشبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). وقد سمح ذلك للنموذج بتعلم ميزات أكثر تنوعًا وتحسين قدرة الشبكة على التعلم باستمرار دون تدمير مسار التدرج الأصلي. وعلى الرغم من أنه حقق معيارًا مثيرًا للإعجاب على COCO في ذلك الوقت، إلا أن بنيته لا تزال تعتمد بشكل كبير على المخرجات القائمة على المراسي وتتطلب معالجة لاحقة معقدة لـ Non-Maximum Suppression (NMS) ، مما قد يؤدي إلى حدوث اختناقات في زمن الاستجابة أثناء النشر.
YOLO26: معيار الذكاء الاصطناعي للرؤية الذي يركز على الحافة
صدر Ultralytics في يناير 2026، وهو يمثل تحولًا جذريًا، حيث أعاد التفكير بشكل كامل في مسار الكشف لإعطاء الأولوية لسهولة النشر واستقرار التدريب وكفاءة الأجهزة.
تفاصيل النموذج
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:ultralytics/ultralytics
- المنصة:Ultralytics YOLO26 على المنصة
تم تصميم YOLO26 من الألف إلى الياء لحل التحديات الهندسية الحديثة. وتتميز بنيته بعدة ابتكارات مهمة تفوق بكثير سابقاتها:
- تصميم شامل خالٍ من NMS: يلغي YOLO26 المعالجة اللاحقة لـ NMS بطبيعته، وهو نهج رائد تم تقديمه لأول مرة في YOLOv10. وينتج عن ذلك مسار نشر أسرع وأبسط بكثير، مع تجنب زمن الانتقال المتغير الذي تسببه عادة المشاهد المزدحمة.
- إزالة DFL: من خلال إزالة خسارة التركيز التوزيعي (DFL)، يتم تبسيط النموذج بشكل جذري للتصدير، مما يوفر توافقًا أفضل بكثير مع الأجهزة الطرفية وأجهزة إنترنت الأشياء منخفضة الطاقة.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): بفضل التبسيطات المعمارية والتقليم الهيكلي، تم تحسين YOLO26 خصيصًا للحوسبة الطرفية والأجهزة التي لا تحتوي على وحدات GPU مخصصة، متفوقًا بسهولة على البنى القديمة على المعالجات القياسية.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (تحديدًا Kimi K2 من Moonshot AI)، يستخدم YOLO26 مُحسِّن MuSGD، وهو مزيج من الانحدار التدرجي العشوائي (Stochastic Gradient Descent) و Muon. يوفر هذا استقرارًا لا مثيل له في التدريب وتقاربًا أسرع بكثير لمهام الرؤية الحاسوبية.
- ProgLoss + STAL: يؤدي تقديم دوال الخسارة المتقدمة هذه إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـالتصوير الجوي والروبوتات وفحص الجودة الآلي.
- تحسينات خاصة بالمهام: بالإضافة إلى اكتشاف الكائنات القياسي، يقدم YOLO26 نموذجًا أوليًا متعدد المقاييس وفقدان تجزئة دلالية متخصصًا لـ مهام التجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضعية، وخوارزميات فقدان زاوية متخصصة لحل مشكلات الحدود في الصناديق المحيطة الموجهة (OBB).
الانتقال إلى YOLO26
الترقية من بنية قديمة إلى YOLO26 بسيطة مثل تغيير سلسلة النموذج في Python الخاص بك إلى yolo26n.ptتتولى حزمة Ultralytics عملية الانتقال بأكملها، بما في ذلك التنزيلات التلقائية للأوزان وتوسيع نطاق التكوين.
مقارنة الأداء والمقاييس
عند مقارنة البصمة الحاسوبية، يُظهر YOLO26 تفوقًا واضحًا في تحقيق التوازن بين الأداء ومتطلبات الذاكرة. غالبًا ما تتطلب النماذج القائمة على المحولات أو البنى القديمة الثقيلة تخصيصات هائلة CUDA ، ولكن YOLO26 يتدرب بكفاءة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
كما هو موضح أعلاه، الـ YOLO26m يحقق النموذج دقة مكافئة (53.1 mAP) للنموذج الضخم YOLOv7x، لكنها تفعل ذلك بأقل من ثلث المعلمات (20.4 مليون مقابل 71.3 مليون) وأوقات استدلال سريعة بشكل لا يصدق عبر TensorRT.
ميزة النظام البيئي لـ Ultralytics
غالبًا ما ينطوي نشر النماذج القديمة على التعامل مع مستودعات الطرف الثالث المعقدة، ومشكلات التبعية، وسكريبتات التصدير اليدوية. على النقيض من ذلك، توفر منصة Ultralytics نظامًا بيئيًا متماسكًا ومصانًا جيدًا يبسط دورة حياة التعلم الآلي بأكملها.
- سهولة الاستخدام: باستخدام واجهة برمجة تطبيقات Python بديهية ووثائق شاملة، يمكنك التعليق على النماذج وتدريبها ونشرها في دقائق. يتطلب التصدير إلى تنسيقات مثل ONNX أو CoreML سطرًا واحدًا فقط من التعليمات البرمجية.
- متطلبات الذاكرة: تشتهر نماذج Ultralytics باستهلاكها المنخفض للذاكرة. على عكس بعض المحولات الرؤيوية (vision transformers) الضخمة، يمكن ضبط YOLO26 بدقة بسهولة على الأجهزة القياسية دون مواجهة أخطاء نفاد الذاكرة (OOM).
- تعدد الاستخدامات: بينما كان YOLOv7 في الأساس كاشف كائنات (مع بعض الفروع التجريبية لمهام أخرى)، YOLO26 هو إطار عمل موحد أصلي يتعامل مع detect، classification، track، pose، و OBB بكفاءة متساوية.
Ultralytics الأخرى
في حين أن YOLO26 هو المعيار الموصى به، يمكن للمطورين الذين يقومون بترحيل الأنظمة القديمة استكشاف YOLO11، وهو جيل آخر عالي الأداء في Ultralytics يوفر استقرارًا ممتازًا لمشاريع الدعم طويلة الأجل.
مثال برمجي: التدريب والنشر
يوضح المثال التالي البساطة الأنيقة لـ ultralytics الحزمة. لاحظ مدى نظافة الواجهة مقارنة باستدعاء حجج سطر الأوامر الطويلة في النماذج القديمة.
from ultralytics import YOLO
# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # Efficient memory usage allows larger batch sizes
device=0,
)
# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")
حالات الاستخدام في العالم الحقيقي
يعتمد اختيار البنية الصحيحة كليًا على قيود الإنتاج لديك.
متى يجب التفكير في YOLOv7: يظل YOLOv7 أداة قيمة للمقارنة الأكاديمية بمعايير عام 2022. إذا كانت بنيتك التحتية تستخدم مسارات CUDA القديمة المبرمجة بشدة لمخرجات نقاط الارتكاز المحددة لـ YOLOv7 ولا يمكنك تخصيص موارد لإعادة الهيكلة، فسيستمر في العمل ككاشف أساسي قوي.
متى تختار YOLO26: لأي مشروع جديد، يُعد YOLO26 الخيار الأمثل. تجعل بنيته الخالية من NMS مثالية لـ الملاحة الذاتية ذات زمن الاستجابة المنخفض وأنظمة الأمان في الوقت الفعلي. إن إزالة DFL والتحسينات الهائلة في سرعة CPU تجعله البطل بلا منازع لعمليات نشر الذكاء الاصطناعي على الحافة، مثل النشر على Raspberry Pi أو داخل الأجهزة الإلكترونية الاستهلاكية. علاوة على ذلك، فإن تحسينات ProgLoss + STAL تجعله بارعًا للغاية في detect الشذوذات الدقيقة في ضمان جودة التصنيع أو تصوير الأقمار الصناعية.
في النهاية، يوفر YOLO26 للمطورين مزيجًا لا مثيل له من الدقة والسرعة والبساطة، مدعومًا بالدعم الشامل من مجتمع المصادر المفتوحة.