YOLOv7 مقابل YOLO26: قفزة جيلية في اكتشاف الكائنات في الوقت الفعلي

تميز تطور رؤية الحاسوب بمحطات هامة، ويوفر مقارنة البنى القديمة مع النماذج الحديثة المتطورة رؤى قيمة لمهندسي تعلم الآلة. تتعمق هذه المقارنة التقنية في الاختلافات بين YOLOv7 المؤثر للغاية وUltralytics YOLO26 الثوري، مع تسليط الضوء على التطورات في الهندسة المعمارية ومنهجيات التدريب وكفاءة النشر.

YOLOv7: رائد "حقيبة الهدايا المجانية" (Bag-of-Freebies)

أدى تقديم YOLOv7 في منتصف عام 2022 إلى دفع حدود ما كان ممكناً على أجهزة GPU من خلال إدخال العديد من التحسينات المعمارية التي أدت إلى تحسين الدقة دون زيادة تكلفة الاستدلال.

تفاصيل النموذج

قدم YOLOv7 مفهوم "حقيبة الهدايا المجانية" القابلة للتدريب، والتي استخدمت بكثافة تقنيات إعادة المعلمات وشبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). سمح هذا للنموذج بتعلم ميزات أكثر تنوعاً وتحسين قدرة التعلم للشبكة باستمرار دون تدمير مسار التدرج الأصلي. على الرغم من تحقيقه لمستوى قياسي متطور على COCO في ذلك الوقت، إلا أن بنيته تظل تعتمد بشكل كبير على المخرجات القائمة على المراسي وتتطلب معالجة لاحقة معقدة لخوارزمية NMS، والتي يمكن أن تسبب اختناقات في زمن الاستجابة أثناء النشر.

اعرف المزيد عن YOLOv7

YOLO26: معيار الذكاء الاصطناعي البصري الموجه نحو الحافة

يمثل Ultralytics YOLO26، الذي تم إصداره في يناير 2026، تحولاً جذرياً في النموذج، حيث يعيد التفكير بالكامل في مسار الاكتشاف لإعطاء الأولوية لسهولة النشر واستقرار التدريب وكفاءة الأجهزة.

تفاصيل النموذج

تم بناء YOLO26 من الصفر لحل التحديات الهندسية الحديثة. تجلب بنيته العديد من الابتكارات الحاسمة التي تتفوق بشكل كبير على أسلافها:

  • تصميم بدون NMS من الطرف إلى الطرف: يلغي YOLO26 المعالجة اللاحقة لـ NMS محلياً، وهو نهج رائد تم تقديمه لأول مرة في YOLOv10. يؤدي هذا إلى مسار نشر أسرع وأبسط بكثير، متجنباً التباين في زمن الاستجابة الذي تسببه عادةً المشاهد المزدحمة.
  • إزالة DFL: من خلال إزالة خسارة التوزيع البؤري (DFL)، تم تبسيط النموذج جذرياً للتصدير، مما يوفر توافقاً أفضل بكثير مع أجهزة الحافة وأجهزة إنترنت الأشياء ذات الطاقة المنخفضة.
  • سرعة استدلال أعلى على CPU تصل إلى 43%: بفضل التبسيط المعماري والتقليم الهيكلي، تم تحسين YOLO26 خصيصاً لحوسبة الحافة والأجهزة التي لا تحتوي على وحدات GPU مخصصة، متفوقاً بسهولة على البنى القديمة على المعالجات القياسية.
  • محسن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (تحديداً Kimi K2 من Moonshot AI)، يستخدم YOLO26 محسن MuSGD—وهو مزيج من الانحدار العشوائي (SGD) وMuon. هذا يجلب استقراراً لا مثيل له في التدريب وتقارباً أسرع بكثير لمهام رؤية الحاسوب.
  • ProgLoss + STAL: يؤدي إدخال دوال الخسارة المتقدمة هذه إلى تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية للصور الجوية والروبوتات وفحص الجودة الآلي.
  • تحسينات خاصة بالمهمة: بالإضافة إلى اكتشاف الكائنات القياسي، يقدم YOLO26 نماذج أولية متعددة المقاييس وخسارة تجزئة دلالية متخصصة لمهام التجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية، وخوارزميات خسارة الزاوية المتخصصة لحل مشكلات الحدود في صناديق التقييد الموجهة (OBB).

اعرف المزيد عن YOLO26

الانتقال إلى YOLO26

الترقية من بنية قديمة إلى YOLO26 بسيطة كبساطة تغيير سلسلة النموذج في كود Python الخاص بك إلى yolo26n.pt. تتولى حزمة Ultralytics عملية الانتقال بالكامل، بما في ذلك تنزيلات الأوزان التلقائية وتحجيم الإعدادات.

مقارنة الأداء والمقاييس

عند مقارنة البصمة الحسابية، يظهر YOLO26 تفوقاً واضحاً في موازنة الأداء ومتطلبات الذاكرة. غالباً ما تتطلب النماذج القائمة على Transformer أو البنى الثقيلة القديمة تخصيصات ضخمة لذاكرة CUDA، لكن YOLO26 يتدرب بكفاءة على وحدات GPU الموجهة للمستهلكين.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما رأينا أعلاه، يحقق نموذج YOLO26m دقة مكافئة (53.1 mAP) لنموذج YOLOv7x الضخم، ولكن بأقل من ثلث المعلمات (20.4M مقابل 71.3M) وأوقات استدلال سريعة للغاية عبر TensorRT.

ميزة نظام Ultralytics البيئي

غالباً ما يتضمن نشر النماذج القديمة التعامل مع مستودعات خارجية معقدة، وجحيم التبعيات، وبرامج نصية للتصدير اليدوي. في المقابل، توفر منصة Ultralytics نظاماً بيئياً متماسكاً ومصاناً جيداً يعمل على تبسيط دورة حياة تعلم الآلة بالكامل.

  • سهولة الاستخدام: من خلال واجهة برمجة تطبيقات Python بديهية ووثائق شاملة، يمكنك إضافة التعليقات التوضيحية وتدريب ونشر النماذج في دقائق. يتطلب التصدير إلى تنسيقات مثل ONNX أو CoreML سطراً واحداً فقط من الكود.
  • متطلبات الذاكرة: تشتهر نماذج Ultralytics باستهلاكها المنخفض للذاكرة. على عكس بعض محولات الرؤية الضخمة، يمكن ضبط YOLO26 بسهولة على الأجهزة القياسية دون مواجهة أخطاء نفاد الذاكرة (OOM).
  • تعدد الاستخدامات: بينما كان YOLOv7 في المقام الأول كاشفاً للكائنات (مع بعض الفروع التجريبية لمهام أخرى)، يعد YOLO26 إطار عمل موحداً أصلياً يتعامل مع الاكتشاف والتصنيف والتتبع والوضعية وOBB بنفس الكفاءة.
نماذج Ultralytics أخرى

على الرغم من أن YOLO26 هو المعيار الموصى به، يمكن للمطورين الذين ينقلون الأنظمة القديمة استكشاف YOLO11 أيضاً، وهو جيل آخر قادر للغاية في مجموعة Ultralytics يوفر استقراراً ممتازاً لمشاريع الدعم طويلة الأجل.

مثال كود: التدريب والنشر

يوضح المثال التالي البساطة الأنيقة لحزمة ultralytics. لاحظ مدى نظافة الواجهة مقارنة باستدعاء وسائط سطر أوامر طويلة للنماذج القديمة.

from ultralytics import YOLO

# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # Efficient memory usage allows larger batch sizes
    device=0,
)

# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")

حالات الاستخدام الواقعية

يعتمد اختيار البنية الصحيحة بالكامل على قيود الإنتاج الخاصة بك.

متى يجب التفكير في YOLOv7: يظل YOLOv7 أداة قيمة لقياس الأداء الأكاديمي مقابل معايير عام 2022. إذا كانت بنيتك التحتية تستخدم مسارات CUDA القديمة الثقيلة والمشفرة بشدة لمخرجات المراسي الخاصة بـ YOLOv7 ولا يمكنك تخصيص موارد لإعادة الهيكلة، فسيستمر في العمل ككاشف أساسي قوي.

متى يجب اختيار YOLO26: لأي مشروع جديد، يعد YOLO26 هو الخيار النهائي. بنيته الخالية من NMS تجعله مثالياً للملاحة الذاتية منخفضة زمن الاستجابة وأنظمة الأمن في الوقت الفعلي. تجعل إزالة DFL وتعزيزات سرعة CPU الهائلة منه بطلاً بلا منازع لعمليات نشر ذكاء الحافة الاصطناعي، مثل النشر على Raspberry Pi أو داخل الأجهزة الإلكترونية الاستهلاكية. علاوة على ذلك، تجعل تحسينات ProgLoss + STAL منه بارعاً للغاية في اكتشاف الشذوذات الدقيقة في ضمان جودة التصنيع أو صور الأقمار الصناعية.

في النهاية، يوفر YOLO26 للمطورين مزيجاً لا مثيل له من الدقة والسرعة والبساطة، مدعوماً بالدعم الشامل لمجتمع المصادر المفتوحة.

تعليقات