Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين DAMO-YOLO و YOLOv7#

أدى التطور السريع في الرؤية الحاسوبية إلى إنتاج نماذج عالية الكفاءة في اكتشاف الكائنات صُممت لتحقيق التوازن بين الدقة والتكلفة الحوسبية. ومن أبرز النموذجين اللذين تم تقديمهما في عام 2022 هما DAMO-YOLO و YOLOv7. وفي حين يهدف كلاهما إلى دفع حدود مهام الرؤية في الوقت الفعلي، فإنهما يحققان نتائجهما من خلال نماذج معمارية ومنهجيات تدريب مختلفة تماماً.

تستكشف هذه المقارنة التقنية الشاملة المناهج المتميزة لكلا النموذجين، حيث تفحص بنيتهما، وإمكانات النشر، ومقاييس الأداء لمساعدة مهندسي تعلم الآلة على اختيار الأداة المناسبة لـ تطبيقات الرؤية الحاسوبية الخاصة بهم.

Link to this sectionأصول النماذج والبيانات الوصفية#

قبل الغوص في التحليل التقني العميق، من الضروري وضع سياق لنشأة هذين النموذجين من نماذج الرؤية الحاسوبية.

Link to this sectionDAMO-YOLO#

تم تطوير DAMO-YOLO من قبل باحثين في مجموعة Alibaba Group، وقد قُدم لتحسين السرعة والدقة من خلال البحث الآلي عن البنية والتقطير.

اعرف المزيد عن DAMO-YOLO

Link to this sectionYOLOv7#

باعتباره أحدث التقنيات في منتصف عام 2022، دفع YOLOv7 الاستدلال في الوقت الفعلي إلى أبعد من ذلك من خلال تقديم "مجموعة من الميزات المجانية" القابلة للتدريب دون زيادة تكاليف النشر.

اعرف المزيد عن YOLOv7

النظام البيئي المدعوم

يتم دعم YOLOv7 رسمياً داخل النظام البيئي لـ Ultralytics، مما يسمح بالتدريب والتحقق والتصدير بسلاسة باستخدام واجهة برمجة تطبيقات موحدة.

Link to this sectionالابتكارات المعمارية#

Link to this sectionDAMO-YOLO: البحث عن البنية العصبية (NAS) والتقطير#

يدمج DAMO-YOLO العديد من التقنيات المتطورة الموجهة نحو تحقيق أقصى قدر من الكفاءة:

  • البنى الأساسية NAS: يستخدم البحث عن البنية العصبية (NAS) لتصميم بنى أساسية مثالية تلقائياً (MAE-NAS) مصممة خصيصاً للبيئات التي تتطلب زمن انتقال منخفض.
  • Efficient RepGFPN: شبكة هرمية للميزات معممة ومعدلة تعزز بشكل كبير كفاءة دمج الميزات عبر مقاييس متعددة.
  • ZeroHead & AlignedOTA: يدمج رأس اكتشاف خفيف الوزن واستراتيجية محسنة لتعيين التسميات (AlignedOTA) لتقليل العبء الحوسبي.
  • تعزيز التقطير: يعتمد بشكل كبير على تقطير المعرفة أثناء التدريب لتعزيز أداء متغيرات النموذج الأصغر دون تضخيم عدد المعلمات الخاصة بها.

Link to this sectionYOLOv7: E-ELAN ومجموعة الميزات المجانية#

اتخذ YOLOv7 نهجاً هندسياً هيكلياً أكثر، مع التركيز على تحسين مسار التدرج واستراتيجيات التدريب القوية.

  • بنية E-ELAN: تسمح شبكة تجميع الطبقات الفعالة الموسعة للنموذج بتعلم ميزات أكثر تنوعاً من خلال التحكم في أقصر وأطول مسارات التدرج، مما يضمن تقارب التعلم بفعالية.
  • قياس النموذج: يقدم طريقة قياس مركبة مصممة خصيصاً للنماذج القائمة على التسلسل، مع توسيع العمق والعرض في وقت واحد للمحاذاة الهيكلية.
  • مجموعة الميزات المجانية القابلة للتدريب: يوظف تقنيات مثل الالتفافات المعاد تهيئتها (RepConv) بدون روابط هوية، واستراتيجيات تعيين التسميات الديناميكية، التي تعزز الدقة أثناء التدريب دون التأثير على سرعة الاستدلال.

Link to this sectionتحليل الأداء#

عند تقييم متوسط دقة متوسط (mAP)، والسرعة، والكفاءة، يُظهر كلا النموذجين مقاييس مبهرة، على الرغم من أنهما يستهدفان قطاعات مختلفة قليلاً. يركز YOLOv7 بشكل كبير على نشر GPU عالي الدقة، بينما تهدف الهياكل المشتقة من NAS في DAMO-YOLO إلى نشر عدواني منخفض زمن الانتقال على CPU والحافة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

كما يظهر في المقاييس، بينما يوفر DAMO-YOLO متغيرات خفيفة الوزن للغاية (مثل النموذج الصغير الذي يحتوي على 8.5 مليون معلمة فقط)، يحقق YOLOv7 ذروة دقة إجمالية أعلى، حيث يصل YOLOv7x إلى 53.1 mAP مبهرة على مجموعة بيانات COCO.

Link to this sectionميزة نظام Ultralytics البيئي#

بينما تعتبر البنية النظرية مهمة، فإن قابلية تطبيق النموذج تُملى من خلال نظامه البيئي. تستفيد النماذج المدعومة من Ultralytics، مثل YOLOv7، من نظام بيئي مُصان جيداً و سهولة استخدام لا مثيل لها.

  • توازن الأداء: تحقق نماذج Ultralytics باستمرار توازناً مثالياً بين سرعة الاستدلال ودقة الاكتشاف، مما يجعلها مثالية لكل من أجهزة الحافة و نشر النماذج القائم على السحابة.
  • متطلبات الذاكرة: على عكس النماذج الأثقل القائمة على Transformer، تحافظ نماذج Ultralytics YOLO على متطلبات ذاكرة CUDA منخفضة أثناء التدريب. وهذا يسمح بـ أحجام دفعات أكبر، مما يبسط عملية التدريب حتى على الأجهزة الموجهة للمستهلكين.
  • تعدد الاستخدامات: يمتد إطار عمل Ultralytics إلى ما هو أبعد من اكتشاف الكائنات ليشمل مهام مثل تجزئة المثيلات و تقدير الوضع، مما يمنح المطورين مجموعة أدوات كاملة للرؤية الحاسوبية.
كفاءة التدريب

تتيح لك حزمة Ultralytics الانتقال بسلاسة من مجموعات البيانات إلى نموذج مدرب بالكامل في دقائق معدودة، وذلك بالاستفادة من أدوات تحميل البيانات عالية التحسين والأوزان المدربة مسبقاً.

Link to this sectionمثال برمجي: تدريب YOLOv7 باستخدام Ultralytics#

إن دمج YOLOv7 في خط أنابيب الرؤية الحاسوبية الخاص بك أمر مباشر للغاية باستخدام واجهة برمجة تطبيقات Ultralytics Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference and validate results
metrics = model.val()
predictions = model.predict("https://ultralytics.com/images/bus.jpg", save=True)

Link to this sectionالمعيار الجديد: تقديم YOLO26#

بينما مثل YOLOv7 و DAMO-YOLO اختراقات كبيرة في عام 2022، فإن مجال ذكاء الرؤية يتحرك بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة اليوم، النموذج الموصى به هو Ultralytics YOLO26 المتطور، الذي تم إصداره في يناير 2026.

يقدم YOLO26 قفزة جيلية في الأداء وسهولة الاستخدام، حيث يدمج ابتكارات حديثة:

  • تصميم شامل خالٍ من NMS: YOLO26 هو نموذج شامل (end-to-end) أصلاً. من خلال القضاء على المعالجة اللاحقة لقمع غير الحد الأقصى (NMS)، فإنه يوفر منطق نشر أسرع وأبسط—وهو تحول نموذجي كان رائده في البداية YOLOv10.
  • مُحسِّن MuSGD: مستوحى من ابتكارات نماذج اللغات الكبيرة مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مزيجاً من SGD و Muon. يضمن هذا المُحسِّن ديناميكيات تدريب مستقرة للغاية ومعدلات تقارب أسرع بشكل كبير.
  • استدلال أسرع بنسبة تصل إلى 43% على CPU: مع الإزالة المستهدفة لـ Distribution Focal Loss (DFL) والتحسينات الهيكلية العميقة، تم تحسين YOLO26 بشكل كبير لحوسبة الحافة منخفضة الطاقة، متفوقاً على الأجيال السابقة على الأجهزة غير المزودة بـ GPU.
  • ProgLoss + STAL: يدمج وظائف خسارة جديدة متقدمة تستهدف صراحةً وتحسن التعرف على الكائنات الصغيرة، وهي قدرة أساسية للتطبيقات في الصور الجوية، والروبوتات، و مراقبة الأمن.
  • تحسينات خاصة بالمهام: بخلاف الاكتشاف القياسي، يتميز YOLO26 بتحسينات مخصصة لمهام متنوعة، بما في ذلك النماذج الأولية متعددة المقاييس للتجزئة، و RLE لتقدير الوضع، وخسائر الزاوية المحددة لـ صناديق التحديد الموجهة (OBB).

تعرف على المزيد حول YOLO26

Link to this sectionحالات الاستخدام المثالية#

يعتمد اختيار البنية الصحيحة بالكامل على بيئة النشر المستهدفة وقيود المشروع.

متى تختار DAMO-YOLO:

  • أنت تعمل في بيئات حافة مقيدة للغاية ومحدودة الموارد حيث يجب الحفاظ على عدد المعلمات الخام منخفضاً للغاية (على سبيل المثال، وحدات التحكم الدقيقة).
  • أنت تستخدم خطوط أنابيب تعلم آلي آلية مدمجة خصيصاً مع خدمات السحابة المملوكة لشركة Alibaba.

متى تختار YOLOv7:

  • لديك خطوط أنابيب GPU قديمة مُحسّنة بالفعل للاستدلال عالي الدقة والقائم على المراسي.
  • أنت تعمل في بيئات تكون فيها الدقة في الوقت الفعلي أمراً بالغ الأهمية، مثل المركبات ذاتية القيادة عالية السرعة أو الروبوتات المتقدمة.

متى تختار YOLO26 (موصى به):

  • أنت تبني تطبيق رؤية حاسوبية جديداً من الصفر وتحتاج إلى أحدث التقنيات في كل من الدقة وسرعة الاستدلال على CPU/الحافة.
  • أنت تحتاج إلى نشر سريع وسلس (مثل التصدير إلى CoreML أو TensorRT) دون التعامل مع قيود مشغل NMS.
  • أنت ترغب في استخدام القدرات الكاملة لـ منصة Ultralytics للتدريب السحابي، وإدارة مجموعات البيانات، والنشر الآلي.

من خلال الاستفادة من النظام البيئي القوي لنماذج Ultralytics، يمكن للمطورين تقليل وقت الهندسة بشكل كبير مع تأمين أداء تنبؤي من الدرجة الأولى لتطبيقاتهم الواقعية.

التعليقات