YOLOv7 مقابل DAMO-YOLO: مقارنة تقنية شاملة

يتطور مشهد اكتشاف الكائنات في الوقت الفعلي باستمرار، حيث يسعى الباحثون والمهندسون جاهدين لإيجاد التوازن الأمثل بين السرعة والدقة. في هذه المقارنة التقنية، سنتعمق في معماريتين بارزتين من عام 2022: YOLOv7 و DAMO-YOLO. قدم كلا النموذجين مفاهيم مبتكرة لمجتمع رؤية الكمبيوتر، مما يعالج تحديات مختلفة في تدريب النماذج، والتصميم المعماري، والنشر.

خلفيات النماذج والتفاصيل التقنية

قبل الخوض في معمارياتهما، من الضروري فهم أصول هذين النموذجين. كلاهما تم تطويرهما بواسطة مجموعات بحثية رائدة وقَدَّما منهجيات متقدمة لتوسيع حدود اكتشاف الكائنات في الوقت الفعلي.

تفاصيل YOLOv7

تم تطوير YOLOv7 كاستمرار لعائلة YOLO، وقدم مفهوم "مجموعة الميزات المجانية" (bag-of-freebies) القابلة للتدريب لتعزيز الدقة بشكل كبير دون زيادة تكلفة الاستنتاج.

اعرف المزيد عن YOLOv7

تفاصيل DAMO-YOLO

ركز نموذج DAMO-YOLO، الذي أنشأه باحثون في مجموعة Alibaba، بشكل كبير على البحث في المعمارية العصبية (NAS) وتقطير المعرفة المتقدم لبناء نماذج عالية الكفاءة لمختلف الأجهزة.

تعرف على المزيد حول DAMO-YOLO

الابتكارات المعمارية

YOLOv7: تحليل مسار التدرج وإعادة تحديد المعلمات

يركز YOLOv7 بشكل كبير على شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). صمم المؤلفون E-ELAN من خلال تحليل مسارات التدرج للشبكة، مما يضمن قدرة الشبكة على التعلم باستمرار دون تدهور مسار التدرج الأصلي. علاوة على ذلك، يستخدم YOLOv7 بشكل فعال إعادة تحديد معلمات النموذج أثناء الاستنتاج، مما يدمج الطبقات بسلاسة لتقليل FLOPs وتسريع أوقات التنفيذ. وهذا يجعله مؤهلاً للغاية لـ الاستنتاج في الوقت الفعلي على وحدات معالجة الرسومات الحديثة.

DAMO-YOLO: البحث في المعمارية العصبية و RepGFPN

يختلف DAMO-YOLO من خلال الاستفادة بشكل كبير من البحث في المعمارية العصبية (NAS) ضمن قيود زمن الوصول. ويستخدم إطار عمل يسمى MAE-NAS لاكتشاف الهياكل الأساسية المثلى المصممة لأجهزة معينة، مثل الأجهزة المحمولة أو مسرعات الحافة المحددة. بالنسبة لعنقه، فإنه يقدم RepGFPN فعال (شبكة هرمية للميزات العامة مُعاد تحديد معالمها)، ويستخدم تصميم ZeroHead لتقليل العبء الحسابي في رؤوس التنبؤ.

اختلافات التقطير

بينما يعتمد YOLOv7 على تحسينات معمارية متأصلة وقوية، يعتمد DAMO-YOLO بشكل كبير على عملية تقطير معرفة معقدة متعددة المراحل. وهو يتطلب تدريب نموذج معلم كبير لتقطير المعرفة في نموذج طالب أصغر، وهو ما قد يكون مكلفاً حسابياً خلال مرحلة التدريب.

مقارنة الأداء والمقاييس

عند مقارنة هذه النماذج، من الضروري النظر في mAP (متوسط الدقة)، وسرعة الاستنتاج، وتعقيد النموذج.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

يوضح الجدول أعلاه أن YOLOv7 يتوسع بشكل جيد في مجالات الدقة العالية (YOLOv7x)، بينما يوفر DAMO-YOLO نماذج صغيرة مُحسّنة للغاية للبيئات المقيدة.

كفاءة التدريب ومتطلبات الذاكرة

يكمن أحد الفروق الرئيسية بين المعماريتين في منهجيات التدريب الخاصة بهما. إن اعتماد DAMO-YOLO على التقطير يعني أن تدريب نموذج جديد من الصفر أو الضبط الدقيق على مجموعة بيانات رؤية كمبيوتر مخصصة غالباً ما يتطلب قدراً أكبر بكثير من ذاكرة الفيديو (VRAM) ووقت حوسبة GPU.

في المقابل، النماذج المدمجة في نظام Ultralytics، مثل YOLOv7 والإصدارات الأحدث، مُحسّنة بشكل كبير لـ متطلبات الذاكرة. وهي تسمح للمطورين باستخدام أحجام دفعات أكبر على أجهزة المستهلك دون مواجهة أخطاء نفاد الذاكرة، مما يبسط عملية تتبع التجارب والتكرار.

ميزة Ultralytics

على الرغم من أن كلاً من YOLOv7 و DAMO-YOLO يقدمان ميزات مقنعة، إلا أن نشر النماذج ضمن نظام Ultralytics يوفر تجربة مطور لا تضاهى.

  • سهولة الاستخدام: توفر حزمة Python من Ultralytics واجهة برمجة تطبيقات (API) موحدة وبسيطة. يمكنك التبديل بسرعة بين معماريات النماذج، أو بدء حلقات التدريب، أو تشغيل الاستنتاج ببضعة أسطر من التعليمات البرمجية.
  • نظام بيئي جيد الصيانة: توفر Ultralytics تحديثات متكررة، مما يضمن التوافق الأصلي مع أحدث إصدارات PyTorch ومشغلات CUDA. كما أنها تبسط تصدير النماذج إلى تنسيقات مثل ONNX و TensorRT و OpenVINO.
  • تعدد الاستخدامات: على عكس DAMO-YOLO، الذي يعد كاشفاً للكائنات حصراً، يدعم نظام Ultralytics البيئي مهام متنوعة بشكل أصلي. يمكن لنماذج عائلة Ultralytics إجراء اكتشاف الصناديق المحيطة القياسي، و تقدير الوضعية، و تجزئة المثيل، و الصناديق المحيطة الموجهة (OBB).

مثال برمجي: البدء بسرعة

إليك مدى سهولة تحميل وتدريب وتشغيل الاستنتاج باستخدام نماذج Ultralytics:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")
تصدير النماذج

مع Ultralytics، يتم التعامل مع تصدير الأوزان المدربة الخاصة بك إلى تنسيقات مختلفة مُسرَّعة بالأجهزة (مثل TensorRT أو CoreML) عبر وسيط واحد في أمر التصدير، مما يوفر ساعات من تكوينات البرامج النصية المعقدة.

الجيل القادم: YOLO26

بينما يظل YOLOv7 معمارية قديمة قوية، إلا أن المجال تقدم بسرعة. بالنسبة لعمليات النشر الجديدة، يوصى باستخدام Ultralytics YOLO26 (الذي تم إصداره في يناير 2026) كمعيار، حيث يتفوق على الأجيال السابقة في كل مقياس تقريباً.

  • تصميم بدون NMS من البداية للنهاية: تم تقديمه لأول مرة في YOLOv10، يلغي YOLO26 أصلياً معالجة ما بعد الاستنتاج المسماة قمع غير الحد الأقصى (NMS). وهذا يضمن استنتاجاً حتمياً بزمن وصول منخفض للغاية، وهو أمر بالغ الأهمية للروبوتات وتقنيات القيادة الذاتية.
  • مُحسّن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة (LLM) المتقدمة (مثل Kimi K2 من Moonshot AI)، يمزج هذا المُحسّن الهجين بين SGD و Muon لتقديم تدريب مستقر للغاية وتقارب أسرع عبر مجموعات البيانات.
  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال إزالة توزيع فقدان التركيز (DFL) بشكل استراتيجي، يعزز YOLO26 الأداء بشكل كبير على منصات الحوسبة الطرفية ووحدات المعالجة المركزية (CPUs).
  • ProgLoss + STAL: تحقق دوال الفقد المتقدمة هذه تحسينات كبيرة في اكتشاف الكائنات الصغيرة، مما يجعل YOLO26 مناسباً بشكل استثنائي لـ الصور الجوية والمراقبة التفصيلية.

اعرف المزيد عن YOLO26

حالات الاستخدام المثالية

متى تختار DAMO-YOLO

  • البحث الأكاديمي في NAS: إذا كانت مؤسستك مستثمرة بكثافة في دراسة منهجيات البحث في المعمارية العصبية.
  • زمن وصول مقيد للغاية على أجهزة معينة: إذا كانت لديك الموارد اللازمة لتشغيل عمليات بحث NAS شاملة للعثور على هيكل أساسي مخصص لشريحة مسرع ذكاء اصطناعي مخصصة.

متى تختار YOLOv7

  • خطوط أنابيب GPU الحالية: للفرق التي تحافظ على خطوط أنابيب إنتاج قديمة مُحسّنة بعمق حول معمارية E-ELAN الخاصة بـ YOLOv7 على أجهزة NVIDIA المتطورة.

لماذا يجب الانتقال إلى نماذج Ultralytics الحديثة (YOLO11 / YOLO26)

بالنسبة للغالبية العظمى من تطبيقات المؤسسات - من تحليلات التجزئة و التصنيع الذكي إلى الرعاية الصحية - فإن نماذج Ultralytics الحديثة لا مثيل لها. يوفر التكامل مع منصة Ultralytics خط أنابيب ML كاملاً، مما يوفر سهولة في الاستخدام، وتوثيقاً فائقاً، ودعماً قوياً من المجتمع، وتعدد مهام متنوع. سواء كنت تتعقب المخزون على Raspberry Pi أو تقوم بتشغيل تحليلات ثقيلة في السحابة، فإن نماذج مثل YOLO26 توفر توازن الأداء المثالي لمستقبل رؤية الكمبيوتر.

تعليقات