Link to this sectionYOLOv7 مقابل DAMO-YOLO#

يشهد مجال كشف الأجسام في الوقت الفعلي تطوراً مستمراً، حيث يسعى الباحثون والمهندسون جاهدين لإيجاد التوازن الأمثل بين السرعة والدقة. في هذه المقارنة التقنية، سنتعمق في معماريتين بارزتين من عام 2022: YOLOv7 و DAMO-YOLO. قدم كلا النموذجين مفاهيم جديدة لمجتمع رؤية الحاسوب، معالجين تحديات مختلفة في تدريب النماذج، والتصميم المعماري، والنشر.

Link to this sectionخلفية النماذج والتفاصيل التقنية#

قبل الغوص في معماريتيهما، من الضروري فهم أصول هذين النموذجين. تم تطوير كلاهما من قبل مجموعات بحثية رائدة، وقَدَّما منهجيات متقدمة لدفع حدود كشف الأجسام في الوقت الفعلي.

Link to this sectionتفاصيل YOLOv7#

تم تطوير YOLOv7 كاستمرار لعائلة YOLO، وقدم مفهوم "مجموعة الميزات المجانية" (bag-of-freebies) القابلة للتدريب لتعزيز الدقة بشكل كبير دون زيادة تكلفة الاستنتاج.

المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Docs: https://docs.ultralytics.com/models/yolov7/

اعرف المزيد عن YOLOv7

Link to this sectionتفاصيل DAMO-YOLO#

تم إنشاء DAMO-YOLO من قبل باحثين في مجموعة Alibaba، وركز بشكل كبير على البحث في المعمارية العصبية (NAS) وتقطير المعرفة المتقدم لبناء نماذج عالية الكفاءة لمختلف الأجهزة.

المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
المؤسسة: Alibaba Group
التاريخ: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO

اعرف المزيد عن DAMO-YOLO

Link to this sectionالابتكارات المعمارية#

Link to this sectionYOLOv7: تحليل مسار التدرج وإعادة التقييم (Re-parameterization)#

يركز YOLOv7 بشكل كبير على شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). صمم المؤلفون E-ELAN من خلال تحليل مسارات التدرج للشبكة، مما يضمن قدرة الشبكة على التعلم المستمر دون تدهور مسار التدرج الأصلي. علاوة على ذلك، يستخدم YOLOv7 بشكل فعال إعادة تقييم النموذج أثناء الاستنتاج، حيث يدمج الطبقات بسلاسة لتقليل FLOPs وتسريع أوقات التنفيذ. وهذا يجعله مؤهلاً للغاية لـ الاستنتاج في الوقت الفعلي على وحدات معالجة الرسومات الحديثة.

Link to this sectionDAMO-YOLO: البحث في المعمارية العصبية و RepGFPN#

يختلف DAMO-YOLO من خلال الاعتماد بشكل كبير على البحث في المعمارية العصبية (NAS) في ظل قيود زمن الاستجابة (اللاتنسي). يستخدم إطار عمل يسمى MAE-NAS لاكتشاف الهياكل الأساسية المثلى المصممة لأجهزة معينة، مثل الأجهزة المحمولة أو مسرعات الحافة المحددة. بالنسبة لرقبته (neck)، يقدم بنية RepGFPN (شبكة هرم ميزات معممة ومعادة التقييم) فعالة، ويستخدم تصميم ZeroHead لتقليل العبء الحسابي في رؤوس التنبؤ.

اختلافات التقطير

بينما يعتمد YOLOv7 على تحسينات معمارية جوهرية قوية، يعتمد DAMO-YOLO بشكل كبير على عملية تقطير معرفة معقدة متعددة المراحل. يتطلب ذلك تدريب نموذج معلم كبير لتقطير المعرفة إلى نموذج طالب أصغر، وهو ما قد يكون مكلفاً حسابياً خلال مرحلة التدريب.

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج، من الضروري النظر في mAP (متوسط دقة متوسط)، وسرعة الاستنتاج، وتعقيد النموذج.

النموذج	الحجم ^(بكسل)	mAP^val 50-95	السرعة ^{CPU ONNX (ms)}	السرعة ^{T4 TensorRT10 (ms)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

يوضح الجدول أعلاه أن YOLOv7 يتوسع بشكل جيد في نطاقات الدقة العالية (YOLOv7x)، بينما يوفر DAMO-YOLO نماذج صغيرة محسنة للغاية للبيئات المقيدة.

Link to this sectionكفاءة التدريب ومتطلبات الذاكرة#

يكمن التمييز الرئيسي بين المعماريتين في منهجيات تدريبهما. يعني اعتماد DAMO-YOLO على التقطير أن تدريب نموذج جديد من الصفر أو الضبط الدقيق على مجموعة بيانات رؤية حاسوب مخصصة يتطلب غالباً ذاكرة فيديو (VRAM) ووقت حوسبة GPU أكبر بكثير.

في المقابل، النماذج المدمجة في نظام Ultralytics البيئي، مثل YOLOv7 والإصدارات اللاحقة، محسنة بشكل كبير لـ متطلبات الذاكرة. وهي تتيح للمطورين استخدام أحجام دفعات أكبر على أجهزة المستهلك دون مواجهة أخطاء نفاد الذاكرة، مما يبسط عملية تتبع التجارب والتكرار.

Link to this sectionميزة Ultralytics#

بينما يقدم كل من YOLOv7 و DAMO-YOLO ميزات مقنعة، فإن نشر النماذج داخل نظام Ultralytics البيئي يوفر تجربة مطور لا مثيل لها.

سهولة الاستخدام: توفر حزمة Ultralytics بلغة Python واجهة برمجة تطبيقات (API) موحدة وبسيطة. يمكنك التبديل بسرعة بين معماريات النماذج، أو بدء حلقات التدريب، أو تشغيل الاستنتاج ببضعة أسطر من التعليمات البرمجية.
نظام بيئي مُصان جيداً: توفر Ultralytics تحديثات متكررة، مما يضمن التوافق الأصلي مع أحدث إصدارات PyTorch ومشغلات CUDA. كما أنه يبسط تصدير النماذج إلى تنسيقات مثل ONNX، و TensorRT، و OpenVINO.
تعدد الاستخدامات: على عكس DAMO-YOLO، الذي هو كاشف للأجسام فقط، يدعم نظام Ultralytics البيئي مهام متنوعة بشكل أصلي. يمكن لنماذج عائلة Ultralytics إجراء كشف صناديق الإحاطة القياسية، تقدير الوضع، تجزئة المثيلات، و صناديق الإحاطة الموجهة (OBB).

Link to this sectionمثال برمجي: البدء بسرعة#

إليك مدى سهولة تحميل وتدريب وتشغيل الاستنتاج باستخدام نماذج Ultralytics:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

تصدير النماذج

مع Ultralytics، يتم التعامل مع تصدير الأوزان المدربة الخاصة بك إلى تنسيقات مختلفة مسرعة بواسطة الأجهزة (مثل TensorRT أو CoreML) عبر وسيط واحد في أمر التصدير، مما يوفر ساعات من تكوينات البرامج النصية المعقدة.

Link to this sectionالجيل القادم: YOLO26#

بينما يظل YOLOv7 معمارية قديمة قوية، فقد تقدم المجال بسرعة. بالنسبة للنشر الجديد، يُعد Ultralytics YOLO26 (الذي تم إصداره في يناير 2026) المعيار الموصى به، حيث يتفوق على الأجيال السابقة في كل مقياس تقريباً.

تصميم كامل بدون NMS: تم تطويره لأول مرة في YOLOv10، يلغي YOLO26 محلياً معالجة ما بعد الكشف لـ Non-Maximum Suppression (NMS). وهذا يضمن استنتاجاً حتمياً فائق السرعة وهو أمر بالغ الأهمية للروبوتات وتقنيات القيادة الذاتية.
محسن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة المتقدمة (مثل Kimi K2 من Moonshot AI)، يمزج هذا المحسن الهجين بين SGD و Muon لتقديم تدريب مستقر للغاية وتقارب أسرع عبر مجموعات البيانات.
سرعة استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال إزالة Distribution Focal Loss (DFL) بشكل استراتيجي، يعزز YOLO26 الأداء بشكل كبير على منصات الحوسبة الطرفية ووحدات المعالجة المركزية.
ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات كبيرة في اكتشاف الأجسام الصغيرة، مما يجعل YOLO26 مناسباً بشكل استثنائي لـ الصور الجوية والمراقبة التفصيلية.

تعرف على المزيد حول YOLO26

Link to this sectionحالات الاستخدام المثالية#

Link to this sectionمتى تختار DAMO-YOLO#

البحث الأكاديمي في NAS: إذا كانت مؤسستك تستثمر بكثافة في دراسة منهجيات البحث في المعمارية العصبية.
وقت استجابة مقيد للغاية على أجهزة محددة: إذا كان لديك الموارد اللازمة لتشغيل عمليات بحث NAS شاملة للعثور على هيكل أساسي مخصص لشريحة مسرع ذكاء اصطناعي مخصصة.

Link to this sectionمتى تختار YOLOv7#

خطوط أنابيب GPU الحالية: للفرق التي تحافظ على خطوط إنتاج قديمة محسنة بعمق حول معمارية E-ELAN الخاصة بـ YOLOv7 على أجهزة NVIDIA المتطورة.

Link to this sectionلماذا الانتقال إلى نماذج Ultralytics الحديثة (YOLO11 / YOLO26)#

بالنسبة للغالبية العظمى من تطبيقات المؤسسات - من تحليلات التجزئة و التصنيع الذكي إلى الرعاية الصحية - فإن نماذج Ultralytics الحديثة لا تضاهى. يوفر التكامل مع منصة Ultralytics خط أنابيب تعلم آلي كاملاً، مما يوفر سهولة في الاستخدام، وتوثيقاً فائقاً، ودعماً قوياً من المجتمع، وتعدداً في المهام. سواء كنت تتتبع المخزون على Raspberry Pi أو تقوم بتشغيل تحليلات ثقيلة في السحابة، توفر نماذج مثل YOLO26 توازن الأداء المثالي لمستقبل رؤية الحاسوب.

المساهمون

GLglenn-jocher¹² PDpderrenger¹

تم الإنشاء 27 يناير 2025تم التحديث قبل 3 أسابيع