تخطي إلى المحتوى

YOLO YOLOv5: نظرة متعمقة على اكتشاف الكائنات في الوقت الفعلي

تميز تطور الرؤية الحاسوبية بالابتكار المستمر في مجال الكشف عن الأجسام في الوقت الفعلي. اليوم، يواجه المطورون والباحثون عددًا لا يحصى من الخيارات المعمارية عند تصميم خطوط أنابيب الرؤية. تستكشف هذه المقارنة التقنية الشاملة الفروق الدقيقة بين YOLO و Ultralytics YOLOv5، وتسلط الضوء على هندستهما المعمارية ومنهجيات التدريب ومقاييس الأداء وسيناريوهات النشر المثالية.

مقدمة إلىYOLO

أطلقت مجموعة Alibaba GroupYOLO عدة تقنيات مبتكرة تهدف إلى توسيع حدود سرعة ودقة الكشف.

تعرف على المزيد حول DAMO-YOLO

الابتكارات المعمارية

YOLO بناءYOLO على أساس البحث في الهندسة العصبية (NAS). استخدم المؤلفون MAE-NAS لتصميم هياكل أساسية توازن بين زمن الاستجابة والدقة. يقدم النموذج شبكة RepGFPN (شبكة هرمية عامة معاد تقييمها) فعالة تعمل على تحسين دمج الميزات عبر مستويات مختلفة. علاوة على ذلك،YOLO تصميم "ZeroHead"، الذي يتخلص من رؤوس التنبؤ المعقدة متعددة الفروع لصالح هيكل أبسط وأكثر كفاءة يعتمد بشكل كبير على إعادة تقييم المعلمات أثناء الاستدلال.

لتحسين التدريب، يستخدم النموذج AlignedOTA لتعيين التسميات وعملية تحسين التقطير المكثف، حيث يوجه نموذج "المعلم" الأكبر نموذج "الطالب" الأصغر لتحقيق دقة أعلى.

مقدمة إلى Ultralytics YOLOv5

Ultralytics YOLOv5 واحدة من أكثر بنى الرؤية استخدامًا في العالم، وتشتهر باستقرارها وسهولة استخدامها ونظامها البيئي الواسع النطاق.

تعرف على المزيد حول YOLOv5

معيار النظام البيئي

YOLOv5 معيار الصناعة من حيث سهولة الاستخدام. تم بناؤها أصلاً في PyTorch، ويستخدم بنية أساسية CSPNet عالية التحسين ورقبة PANet لتجميع الميزات بشكل قوي. على الرغم من أنه سبق الاتجاه الخالي من المراسي الذي شوهد في النماذج اللاحقة، إلا أن نهجه القائم على المراسي عالية الدقة، إلى جانب التعلم التلقائي للمراسي، يضمن أداءً ممتازًا فور استخدامه.

YOLOv5 القوة الحقيقية لـ YOLOv5 في نظامها البيئي الذي يتم صيانته جيدًا. فهي تتكامل بسلاسة مع أدوات التتبع مثل Comet و Weights & Biases، ويدعم التصدير بنقرة واحدة إلى تنسيقات مثل ONNXو TensorRTو CoreML.

البدء في استخدام YOLOv5

YOLOv5 التدريب بشكل لا يصدق على مجموعات البيانات المخصصة. YOLOv5 واجهة برمجة التطبيقات المبسطة على تقليل الاحتكاك من النموذج الأولي إلى الإنتاج، مما يجعله المفضل لدى فرق الهندسة الرشيقة.

مقارنة الأداء والمقاييس

عند مقارنة هذه النماذج، من الضروري النظر إلى التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال وعدد المعلمات.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

تحليل المقايضات

YOLO mAP مذهلة بالنسبة لحجم معلماته، مستفيدًا بشكل كبير من مرحلة التدريب بالتقطير. لكن ذلك جاء على حساب كفاءة التدريب. تتطلب عملية التقطير متعددة المراحل تدريب نموذج معلم ثقيل أولاً، مما يزيد بشكل كبير من وقت GPU اللازم GPU وذاكرة الوصول العشوائي (VRAM).

على العكس من ذلك، YOLOv5 يوفر متطلبات ذاكرة ممتازة. تشتهرYOLO Ultralytics YOLO باستخدامها المنخفض للذاكرة أثناء التدريب والاستدلال مقارنةً بخطوط التقطير المعقدة أو النماذج القائمة على المحولات مثل RT-DETR. وهذا يسمح YOLOv5 بكفاءة على أجهزة المستهلكين أو بيئات السحابة المتاحة مثل Google .

التطبيقات الواقعية والتنوع

غالبًا ما يعتمد اختيار البنية المناسبة على بيئة النشر.

أين يتفوق DAMO-YOLO

YOLO نموذج كشف كائنات بحت. وهو خيار ممتاز للبحوث الأكاديمية، لا سيما للفرق التي تدرس البحث في الهندسة العصبية أو تلك التي تهدف إلى إعادة إنتاج تقنيات إعادة المعلمات الموضحة بالتفصيل في الورقة البحثية. إذا كان المشروع يمتلك موارد حاسوبية واسعة لتنفيذ مرحلة التدريب على التقطير ويركز فقط على استخلاص آخر جزء من الدقة لمربعات الحدود ثنائية الأبعاد،YOLO منافسًا قويًا.

ميزة Ultralytics

في مجال الإنتاج الفعلي، تعد سهولة الاستخدام وتعدد استخدامات Ultralytics من العوامل التي تجعلها الخيار المفضل. في حين YOLOv5 أداة أساسية للكشف وتصنيف الصور، فإن Ultralytics الأوسع نطاقًا يتيح للمطورين التبديل بين المهام بسهولة.

على سبيل المثال، تدعم الإصدارات الأحدث من Ultralytics بشكل أساسي تقسيم المثيلات وتقدير الوضع وكشف الصندوق المحيط الموجه (OBB). تضمن هذه القدرة متعددة المهام أن تتمكن الفرق من استخدام Python واحدة وموحدة لخطوط الإنتاج المعقدة، مثل الجمع بين التعرف الآلي على لوحات الأرقام وتقسيم المركبات.

حالات الاستخدام والتوصيات

YOLOv5 الاختيار بينYOLO YOLOv5 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار DAMO-YOLO

YOLO خيار قوي لـ:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.

متى تختار YOLOv5

YOLOv5 في الحالات التالية:

  • أنظمة إنتاج مجربة: عمليات النشر الحالية التي تُقدّر فيها track YOLOv5 الطويل في الاستقرار، والوثائق الشاملة، والدعم المجتمعي الهائل.
  • التدريب المحدود الموارد: البيئات ذات GPU المحدودة حيث يكون خط التدريب الفعال YOLOv5 ومتطلبات الذاكرة المنخفضة ميزة.
  • دعم واسع النطاق لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNXو TensorRTو CoreMLو TFLite.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

المستقبل: الانتقال إلى YOLO26

في حين YOLOv5 وYOLO رؤى أكاديمية مثيرة للاهتمام، إلا أن أحدث التقنيات قد تطورت. تم إصدار Ultralytics في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام لمجتمع الرؤية.

تعرف على المزيد حول YOLO26

يعالج YOLO26 العقبات التقليدية التي تواجه نشر الحافة وعدم استقرار التدريب:

  • تصميم شامل NMS: يزيل YOLO26 بشكل أساسي معالجة ما بعد القمع غير الأقصى. هذا الاختراق يبسط منطق النشر ويقلل بشكل كبير من تقلب زمن الاستجابة، مما يجعله مثاليًا للروبوتات عالية السرعة والأنظمة المستقلة.
  • مُحسّن MuSGD: مستوحى من ابتكارات تدريب LLM (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مُحسّن MuSGD (مزيج من SGD Muon). وهذا يضمن تشغيل تدريبات عالية الاستقرار وتقارب أسرع بشكل ملحوظ.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة الخسارة البؤرية للتوزيع (DFL) بشكل استراتيجي، يحقق YOLO26 سرعات أعلى بكثير على وحدات المعالجة المركزية والأجهزة الطرفية مقارنة بسابقيه مثل YOLO11 و YOLOv8.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتحليل الصور الجوية الملتقطة بواسطة الطائرات بدون طيار ومدخلات مستشعرات إنترنت الأشياء.

مثال على التعليمات البرمجية: البساطة في العمل

تتيح لك Ultralytics تدريب النماذج ونشرها باستخدام بضع أسطر من التعليمات البرمجية. سواء كنت تستخدم YOLOv5 تقوم بالترقية إلى YOLO26 الموصى به، تظل الواجهة متسقة وبديهية.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Export the model for edge deployment
model.export(format="onnx")

الخلاصة

YOLOv5 كل منYOLO YOLOv5 بشكل كبير في تطوير مجال الرؤية الحاسوبية.YOLO قوة البحث عن البنية العصبية والتقطير، مما يجعله موضوعًا مثيرًا للاهتمام للباحثين. ومع ذلك، YOLOv5 تظل قوة عملية بفضل توازن أدائها ومتطلباتها المنخفضة من الذاكرة وسهولة استخدامها التي لا تضاهى.

بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، فإن التوصية هي الاستفادة من Ultralytics واعتماد YOLO26. فهي تجمع YOLOv5 النظام البيئي المحبوب وسهل الاستخدام لـ YOLOv5 والتطورات المعمارية الرائدة YOLOv5 يضمن دقة عالية المستوى واستنتاجات سريعة للغاية لكل من تطبيقات الذكاء الاصطناعي السحابية والحافة. قد يرغب المطورون أيضًا في استكشاف نماذج أخرى فعالة مثل YOLOv6 أو YOLOX اعتمادًا على قيود الأجهزة القديمة المحددة.


تعليقات