تخطي إلى المحتوى

YOLO YOLOv6.0: مقارنة شاملة بين أجهزة الكشف عن الأجسام الصناعية

أدى التطور السريع في مجال الرؤية الحاسوبية إلى ظهور بنى متخصصة للغاية مصممة خصيصًا للتطبيقات الصناعية. ومن بين هذه البنى، تبرز بنتان مهمتان بفضل تركيزهما على الأداء في الوقت الفعلي وكفاءة النشر: YOLO و YOLOv6.YOLOv6. توفر هذه الصفحة مقارنة تقنية متعمقة بين بناتهما ومقاييس الأداء ومنهجيات التدريب لمساعدتك في اختيار خيارات النشر المناسبة لك.

YOLO: البحث عن البنية العصبية يلتقي بالكشف عن الأجسام

تم تطويرYOLO بواسطة باحثين في مجموعة Alibaba،YOLO نهجًا جديدًا YOLO من خلال دمج البحث في الهندسة العصبية (NAS) بشكل مكثف في تصميمه الأساسي.

الابتكارات المعمارية

YOLO شبكة أساسية مُحسّنة لـ NAS تُسمى MAE-NAS، والتي تبحث تلقائيًا عن الهياكل الشبكية المثلى في ظل قيود زمنية محددة. وهذا يضمن توسع النموذج بكفاءة عبر ملفات تعريف الأجهزة المختلفة. ولتحسين دمج الميزات، تستخدم البنية شبكة RepGFPN (شبكة هرمية عامة للميزات المعاد معايرتها) فعالة، مما يعزز بشكل كبير التمثيل متعدد المقاييس.

علاوة على ذلك، يقدم النموذج تصميم "ZeroHead". من خلال إزالة الهياكل المعقدة متعددة الفروع في رأس الكشف، فإنه يحافظ على المعلومات المكانية بشكل أكثر فعالية مع تقليل الحمل الحسابي. تستفيد منهجية التدريب أيضًا من AlignedOTA (تخصيص النقل الأمثل المتوافق) وتقطير المعرفة القوي، مما يسمح للنماذج الطلابية الأصغر بالتعلم من شبكات المعلمين الأثقل.

تعرف على المزيد حول DAMO-YOLO

تعقيد التقطير

في حين أن تقطير المعرفة يساعدYOLO دقة عالية، إلا أنه يتطلب خط أنابيب تدريب متعدد المراحل. وهذا يزيد بشكل كبير من GPU المطلوبة GPU مقارنة بتدريب النماذج القياسية أحادية المرحلة.

YOLOv6.0: تعظيم الإنتاجية الصناعية

ابتكر قسم Meituan Vision AI YOLOv6.YOLOv6 الذي تم تصنيفه بوضوح على أنه كاشف للأجسام الصناعية، وقد تم تصميمه خصيصًا لزيادة الإنتاجية إلى أقصى حد على NVIDIA .

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
  • المؤسسة:Meituan
  • التاريخ: 2023-01-13
  • أرخايف:2301.05586
  • GitHub:meituan/YOLOv6

الميزات والتحسينات الرئيسية

تم تصميم YOLOv6.YOLOv6 على أساس البنية الأساسية EfficientRep الملائمة للأجهزة، مما يجعله سريعًا للغاية عند الاستفادة من التحسينات مثل TensorRT على وحدات معالجة الرسومات الحديثة. في إصداره v3.0، يدمج الشبكة وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين تحديد مواقع الأحجام المتنوعة للأجسام.

ميزة أخرى بارزة هي استراتيجية التدريب بمساعدة المرساة (AAT). تجمع AAT بين استقرار أجهزة الكشف القائمة على المرساة أثناء التدريب وسرعة الاستدلال لتصميم خالٍ من المرساة. ينتج عن هذا النهج الهجين تقاربًا ممتازًا دون التضحية بزمن انتقال النشر، مما يجعله خيارًا قويًا لمعالجة تدفقات الفيديو الضخمة في تحليلات المدن الذكية وأنظمة الدفع الآلي.

تعرف على المزيد حول YOLOv6

مقارنة الأداء

عند تقييم هذه النماذج للاستدلال في الوقت الفعلي، من الضروري تحقيق التوازن بين المعلمات وعمليات FLOPs والدقة. فيما يلي تقييم مفصل يقارن أداءها.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

بينماYOLO تفوقًا طفيفًا في المستوى الصغير (46.0 mAP 45.0 mAP)، يُظهر YOLOv6. YOLOv6 قابلية توسع فائقة، حيث يتفوق في المستويين المتوسط والكبير مع الحفاظ على أقل المعلمات المطلقة في تكوينه النانوي.

الاختيار بين الاثنين

إذا كانت بيئة الأجهزة الخاصة بك تسمح بإجراء عمليات بحث آلية مكثفة لتخصيص البنية الأساسية الخاصة بك، فإن نهج NASYOLO يكون فعالًا للغاية. ومع ذلك، إذا كنت تعتمد كليًا على GPU القياسي (مثل T4 أو A100)، فإن هياكل EfficientRep YOLOv6 غالبًا ما تترجم إلى معدل إطارات في الثانية (FPS) أعلى.

حالات الاستخدام والتوصيات

YOLOv6 الاختيار بينYOLO YOLOv6 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار DAMO-YOLO

YOLO خيار قوي لـ:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.

متى تختار YOLOv6

YOLOv6 في الحالات التالية:

  • النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
  • الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
  • تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

Ultralytics : تقديم YOLO26

على الرغم من أن كل منYOLO YOLOv6. YOLOv6 يتمتعان بقدرات عالية، إلا أنهما يعانيان من أنظمة بيئية مجزأة وقيود المهام الفردية وخطوط إنتاج معقدة. بالنسبة لفرق الهندسة الحديثة، توفر Ultralytics تجربة مطور أفضل بشكل كبير، وتبلغ ذروتها في YOLO26 الرائد.

صدر YOLO26 في يناير 2026، وهو يمثل المعيار الجديد لنشر الحوسبة السحابية والطرفية، حيث يعمل على تحسين متطلبات الذاكرة وكفاءة الحوسبة بشكل كبير.

لماذا تختار YOLO26؟

  1. تصميم شامل NMS: بناءً على مفاهيم من YOLOv10، يلغي YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يبسط بشكل كبير كود النشر ويقلل من تباين زمن الاستدلال عبر جميع الأجهزة الطرفية.
  2. تحسين فائق: يستخدم YOLO26 محسّن MuSGD، وهو مزيج من SGD Muon (مستوحى من نماذج اللغة الكبيرة)، مما ينتج عنه عمليات تدريب عالية الاستقرار وتقارب أسرع.
  3. تعدد استخدامات الأجهزة: من خلال تطبيق تقنية DFL Removal (Distribution Focal Loss)، تم تبسيط رؤوس الإخراج، مما عزز توافق الأجهزة الطرفية. في الواقع، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مما يجعله متفوقًا بشكل كبير على YOLOv6 بيئات الأجهزة المحمولة أو الأجهزة الطرفية المتصلة بالإنترنت.
  4. دقة محسّنة: باستخدام ProgLoss + STAL، يشهد YOLO26 تحسينات كبيرة في اكتشاف الأجسام الصغيرة، مما يجعله الخيار الأمثل للصور الجوية وفحص العيوب.
  5. تنوع لا مثيل له: على عكس النماذج الصناعية التي تقوم فقط بإنشاء مربعات الحدود، تدعم عائلة YOLO26 المهام متعددة الوسائط، بما في ذلك تصنيف الصور، وتقسيم الحالات، وتقدير الوضع، ومربعات الحدود الموجهة (OBB).

تعرف على المزيد حول YOLO26

تجربة نظام بيئي سلس

تقوم Ultralytics بتحويل دورة حياة التعلم الآلي بالكامل. لم يعد تدريب النموذج عملية معقدة متعددة المراحل. بفضل زيادة البيانات تلقائيًا، وضبط المعلمات الفائقة الموحدة، والتصدير بنقرة واحدة إلى تنسيقات مثل ONNXو OpenVINOو CoreML، يمكنك الانتقال من مجموعة البيانات إلى الإنتاج في غضون ساعات، وليس أسابيع.

بالإضافة إلى ذلك، تشتهر Ultralytics بكفاءة ذاكرتها، حيث تتجنب الاختناقات الهائلة في ذاكرة VRAM التي تعاني منها بنى المحولات مثل RT-DETR.

مثال على رمز البدء السريع

يعد التدريب والاستدلال باستخدام Ultralytics مثل YOLO26 أمرًا بسيطًا للغاية. يوضح Python التالي كيف يمكنك البدء فورًا في تتبع الكائنات باستخدام بضع أسطر من التعليمات البرمجية:

from ultralytics import YOLO

# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)

الخلاصة

يعد كل منYOLO YOLOv6. YOLOv6 إنجازين هندسيين مذهلين يوسعان حدود الكشف عن الأجسام الصناعية. ومع ذلك، فهما أدوات متخصصة للغاية تتطلب في كثير من الأحيان إعدادات معقدة وقيود صارمة على الأجهزة.

بالنسبة للمطورين والباحثين الذين يطلبون توازنًا مثاليًا في الأداء وقدرات متعددة المهام ونظامًا بيئيًا يتم صيانته بشكل جيد، فإن Ultralytics YOLO26 لا مثيل له. من خلال مزج المحسّنات المستوحاة من LLM مع بنية نظيفة NMS يبسط YOLO26 نشر الذكاء الاصطناعي مع توفير دقة متطورة عبر بيئات الحافة والسحابة.

إذا كنت تقوم بتقييم نماذج لمشروع جديد في مجال الرؤية الحاسوبية، فإننا نوصي بشدة باستكشاف إمكانات Ultralytics YOLO . قد تجد أيضًا أنه من المفيد مقارنة هذه النماذج مع بنى أخرى مثل EfficientDet أو مع نماذج سابقة مثل YOLO11 لفهم تطور الذكاء الاصطناعي للرؤية في الوقت الفعلي بشكل كامل.


تعليقات