تخطي إلى المحتوى

YOLOv6.0 مقابل RTDETRv2: مواجهة بين الشبكات العصبية الصناعية والمحولات في الوقت الحقيقي

في مجال الرؤية الحاسوبية سريع التطور، غالبًا ما تدور المعركة حول بنية الكشف عن الأجسام الأكثر كفاءة بين الشبكات العصبية التلافيفية (CNN) الراسخة والنماذج الناشئة القائمة على المحولات. تبحث هذه المقارنة بينYOLOv6.YOLOv6، وهي شبكة عصبية تلافيفية قوية ومُحسّنة للتطبيقات الصناعية، و RTDETRv2، وهي محول كشف في الوقت الفعلي مصمم لتحدي YOLO .

على الرغم من أن كلا النموذجين يوفران إمكانات مذهلة، فإن فهم المفاضلات المعمارية بينهما أمر بالغ الأهمية لاختيار الأداة المناسبة لمشروعك. للمطورين الذين يبحثون عن حل موحد يجمع بين أفضل ما في العالمين — السرعة والدقة وسهولة الاستخدام — يوفر Ultralytics توفر بدائل متطورة مثل YOLO26.

مقارنة مقاييس الأداء

يوضح الجدول التالي الاختلافات في الأداء بين النماذج. بينما يركز YOLOv6. YOLOv6 على الإنتاجية الأولية على الأجهزة المخصصة، يهدف RTDETRv2 إلى القضاء على اختناقات ما بعد المعالجة من خلال بنية المحول.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

YOLOv6.0: المتخصص الصناعي

تم تطوير YOLOv6 بواسطة Meituan وإصداره في أوائل عام 2023، وهو يمثل علامة فارقة مهمة في مجال الكشف عن الكائنات في مرحلة واحدة. وقد تم تصميمه خصيصًا للتطبيقات الصناعية التي تتطلب قيودًا على الأجهزة - مثل تلك الموجودة في أتمتة المصانع أو الخدمات اللوجستية - مما يستلزم تعظيم فائدة وحدات معالجة الرسومات (GPU) مثل NVIDIA T4.

الهندسة المعمارية والتصميم

يقدم YOLOv6 بنية RepBi-PAN، وهي شبكة تجميع مسارات ثنائية الاتجاه معززة بكتل من نوع RepVGG. يتيح هذا التصميم دمج الميزات بكفاءة مع الحفاظ على سرعات استدلال عالية. يستخدم النموذج أيضًا التدريب بمساعدة المراسي (AAT)، وهي استراتيجية هجينة تجمع بين مزايا النماذج القائمة على المراسي وتلك الخالية منها لتحسين استقرار التقارب.

نقاط القوة الرئيسية

  • GPU : على المسرعات المخصصة، توفر الإصدارات "Nano" و"Small" معدلات إطارات عالية بشكل لا يصدق، مما يجعلها مناسبة لتحليلات الفيديو عالية السرعة.
  • سهولة التكمية: تم تصميم البنية مع مراعاة التكمية ، مما يسهل النشر على الأجهزة الطرفية باستخدام TensorRT.
  • التركيز الصناعي: تم تحسين ميزات مثل الرأس المنفصل لمهام الفحص الصناعي المحددة التي يجب فيها تقليل تقلب زمن الاستجابة إلى الحد الأدنى.

تعرف على المزيد حول YOLOv6

RTDETRv2: منافس المحولات

RTDETRv2، الذي نشأ من Baidu، يكرر النسخة الأصلية RT-DETR (Real-Time DEtection TRansformer). ويهدف إلى إثبات أن البنى القائمة على المحولات يمكن أن تتفوق على YOLOs القائمة على CNN من حيث السرعة والدقة من خلال معالجة الاختناقات الحسابية المرتبطة بمعالجة الميزات متعددة المقاييس.

الهندسة المعمارية والتصميم

يستخدم RTDETRv2 مشفرًا هجينًا يعالج الميزات متعددة المقاييس بكفاءة، إلى جانب آلية اختيار الاستعلامات IoU. ومن الميزات الفريدة لـ RTDETRv2 قدرته على التكيف، مما يتيح للمستخدمين ضبط عدد طبقات المشفر في وقت الاستدلال. وهذا يتيح ضبطًا مرنًا بين السرعة والدقة دون الحاجة إلى إعادة التدريب، وهي ميزة مهمة في البيئات الديناميكية.

نقاط القوة الرئيسية

  • NMS: بصفته محولًا، يتنبأ RTDETRv2 بالأشياء مباشرةً، مما يلغي الحاجة إلى Non-Maximum Suppression (NMS). وهذا يبسط عمليات النشر ويقلل من تقلبات زمن الاستجابة.
  • دقة عالية: يحقق النموذج متوسط دقة متوسط مثير للإعجاب (mAP)، لا سيما في COCO وغالبًا ما يتفوق على شبكات CNN المماثلة في المشاهد المعقدة.
  • التنوع: القدرة على ضبط سرعة الاستدلال ديناميكيًا تجعله قابلاً للتكيف بدرجة عالية مع الموارد الحاسوبية المتقلبة.

تعرف على المزيد حول RT-DETR

ميزة Ultralytics: لماذا تختار YOLO26؟

بينما يتفوق YOLOv6. YOLOv6 و RTDETRv2 في مجالاتهما المتخصصة، يوفر Ultralytics حلاً شاملاً يعالج قيود كلاهما. يجمع YOLO26، أحدث تطور في YOLO بين مزايا المحولات NMS والكفاءة الأولية لشبكات CNN.

سير العمل المتكامل

Ultralytics لك استخدام Ultralytics التبديل بين البنى بشكل سلس. يمكنك تدريب YOLOv6 واختبار RT-DETR ونشر نموذج YOLO26 باستخدام نفس واجهة برمجة التطبيقات الموحدة وتنسيق مجموعة البيانات.

كفاءة وهندسة فائقة

يستخدم YOLO26 تصميمًا أصليًا شاملاً NMS، وهو اختراق رائد تم تطويره لأول مرة في YOLOv10. وهذا يلغي الحاجة إلى المعالجة اللاحقة الثقيلة التي يتطلبها YOLOv6 تجنب الاستهلاك الهائل للذاكرة المرتبط بآليات الانتباه في RTDETRv2.

  • محسّن MuSGD: مستوحى من ابتكارات تدريب LLM، يضمن محسّن MuSGD الجديد تدريبًا مستقرًا وتقاربًا أسرع، مما يوفر استقرارًا واسع النطاق لمهام الرؤية.
  • CPU أسرع بنسبة 43٪ CPU : من خلال إزالة Distribution Focal Loss (DFL) وتحسين بنية الحوسبة الطرفية، أصبح YOLO26 أسرع بكثير على وحدات المعالجة المركزية مقارنةً بـ YOLOv6 RTDETRv2، مما يجعله الخيار المثالي للأجهزة المحمولة وأجهزة إنترنت الأشياء.
  • ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة على تحسين اكتشاف الأجسام الصغيرة، وهو مجال بالغ الأهمية غالبًا ما تواجه فيه النماذج الصناعية التقليدية صعوبات.

تنوع لا مثيل له

على عكس YOLOv6. YOLOv6، الذي يختص في المقام الأول بالكشف، فإن Ultralytics متعددة الوسائط بطبيعتها. يدعم إطار عمل واحد ما يلي:

سهولة الاستخدام والنظام البيئي

توفر Ultralytics تجربة "من الصفر إلى القمة". يمكن للمطورين الاستفادة من Ultralytics لإدارة مجموعات البيانات والتدريب في السحابة ونشرها في تنسيقات متنوعة مثل ONNXو OpenVINOو CoreML.

يتم الحفاظ على النظام البيئي بشكل فعال، مما يضمن بقاء مشاريعك متوافقة مع أحدث إصدارات Python وأحدث برامج تشغيل الأجهزة - وهو عامل حاسم غالبًا ما يتم تجاهله عند استخدام مستودعات الأبحاث الثابتة.

مثال على كود التدريب

تدريب نموذج متطور باستخدام Ultralytics بسيط. يوضح مقتطف الشفرة التالي كيفية تحميل وتدريب نموذج YOLO26n الفعال:

from ultralytics import YOLO

# Load the YOLO26 Nano model (End-to-End, NMS-free)
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset for 100 epochs
# The system automatically handles data downloading and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")

الخلاصة

إذا كان تطبيقك يتطلب GPU صناعية بحتة على أجهزة قديمة، فإن YOLOv6.0 يظل منافسًا قويًا. بالنسبة لسيناريوهات البحث التي تتطلب آليات انتباه قائمة على المحولات، يوفر RTDETRv2 المرونة. ومع ذلك، بالنسبة لمعظم عمليات النشر في العالم الحقيقي التي تتطلب توازنًا بين السرعة والدقة واستخدام الذاكرة المنخفضة وقابلية الصيانة على المدى الطويل، فإن Ultralytics هو الخيار الأفضل. يفتح تصميمه الشامل CPU إمكانيات جديدة لـ Edge AI لم تكن الأجيال السابقة قادرة على تحقيقها.

تعرف على المزيد حول YOLO26


تعليقات