YOLOv6.0 مقابل YOLOv10: مقارنة تقنية مفصلة
يعد اختيار النموذج الأمثل للرؤية الحاسوبية أمرًا محوريًا لنجاح مبادرات الذكاء الاصطناعي، حيث يوازن بين عوامل مثل زمن الاستدلال والدقة والكفاءة الحسابية. تفحص هذه المقارنة التقنية الشاملة بنيتين بارزتين لاكتشاف الأجسام: YOLOv6.0، المصممة للسرعة الصناعية، و YOLOv10المعروف بكفاءته المتكاملة في الوقت الحقيقي. نقوم بتحليل الابتكارات المعمارية والمقاييس المعيارية وحالات الاستخدام المثالية لتوجيه عملية الاختيار.
YOLOv6.0: سرعة ودقة من الدرجة الصناعية
YOLOv6.0، الذي طوره قسم ذكاء الرؤية في Meituan، هو إطار عمل للكشف عن الأجسام أحادي المرحلة مُحسَّن خصيصًا للتطبيقات الصناعية. تم إصداره في أوائل عام 2023، وهو يعطي الأولوية للتصميمات الملائمة للأجهزة لزيادة الإنتاجية على وحدات معالجة الرسومات والأجهزة المتطورة، مما يلبي المتطلبات الصارمة للاستدلال في الوقت الفعلي في التصنيع والخدمات اللوجستية.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمةميتوان
- التاريخ: 2023-01-13
- اركسيف:https://arxiv.org/abs/2301.05586
- جيثبhttps://github.com/meituan/YOLOv6
- المستنداتhttps://docs.ultralytics.com/models/yolov6/
البنية والميزات الرئيسية
يقدم YOLOv6.0 "إعادة تحميل كامل النطاق" لهيكله، مع دمج العديد من التقنيات المتقدمة لتعزيز استخراج الميزات وسرعة التقارب:
- العمود الفقري الفعال لإعادة المعادلات: يستخدم عمودًا فقريًا مدركًا للأجهزة يسمح بتبسيط هياكل التدريب المعقدة إلى طبقات استدلال أسرع، مما يؤدي إلى تحسين FLOPS دون التضحية بالدقة.
- التسلسل ثنائي الاتجاه (BiC): يستخدم تصميم العنق التسلسل الثنائي الاتجاه (BiC) لتحسين إشارات التوطين، مما يضمن دمج الميزات بشكل أفضل عبر مقاييس مختلفة.
- التدريب بمساعدة المرساة (AAT): على الرغم من أن YOLOv6.0 خالٍ من المرساة بشكل أساسي، إلا أنه يعيد تقديم الفروع المساعدة القائمة على المرساة أثناء التدريب لتحقيق الاستقرار في التقارب وتعزيز الأداء.
نقاط القوة والضعف
نقاط القوة: يتفوقYOLOv6.0 في السيناريوهات التي تتطلب إنتاجية عالية. يسمح دعمه لتكميم النماذج بالنشر الفعال على المنصات المتنقلة والأنظمة المدمجة. المتغيرات "Lite" مفيدة بشكل خاص للبيئات CPU.
نقاط الضعف: باعتباره نموذجًا يركز بشكل صارم على اكتشاف الأجسام، فإنه يفتقر إلى الدعم الأصلي للمهام الأوسع نطاقًا مثل تجزئة المثيل أو تقدير الوضع الموجود في أطر العمل الموحدة مثل YOLO11. بالإضافة إلى ذلك، بالمقارنة مع النماذج الأحدث، فإن كفاءة المعلمات الخاصة به أقل، مما يتطلب المزيد من الذاكرة لمستويات دقة مماثلة.
حالة الاستخدام المثالية: الأتمتة الصناعية
يعد YOLOv6.0 مرشحًا قويًا لأتمتة التصنيع، حيث يجب أن تعالج الكاميرات الموجودة على خطوط التجميع التغذية عالية الدقة بسرعة detect العيوب أو فرز العناصر.
YOLOv10: حدود الكفاءة المتكاملة
تم تقديم YOLOv10 من قِبل باحثين في جامعة تسينغهوا في مايو 2024، وهو يدفع حدود عائلة YOLO من خلال إلغاء الحاجة إلى الكبح غير الأقصى (NMS) أثناء المعالجة اللاحقة. يضعه هذا الابتكار كنموذج من الجيل التالي للتطبيقات ذات زمن الاستجابة الحرجة.
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمةجامعة تسينغهوا
- التاريخ: 2024-05-23
- اركسيف:https://arxiv.org/abs/2405.14458
- جيثبhttps://github.com/THU-MIG/yolov10
- المستنداتhttps://docs.ultralytics.com/models/yolov10/
البنية والميزات الرئيسية
يتبنى YOLOv10 استراتيجية تصميم شاملة قائمة على الكفاءة والدقة:
- تدريبNMS: من خلال استخدام التعيينات المزدوجة المتسقة (واحد إلى متعدد للتدريب، وواحد إلى واحد للاستدلال)، يتنبأ YOLOv10 بأفضل مربع واحد لكل كائن. يزيل هذا الأمر النفقات الحسابية الزائدة وتباين زمن الاستجابة المرتبط بالمعالجة اللاحقة NMS .
- تصميم نموذج شامل: تتميز هذه البنية برؤوس تصنيف خفيفة الوزن وتصغير حجم القناة المكانية المنفصلة عن القناة المكانية، مما يقلل بشكل كبير من معلمات النموذج والتكلفة الحسابية.
- تصميم الكتلة الموجهة بالترتيب: لتحسين الكفاءة، يستخدم النموذج تصميم الكتل الموجهة حسب الرتبة لتقليل التكرار في المراحل التي تكون فيها معالجة الميزات أقل أهمية.
نقاط القوة والضعف
نقاط القوة: يوفرYOLOv10 مفاضلة فائقة بين السرعة والدقة، وغالبًا ما يحقق أعلى mAP بمعلمات أقل بكثير من النماذج السابقة. إن تكامله مع نظام Ultralytics Python البيئي يجعل من السهل للغاية تدريبه ونشره جنبًا إلى جنب مع النماذج الأخرى.
نقاط الضعف: نظرًا لكونه إدخالًا جديدًا نسبيًا، فإن موارد المجتمع وأدوات الطرف الثالث لا تزال تنمو. مثل YOLOv6 فهو مخصص للكشف، في حين أن المستخدمين الذين يحتاجون إلى قدرات متعددة المهام قد يفضلون YOLO11.
التحذير: اختراق الكفاءة
تسمح إزالة NMS لـ YOLOv10 بتحقيق زمن استنتاج مستقر، وهو عامل حاسم للأنظمة ذات الأهمية الحرجة للسلامة مثل المركبات ذاتية القيادة حيث يجب أن يكون وقت المعالجة محدداً.
تحليل الأداء: المقاييس والمعايير المرجعية
يقارن الجدول التالي أداء YOLOv6.0 و YOLOv10 على مجموعة بيانات COCO . تشمل المقاييس الرئيسية حجم النموذج، ومتوسط متوسط الدقةmAP)، وسرعة الاستدلال على CPU GPU.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0 م | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0L | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
الرؤى الرئيسية
- كفاءة المعلمة: يُظهر YOLOv10 كفاءة ملحوظة. على سبيل المثال، يحقق YOLOv10s mAP معلمات أعلى (46.7%) من YOLOv6.0s (45.0%) مع استخدام أقل من نصف المعلمات (7.2M مقابل 18.5M). هذه البصمة المخفضة للذاكرة أمر حيوي لأجهزة الذكاء الاصطناعي المتطورة.
- زمن الاستجابة: في حين أن YOLOv6.0n يُظهر زمن انتقال TensorRT الخام أسرع قليلاً (1.17 مللي ثانية مقابل 1.56 مللي ثانية)، فإن YOLOv10 يلغي خطوة NMS والتي غالبًا ما تستهلك وقتًا إضافيًا في خطوط الأنابيب في العالم الحقيقي لا يتم تسجيله في أوقات استدلال النموذج الخام.
- الدقة: عبر جميع المقاييس تقريبًا، يوفر YOLOv10 دقة أعلى، مما يجعله خيارًا أكثر قوة لاكتشاف الأجسام الصعبة في البيئات المعقدة.
الاستخدام والتنفيذ
يوفر Ultralytics تجربة مبسطة لاستخدام هذه النماذج. إن YOLOv10 مدعوم أصلاً في ultralytics حزمة، مما يسمح بسلاسة التدريب والتنبؤ
تشغيل YOLOv10 مع Ultralytics
يمكنك تشغيل YOLOv10 باستخدام واجهة برمجة تطبيقات Python ببضعة أسطر من التعليمات البرمجية. وهذا يسلط الضوء على سهولة الاستخدام المتأصلة في نظام Ultralytics البيئي.
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Run inference on an image
results = model.predict("path/to/image.jpg", save=True)
# Train the model on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)
استخدام YOLOv6.0
عادةً ما يتطلب YOLOv6.0 استنساخ مستودع Meituan الرسمي للتدريب والاستدلال، لأنه يتبع بنية قاعدة رموز مختلفة.
# Clone the YOLOv6 repository
git clone https://github.com/meituan/YOLOv6
cd YOLOv6
pip install -r requirements.txt
# Inference using the official script
python tools/infer.py --weights yolov6s.pt --source path/to/image.jpg
الخاتمة: اختيار النموذج المناسب
يمثل كلا النموذجين إنجازات كبيرة في مجال الرؤية الحاسوبية. لا يزال YOLOv6.0 خيارًا قويًا للأنظمة الصناعية القديمة المحسّنة خصيصًا لهندستها. ومع ذلك YOLOv10 يوفر بشكل عام عائدًا أفضل على الاستثمار في المشاريع الجديدة نظرًا لبنيته NMS وكفاءة المعلمات الفائقة والدقة الأعلى.
للمطورين الذين يبحثون عن أقصى درجات التنوع ودعم النظام البيئي, Ultralytics YOLO11 يوصى به بشدة. لا يوفر YOLO11 أداءً متطورًا في الكشف فحسب، بل يدعم أيضًا بشكل أصلي تقدير الوضعية و OBB والتصنيف ضمن حزمة واحدة جيدة الصيانة. يضمن نظام Ultralytics البيئي كفاءة عمليات التدريب، وانخفاض استخدام الذاكرة، وسهولة التصدير إلى تنسيقات مثل ONNX و TensorRTمما يمكّنك من نشر حلول ذكاء اصطناعي قوية بثقة.
مزيد من القراءة
- استكشف عالم متعدد الاستخدامات YOLO11 للذكاء الاصطناعي للرؤية متعددة المهام.
- مقارنة YOLOv10 مقابل RT-DETR للكشف القائم على المحولات.
- تعرف على كيفية تصدير النماذج لتحقيق أقصى سرعة في النشر.