YOLOv6.0 مقابل YOLOv8: مقارنة تقنية شاملة
يعد اختيار البنية المثلى للكشف عن الكائنات قرارًا محوريًا في تطوير الرؤية الحاسوبية، حيث يؤثر على كل شيء بدءًا من زمن الاستجابة للاستدلال إلى مرونة النشر. يوفر هذا الدليل تحليلاً تقنيًا متعمقًا يقارن بين YOLOv6.0، الذي طورته شركة Meituan، و Ultralytics YOLOv8وهو نموذج متطور من Ultralytics. نحن ندرس خصائصها المعمارية ومقاييس أدائها وملاءمتها للتطبيقات الواقعية لمساعدتك على اتخاذ قرار مستنير.
على الرغم من أن كلا الإطارين يقدمان نتائج مبهرة، إلا أن YOLOv8 يتميز بتعدد استخداماته التي لا مثيل لها، ومنظومة عمل تركز على المطورين، وتوازن فائق بين السرعة والدقة عبر منصات الأجهزة المتنوعة.
YOLOv6.0
المؤلفون: تشوي لي، ولولو لي، ويفي قنغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشانغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغ شيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics
YOLOv6.0 هو إطار عمل للكشف عن الكائنات أحادي المرحلة تم تصميمه مع التركيز بشكل أساسي على التطبيقات الصناعية. من خلال إعطاء الأولوية لتصاميم الشبكات الملائمة للأجهزة، يهدف إلى زيادة إنتاجية الاستدلال إلى أقصى حد على وحدات معالجة الرسومات المخصصة، مما يجعله منافسًا قويًا للبيئات التي يكون فيها زمن الاستجابة مقيدًا بشكل صارم بسرعات خط الإنتاج.
البنية والميزات الرئيسية
بُنيت بنية YOLOv6.0 حول مفهوم إعادة المعلمة. فهي تستخدم العمود الفقري EfficientRepbone والعنق Rep-PAN، مما يسمح للشبكة بأن يكون لها هياكل معقدة أثناء التدريب ولكن يتم تبسيطها إلى طبقات تلافيفية مبسطة أثناء الاستدلال. تساعد عملية "إعادة المعلمات الهيكلية" هذه على تقليل زمن الاستجابة دون التضحية بقدرة استخراج الميزة.
بالإضافة إلى ذلك، يستخدم YOLOv6.0 تصميم رأس منفصل، يفصل بين مهام التصنيف والانحدار، ويدمج استراتيجيات تعيين التسمية SimOTA. كما يركز الإطار أيضًا على التدريب الواعي بالتقدير الكمي (QAT) لتسهيل النشر على الأجهزة المتطورة التي تتطلب دقة حسابية أقل.
نقاط القوة والضعف
يتألق هذا النموذج في سيناريوهات التصنيع الصناعي حيث تتوفر وحدات معالجة الرسومات المتطورة، مما يوفر سرعات استدلال تنافسية. يساعد تركيزه على التكميم أيضًا في النشر على مسرعات أجهزة محددة. ومع ذلك، تم تصميم YOLOv6 في المقام الأول لاكتشاف الأجسام، ويفتقر إلى الدعم الأصلي والسلس لمهام الرؤية الحاسوبية الأوسع نطاقًا مثل تقدير الوضع أو الصناديق المحدودة الموجهة الموجودة في أطر عمل أكثر شمولاً. علاوة على ذلك، فإن النظام الإيكولوجي أقل شمولاً، مما قد يعني المزيد من الاحتكاك عند التكامل مع أدوات MLOps التابعة لجهات خارجية أو العثور على دعم المجتمع.
Ultralytics YOLOv8
المؤلفون: جلين جوتشر، وأيوش تشوراسيا، وجينغ كيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
Arxiv: لا شيء
GitHub: ultralytics
المستندات: https:yolov8
Ultralytics YOLOv8 يمثّل قفزة كبيرة إلى الأمام في سلسلة YOLO فهو مصمم ليس فقط كنموذج بل كإطار عمل موحد للذكاء الاصطناعي العملي. إنه يعيد تعريف الأداء المتطور (SOTA) من خلال الجمع بين الكفاءة المعمارية وتجربة المستخدم البديهية، مما يجعل الرؤية الحاسوبية المتقدمة في متناول الباحثين والمطورين على حد سواء.
البنية والميزات الرئيسية
يُقدِّم YOLOv8 آلية كشف عالية الكفاءة خالية من الارتكاز، مما يلغي الحاجة إلى حسابات صندوق الارتكاز اليدوية ويحسِّن التعميم على مجموعات البيانات المتنوعة. وتتميز بنيته بعمود فقري جديد يستخدم وحدات C2f (وصلات جزئية متقاطعة مع الاندماج)، والتي تعزز تدفق التدرج وثراء الميزة مع الحفاظ على بصمة خفيفة الوزن.
يقوم الرأس المنفصل في YOLOv8 بمعالجة الكائنات والتصنيف والانحدار بشكل مستقل، مما يؤدي إلى دقة تقارب أعلى. والأهم من ذلك أن النموذج يدعم مجموعة كاملة من المهام -اكتشاف الكائنات، وتجزئة النماذج، وتصنيف الصور، وتقدير الوضعية، والصناديق المحدودة الموجهة (OBB)- ضمن حزمة Python واحدة قابلة للتثبيت.
لماذا تختار YOLOv8
- سهولة الاستخدام: باستخدام
pip install ultralytics، يحصل المطورون على إمكانية الوصول إلى CLI برمجة تطبيقات CLI Python API قوية. هذه الواجهة البرمجية المبسطة تجربة المستخدم تقليل الوقت المستغرق من التثبيت إلى التدريب الأول من ساعات إلى دقائق. - نظام بيئي جيد الصيانة: توفر Ultralytics نظاماً بيئياً قوياً بما في ذلك Ultralytics HUB لإدارة النماذج، ومناقشات GitHub النشطة، والتكامل السلس مع أدوات مثل TensorBoard و MLflow.
- توازن الأداء: كما هو موضّح في المقاييس أدناه، يحقق YOLOv8 أداءً فائقًا mAP الوقت الحقيقي على كل من الأجهزة الطرفية والخوادم السحابية.
- تعدد الاستخدامات: على عكس المنافسين الذين يركزون فقط على الاكتشاف، يتعامل YOLOv8 مع التجزئة والتتبع والتصنيف بشكل أصلي، مما يتيح لك التنقل بين المهام دون تعلم إطار عمل جديد.
مقارنة الأداء
يعرض الجدول التالي مقارنة تفصيلية لمقاييس الأداء على مجموعة بيانات COCO val2017. تشير النقاط البارزة إلى أفضل أداء في كل فئة.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0 م | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0L | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
التحليل النقدي
تكشف البيانات عن مزايا واضحة لبنية Ultralytics :
- الكفاءة واستخدام الموارد: يستخدم YOLOv8 باستمرار عددًا أقل بكثير من المعلمات وعمليات التشغيل الحراري لتحقيق دقة مماثلة أو متفوقة. على سبيل المثال YOLOv8s يضاهي دقة YOLOv6.0s (حوالي 45 mAP) ولكنه يتطلب معلمات أقل بنسبة 40٪ تقريبًا و37٪ أقل من عمليات التشغيل المتكرر. يُترجم هذا التخفيض مباشرةً إلى استهلاك أقل للذاكرة وأوقات تدريب أسرع.
- الريادة في الدقة: في الطرف الأعلى من الطيف، تتخطى موديلات YOLOv8 (M، L، X) حدود الدقة، حيث تصل دقة YOLOv8x إلى 53.9 mAP متفوقة بذلك على أكبر متغيرات YOLOv6 المدرجة.
- استدلالCPU : يوفر YOLOv8 معايير شفافة لاستدلال CPU عبر ONNXمما يوضح قابليته للنشر على الأجهزة القياسية دون الحاجة إلى مسرعات متخصصة. هذا أمر بالغ الأهمية للتطبيقات القابلة للتطوير في مجال الخدمات اللوجستية أو البيع بالتجزئة حيث قد لا تكون وحدات معالجة الرسومات متاحة دائمًا.
كفاءة الذاكرة
تؤدي بنية YOLOv8 الفعالة إلى انخفاض متطلبات ذاكرة GPU أثناء التدريب مقارنةً بالعديد من النماذج القائمة على المحولات أو الشبكات التلافيفية الأثقل. يسمح هذا للمطورين بتدريب أحجام دفعات أكبر أو استخدام دقة أعلى على أجهزة من فئة المستهلك.
حالات الاستخدام والتطبيقات
غالباً ما يعتمد الاختيار بين هذه النماذج على بيئة النشر المحددة ومتطلبات المهام.
أين يتفوق YOLOv8
YOLOv8 هو الخيار الموصى به للغالبية العظمى من مشاريع الرؤية الحاسوبية نظرًا لقدرته على التكيف:
- حافة الذكاء الاصطناعي وإنترنت الأشياء: نظرًا لانخفاض عدد معلماته وكفاءته العالية، يُعد YOLOv8 مثاليًا لأجهزة مثل Raspberry Pi أو NVIDIA Jetson.
- الأنظمة متعددة المهام: تستفيد المشاريع التي تتطلب تعقب الأجسام (مثل مراقبة حركة المرور) أو التجزئة (مثل التصوير الطبي) من قاعدة الرموز الموحدة لـ YOLOv8.
- النماذج الأولية السريعة: تسمح سهولة الاستخدام والأوزان الواسعة المدربة مسبقاً للشركات الناشئة وفرق البحث بالتكرار بسرعة.
- حلول المؤسسات: مع التكامل في منصات مثل Roboflow ودعم تنسيقات مثل CoreML و TFLiteفإن YOLOv8 يتدرج بسلاسة من النموذج الأولي إلى الإنتاج.
حيث يناسب YOLOv6.0
يظل YOLOv6.0 خيارًا قويًا للسيناريوهات الصناعية المتخصصة:
- خطوط مخصصة GPU : في المصانع ذات خطوط الأنابيب القائمة التي تستخدم وحدات معالجة الرسومات NVIDIA T4/A10 التي تشغل TensorRT يمكن أن تحقق تحسينات YOLOv6 الخاصة بالأجهزة مكاسب هامشية في زمن الاستجابة.
- التكامل القديم: بالنسبة للأنظمة المصممة بالفعل حول العمود الفقري على غرار RepVGG، قد يتطلب دمج YOLOv6 تعديلات معمارية أقل.
التدريب وخبرة المطورين
من أهم ما يميزها هو تجربة المطورين. تعطي Ultralytics الأولوية لنهج منخفض الكود وعالي الأداء الوظيفي.
التدريب السلس مع YOLOv8
يعد تدريب نموذج YOLOv8 أمرًا بسيطًا ومباشرًا. يتعامل إطار العمل مع زيادة البيانات، وتطور المعرف الفائق، والرسم البياني تلقائيًا.
from ultralytics import YOLO
# Load a model
model = YOLO("yolov8n.pt") # load a pretrained model
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("path/to/image.jpg")
في المقابل، بينما يوفر YOLOv6 نصوصًا برمجية للتدريب، إلا أنه غالبًا ما يتضمن المزيد من التكوين اليدوي لمتغيرات البيئة والتبعيات. يعمل تكامل YOLOv8 مع Ultralytics HUB على تبسيط ذلك من خلال توفير إدارة مجموعة البيانات على شبكة الإنترنت وتدريب النموذج بنقرة واحدة.
دعم النظام البيئي
مجتمع Ultralytics هو أحد أكثر المجتمعات نشاطًا في مجال الذكاء الاصطناعي. سواء كنت بحاجة إلى مساعدة بشأن مجموعات البيانات المخصصة أو خيارات التصدير المتقدمة، فإن الموارد متاحة بسهولة عبر المستندات الشاملة ومنتديات المجتمع.
الخلاصة
في حين يقدم YOLOv6.0 حلاً قوياً لمهام الكشف الصناعية المحددة GPU, Ultralytics YOLOv8 الحل المتفوق والشامل للرؤية الحاسوبية الحديثة. حيث توفر كفاءته المعمارية دقة أعلى لكل معلم، كما أن تعدد استخداماته عبر مهام الكشف والتجزئة والتصنيف تجعله مقاومًا للمستقبل. وبالإضافة إلى نظام بيئي لا مثيل له وسهولة الاستخدام، يمكّن YOLOv8 المطورين من بناء حلول الذكاء الاصطناعي ونشرها وتوسيع نطاقها بثقة.
استكشف نماذج أخرى
بالنسبة للمهتمين بالمشهد الأوسع لاكتشاف الأجسام، يدعم Ultralytics مجموعة واسعة من النماذج. يمكنك مقارنة YOLOv8 القديم YOLOv5 لفهم تطور البنية المعمارية أو استكشاف أحدث طرازات YOLO11 الأحدث على الإطلاق في الأداء. بالإضافة إلى ذلك، بالنسبة للنهج القائم على المحولات، فإن RT-DETR مزايا فريدة في الكشف في الوقت الحقيقي.