YOLOv8 YOLOv6. YOLOv6: نظرة متعمقة على الكشف عن الكائنات في الوقت الفعلي
يتميز مجال الرؤية الحاسوبية بالتكرار السريع والمنافسة. ومن المعالم البارزة في هذا التطور ما يلي Ultralytics YOLOv8، وهو محرك قوي متعدد الاستخدامات تم إصداره في أوائل عام 2023، و YOLOv6.YOLOv6، وهو كاشف عالي الإنتاجية من Meituan. في حين أن كلا النموذجين يهدفان إلى حل مشكلة الكشف عن الكائنات في الوقت الفعلي، إلا أنهما يتعاملان معها بفلسفات مختلفة فيما يتعلق بالهندسة المعمارية وسهولة الاستخدام والنشر.
تستكشف هذه المقارنة الفروق التقنية بين هذه البنى، مما يساعد المطورين على اختيار الأداة المناسبة للتطبيقات التي تتراوح من المركبات ذاتية القيادة إلى التفتيش الصناعي.
مقاييس الأداء
عند اختيار نموذج للإنتاج، غالبًا ما يكون التوازن بين سرعة الاستدلال ومتوسط الدقة (mAP) هو العامل الحاسم. يوضح الجدول أدناه أداء كلا النموذجين على COCO وهي معيار قياسي لاكتشاف الأجسام.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
بينما يُظهر YOLOv6.0 أداءً تنافسيًا على GPU المخصصة، Ultralytics YOLOv8 تعدد استخدامات استثنائي، حيث تحافظ على دقة عالية في جميع المقاييس مع توفير سهولة استخدام فائقة وتوافق أوسع مع الأجهزة.
Ultralytics YOLOv8: المعيار متعدد الاستخدامات
صدر عن Ultralytics في يناير 2023، YOLOv8 تحولًا كبيرًا في البنية مقارنة بسابقيه. فقد تم تصميمه ليس فقط كنموذج للكشف، بل كإطار عمل موحد قادر على التعامل مع مهام رؤية متعددة في وقت واحد.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 2023-01-10
- GitHub:ultralytics/ultralytics
أبرز ملامح الهيكلة
YOLOv8 رأس كشف بدون مرساة ، مما يبسط عملية التدريب من خلال التخلص من الحاجة إلى تكوين مربعات المرساة يدويًا بناءً على توزيع مجموعة البيانات. وهذا يجعل النموذج أكثر قوة عند التعميم على مجموعات البيانات المخصصة.
تتميز البنية بوحدة C2f (عنق زجاجة جزئي عبر المراحل مع اثنين من التلافيف)، والتي تحل محل وحدة C3 الموجودة في YOLOv5. تعمل وحدة C2f على تحسين تدفق التدرج وتسمح للنموذج بتعلم تمثيلات أكثر ثراءً للميزات دون زيادة كبيرة في تكلفة الحوسبة. علاوة على ذلك، YOLOv8 بنية رأس منفصلة، تفصل بين مهام الكائنات والتصنيف والانحدار، والتي ثبت أنها تحسن سرعة ودقة التقارب.
النظام الإيكولوجي وسهولة الاستخدام
YOLOv8 إحدى نقاط القوة المميزة لـ YOLOv8 تكاملها مع نظام Ultralytics . يمكن للمستخدمين تدريب النماذج والتحقق من صحتها ونشرها باستخدام واجهة CLI بسيطة CLI Python مع دعم مدمج لضبط المعلمات الفائقة وتتبع التجارب.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=50)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
YOLOv6.0: الإنتاجية الصناعية
تم تطوير YOLOv6.YOLOv6 بواسطة قسم Meituan Vision AI، ويُصنف على أنه "كاشف كائنات من الجيل التالي للتطبيقات الصناعية". ويركز بشكل كبير على تعظيم الإنتاجية على مسرعات الأجهزة مثل NVIDIA .
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المنظمة: ميتوان
- التاريخ: 2023-01-13
- أرخايف:2301.05586
التركيز المعماري
يستخدم YOLOv6 وحدة تسلسل ثنائي الاتجاه (BiC) في عنقه لتحسين دمج الميزات. كما يستخدم استراتيجية التدريب بمساعدة المثبت (AAT) ، التي تحاول الجمع بين مزايا النماذج القائمة على المثبتات والنماذج الخالية من المثبتات خلال مرحلة التدريب، على الرغم من أن الاستدلال يظل خاليًا من المثبتات.
يعتمد العمود الفقري على EfficientRep، الذي تم تصميمه ليكون متوافقًا مع الأجهزة من أجل GPU . هذا التحسين يجعل YOLOv6 فعالًا YOLOv6 في السيناريوهات التي يمكن فيها معالجة الدُفعات على الخوادم، مثل تحليلات الفيديو دون اتصال بالإنترنت. ومع ذلك، قد يؤدي هذا التخصص في بعض الأحيان إلى زيادة زمن الاستجابة على الأجهزة الطرفية CPU مقارنة بالنماذج المحسّنة للحوسبة العامة.
مقارنة تفصيلية
1. كفاءة التدريب والذاكرة
تم تصميم Ultralytics لتحقيق الكفاءة في التدريب. YOLOv8 يتطلب YOLOv8 CUDA أقل من البدائل القائمة على المحولات أو البنى القديمة. تتيح هذه الكفاءة للمطورين تدريب نماذج أكبر أو استخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين (مثل NVIDIA 3060 أو 4090).
في المقابل، فإن خط أنابيب التدريب YOLOv6، على الرغم من فعاليته، غالبًا ما يتطلب ضبطًا أكثر دقة للمعلمات الفائقة لتحقيق الاستقرار. واعتماده على استراتيجيات تهيئة محددة يمكن أن يجعل من الصعب على المبتدئين التكيف مع مجموعات البيانات المخصصة دون إجراء تجارب مكثفة.
تكامل Ultralytics
تتكامل Ultralytics بسلاسة مع Ultralytics (المعروفة سابقًا باسم HUB). تتيح لك هذه الأداة المستندة إلى الويب تصور مجموعات البيانات ومراقبة التدريب في الوقت الفعلي ونشر النماذج على iOS أو Android أو الأجهزة الطرفية بنقرة واحدة — وهي ميزات تعمل على تبسيط دورة حياة التعلم الآلي بشكل كبير مقارنة بالمستودعات التقليدية.
2. تنوع المهام
أحد العوامل المميزة الهامة هو مجموعة المهام المدعومة أصلاً.
- YOLOv8 هو إطار عمل متعدد المهام. وهو يدعم:
- الكشف عن الكائنات
- تجزئة المثيل (إخفاء على مستوى البكسل)
- تقدير الوضع (الكشف عن النقاط الرئيسية)
- مربعات الحدود الموجهة (OBB) (للأجسام الهوائية أو المدورة)
- تصنيف الصور
- تم تصميم YOLOv6.YOLOv6 بشكل أساسي للكشف عن الكائنات القياسية. على الرغم من وجود إصدارات تجريبية لمهام أخرى، إلا أن دعم النظام البيئي والوثائق الخاصة بها أقل شمولاً مما هو متاح لـ YOLOv8.
3. النشر والتصدير
كلا الطرازين يدعمان التصدير إلى ONNX و TensorRT. ومع ذلك، فإن خط أنابيب Ultralytics أكثر قوة بشكل ملحوظ، حيث يتعامل مع تعقيدات دعم المشغل والمحاور الديناميكية تلقائيًا.
على سبيل المثال، يعد تصدير YOLOv8 إلى TensorFlow للنشر على الأجهزة المحمولة إحدى القدرات الأصلية:
# Export YOLOv8 to TFLite format for Android/iOS
yolo export model=yolov8n.pt format=tflite
تتعدى سهولة الاستخدام هذه إلى OpenVINO و CoreML، مما يجعل YOLOv8 متميزًا للنشر عبر الأنظمة الأساسية.
الاستعداد للمستقبل: حالة YOLO26
في حين أن YOLOv8 YOLOv6. YOLOv6 لا تزالان أدوات قوية، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، Ultralytics تمثل قمة الكفاءة والأداء.
صدر YOLO26 في يناير 2026، وهو يعتمد على نقاط قوة YOLOv8 يقدم تغييرات ثورية:
- NMS من البداية إلى النهاية: من خلال التخلص من الحاجة إلى Non-Maximum Suppression (NMS)، تقلل YOLO26 من زمن الاستدلال وتبسط خطوط الإنتاج.
- MuSGD Optimizer: مستوحى من تدريب LLM، يضمن هذا المحسن تقاربًا أسرع واستقرارًا أكبر أثناء التدريب.
- تحسين الحواف: مع إزالة Distribution Focal Loss (DFL) ، يحقق YOLO26 استنتاجًا أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية (CPU)، مما يعالج أحد القيود الرئيسية في النماذج السابقة عالية الدقة.
- وظائف الخسارة المحسّنة: يؤدي دمج ProgLoss و STAL إلى تحسين كبير في اكتشاف الأجسام الصغيرة، وهو مطلب أساسي لصور الطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء.
الخلاصة
كان YOLOv6.YOLOv6 بمثابة معيار مثير للإعجاب GPU في البيئات الصناعية، لا سيما في مهام الكشف القياسية حيث تكون الأجهزة ثابتة. ومع ذلك، بالنسبة للغالبية العظمى من المطورين والباحثين، Ultralytics YOLOv8 تجربة أكثر توازناً وتنوعاً وسهولة في الاستخدام. ودعمها للتجزئة والوضع و OBB، إلى جانب Ultralytics القوي، يجعلها استثماراً أكثر أماناً على المدى الطويل.
بالنسبة لأولئك الذين يبحثون عن أحدث التقنيات، نوصي بالانتقال إلى YOLO26، الذي يجمع بين تنوع v8 وكفاءة الهندسة المعمارية من الجيل التالي.
مزيد من القراءة
استكشف النماذج الأخرى في Ultralytics :
- YOLO11: السلف القوي لـ YOLO26.
- YOLOv9: معروف بمعلوماته القابلة للبرمجة (PGI).
- YOLOv10: رائد النهج NMS من NMS.