YOLOv6.0 مقابل YOLO11: نظرة متعمقة على الكشف عن الكائنات في الوقت الفعلي
عند تقييم نماذج الرؤية الحاسوبية للتطبيقات عالية الأداء، يعد اختيار البنية المناسبة أمرًا بالغ الأهمية. أدى تطور الذكاء الاصطناعي للرؤية إلى ظهور نماذج متخصصة مصممة خصيصًا لبيئات متميزة. يقارن هذا الدليل الشامل بين نموذجين بارزين في النظام البيئي: YOLOv6. YOLOv6 الذي يركز على الصناعة و Ultralytics YOLO11.
يقدم كلا النموذجين حلولاً قوية لممارسي التعلم الآلي، ولكنهما يلبيان نماذج نشر مختلفة. فيما يلي، نحلل هياكلهما ومنهجيات التدريب وسيناريوهات النشر المثالية في العالم الواقعي لمساعدتك على اتخاذ قرار مستنير.
YOLOv6.0: التخصص في الإنتاجية الصناعية
تم تطوير YOLOv6. YOLOv6 من قبل قسم الرؤية الاصطناعية في Meituan، ويُعد إطار عمل من الجيل التالي لاكتشاف الأجسام تم تحسينه بشكل صريح للتطبيقات الصناعية.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المؤسسة:Meituan
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
- الوثائق:وثائق YOLOv6
أبرز ملامح الهيكلة
يركز YOLOv6.YOLOv6 بشكل كبير على تعظيم الإنتاجية على مسرعات الأجهزة مثل NVIDIA . يعتمد هيكله الأساسي على تصميم EfficientRep، الذي يتوافق بشكل كبير مع الأجهزة لعمليات GPU باستخدام GPU باستخدام منصات مثل TensorRT.
من السمات المعمارية الرئيسية وحدة التسلسل ثنائي الاتجاه (BiC) الموجودة في عنقها، والتي تعزز دمج الميزات عبر مستويات مختلفة. لتحسين التقارب خلال مرحلة التدريب، YOLOv6 استراتيجية التدريب بمساعدة المراسي (AAT). تستفيد هذه الاستراتيجية مؤقتًا من مربعات المراسي أثناء التدريب لجني فوائد النماذج القائمة على المراسي، بينما يظل الاستدلال خاليًا من المراسي بشكل أساسي.
بينما يتفوق YOLOv6. YOLOv6 في بيئات المعالجة الجماعية عالية السرعة مثل تحليلات الفيديو غير المتصلة بالإنترنت على أجهزة قوية من فئة الخوادم، فإن هذا التخصص العميق قد يؤدي في بعض الأحيان إلى زمن انتقال أقل من الأمثل على الأجهزة الطرفية CPU مقارنة بالنماذج المصممة للحوسبة العامة الأوسع نطاقًا.
Ultralytics YOLO11: المعيار المتعدد المهام المتعدد الاستخدامات
صدر عن Ultral Ultralytics، YOLO11 تحولًا كبيرًا نحو إطار عمل موحد وعالي الكفاءة قادر على التعامل مع مجموعة ضخمة من مهام الرؤية في وقت واحد.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:ultralytics/ultralytics
- المستندات:توثيق YOLO11
ميزة Ultralytics
على الرغم من أهمية النماذج الصناعية المتخصصة، إلا أن معظم المطورين المعاصرين يفضلون التوازن بين الأداء وسهولة الاستخدام وكفاءة الذاكرة ودعم المهام المتنوعة. YOLO11 بتقديمه حلاً شاملاً.
على عكس YOLOv6 الذي يركز بشكل صارم على الكشف عن المربعات المحددة،YOLO11 Ultralytics YOLO11 أصلاً لتقسيم المثال، وتقدير الوضع، وتصنيف الصور، واستخراج المربعات المحددة الموجهة (OBB). ويحقق ذلك مع الحفاظ على نظام بيئي سهل الوصول إليه بشكل لا يصدق.
عمليات سير عمل التعلم الآلي المبسطة
Ultralytics تجربة "من الصفر إلى القمة". بدلاً من الإعدادات المعقدة للبيئة الشائعة في مستودعات الأبحاث، يمكنك تدريب النماذج والتحقق من صحتها وتصديرها عبر Python موحدة أو واجهة سطر الأوامر. تعمل Ultralytics على تبسيط عملية تسمية مجموعات البيانات والتدريب السحابي.
مقارنة الأداء والتقنية
يقدم الجدول أدناه نظرة تفصيلية على أداء هذه النماذج عبر أحجام مختلفة. لاحظ الانخفاض الكبير في عدد المعلمات وعمليات FLOPs في YOLO11 مقارنة YOLOv6 مما يمنح YOLO11 فائقًا YOLO11 الأداء.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
متطلبات الذاكرة وكفاءة التدريب
عند إعداد البيانات المخصصة، تعد كفاءة التدريب أمرًا بالغ الأهمية. تتطلبYOLO Ultralytics YOLO استخدامًا أقل بكثير لذاكرة VRAM أثناء التدريب مقارنة بالشبكات الصناعية المخصصة بشكل كبير أو البنى الضخمة القائمة على المحولات. وهذا يؤدي إلى إتاحة الذكاء الاصطناعي للجميع، مما يسمح للباحثين بضبط النماذج عالية الدقة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين. علاوة على ذلك، يضمن Ultralytics النشط أن تكون أدوات مثل ضبط المعلمات الفائقة وتكاملات التسجيل (مثل Weights & Biases Comet ) محدثة دائمًا.
حالات الاستخدام والتوصيات
YOLO11 الاختيار بين YOLOv6 YOLO11 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLOv6
YOLOv6 خيار قوي لـ:
- النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
- الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
- تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.
متى تختار YOLO11
YOLO11 في الحالات التالية:
- نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
- النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
مثال على الكود: Python الموحدة Python
Ultralytics تدريب نموذج متطور باستخدام Ultralytics سوى بضع أسطر من التعليمات البرمجية. تتولى واجهة برمجة التطبيقات (API) نفسها معالجة التنبؤات والتحقق من الصحة والتصدير إلى تنسيقات مثل ONNX أو OpenVINO.
from ultralytics import YOLO
# Load a pretrained YOLO11 Nano model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")
# Export for edge deployment
model.export(format="onnx")
التطلع إلى المستقبل: وصول YOLO26
بينما YOLO11 قفزة هائلة مقارنة بالبنى القديمة، يجب على المطورين الباحثين عن الحدود القصوى للأداء التفكير في الترقية إلى Ultralytics .
صدر YOLO26 في يناير 2026، ويضع معيارًا جديدًا لكفاءة نماذج الذكاء الاصطناعي، حيث يقدم ابتكارات لم يسبق لها مثيل في مجال الرؤية الحاسوبية:
- تصميم NMS من البداية إلى النهاية: تجاوز الحاجة إلى Non-Maximum Suppression (NMS) يقلل بشكل كبير من زمن انتقال النشر — وهي طريقة تم تقديمها لأول مرة في YOLOv10.
- MuSGD Optimizer: من خلال دمج استقرار تدريب LLM في مهام الرؤية، يجمع هذا المحسن بين SGD Muon لتحقيق تقارب مستقر وسريع بشكل لا يصدق.
- CPU : من خلال إزالة خسارة التركيز التوزيعي (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأمثل لتطبيقات الأجهزة المحمولة وإنترنت الأشياء والذكاء الاصطناعي المتطور.
- وظائف الخسارة المتقدمة: تعمل تطبيقات ProgLoss و STAL على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والروبوتات.
الخلاصة والتوصيات
إذا كانت بيئة النشر الخاصة بك تقتصر بشكل صارم على GPU الصناعية عالية الهندسة التي تتطلب استدلالًا دفعيًا، فإن YOLOv6.YOLOv6 تظل أداة مثيرة للاهتمام. ومع ذلك، بالنسبة للغالبية العظمى من السيناريوهات الواقعية التي تتطلب نماذج قابلة للتطوير وسهلة التدريب وعالية الدقة، Ultralytics YOLO11—و YOLO26المتطورة —هي التوصيات التي لا جدال فيها.
يتيح لك Ultralytics الانتقال بسرعة من جمع مجموعات البيانات إلى النشر المتطور، مما يضمن أن مشاريعك مستقبلية ومدعومة بوثائق شاملة ودعم مجتمعي. بالنسبة لأولئك الذين يستكشفون بنى أخرى فعالة، نوصي أيضًا بالاطلاع على YOLOv8 للحصول على دعم قوي ومثبت، أو الانطلاق مباشرة إلى الجيل التالي مع YOLO26.