YOLO11 YOLOv6.0: مقارنة تقنية شاملة
يتطور مجال الرؤية الحاسوبية بسرعة، ويعد اختيار بنية النموذج المناسبة قرارًا بالغ الأهمية لممارسي التعلم الآلي. هناك معلمان هامان في تطور اكتشاف الكائنات في الوقت الفعلي، وهما YOLO11 و YOLOv6.YOLOv6. على الرغم من أن كلا النموذجين يوفران إمكانات رائعة لاستخراج الرؤى من البيانات المرئية، إلا أنهما تم تطويرهما بأهداف أساسية وفلسفات تصميم مختلفة.
يقدم هذا الدليل تحليلاً تقنياً متعمقاً يقارن بين هياكلها ومقاييس أدائها وسيناريوهات النشر المثالية لمساعدتك في اتخاذ قرار مستنير بشأن مشروع الذكاء الاصطناعي التالي.
نظرات عامة على النموذج
قبل الخوض في المعايير الفنية، من المفيد فهم أصول كل نموذج وتركيزه الأساسي.
Ultralytics YOLO11
YOLO11 تطوير YOLO11 بشكل أصلي ضمن Ultralytics YOLO11 صُمم ليوفر تجربة تطوير سلسة وشاملة. ولا يركز فقط على السرعة الخام، بل أيضًا على تعدد المهام وسهولة الاستخدام والتكامل مع خطوط الإنتاج الحديثة.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:Ultralytics Repository
- المستندات:توثيق YOLO11
Meituan YOLOv6-3.0
تم تصميم YOLOv6.YOLOv6 خصيصًا للتطبيقات الصناعية التي تتوفر فيها وحدات معالجة رسومات (GPU) مخصصة. وهو مُحسّن بشكل كبير لـ TensorRT ، مع التركيز على تعظيم الإنتاجية في البيئات الخاضعة للرقابة.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المؤسسة:Meituan
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:مستودع Meituan YOLOv6
- الوثائق:وثائق YOLOv6
الاختلافات المعمارية
تحدد البنية الأساسية كيفية تعلم النموذج وتوسيع نطاقه. يقدم كلا الإطارين تحسينات فريدة على YOLO الكلاسيكية.
YOLO11 على سنوات من البحث لتقديم بنية فعالة للغاية من حيث المعلمات. ويتميز بعمود فقري متطور ورأس عام قادر على التعامل مع مهام الرؤية الحاسوبية المتنوعة — مثل تجزئة الحالات وتقدير الوضع— دون الحاجة إلى إجراء تعديلات هيكلية ضخمة. علاوة على ذلك، YOLO11 بانخفاض استهلاكه للطاقة بشكل استثنائي CUDA خاصة أثناء التدريب، مما يميزها عن نماذج المحولات الأكبر حجمًا مثل RT-DETR.
على العكس من ذلك، يستخدم YOLOv6 وحدة تسلسل ثنائية الاتجاه (BiC) واستراتيجية التدريب بمساعدة المثبت (AAT). تم تصميم هذه الآليات لتحسين دقة تحديد الموقع. تتميز البنية بشكل أساسي بفصلها وتكميتها بشكل كبير لتفضيل استدلال نموذج INT8، مما يجعلها منافسًا قويًا لخطوط التصنيع عالية السرعة التي تعمل GPU قديمة.
اختيار الإطار المناسب
إذا كان مشروعك يتطلب إنشاء نماذج أولية سريعة، ودعم مهام متنوعة (مثل التجزئة أو التصنيف)، ونشر عبر أجهزة مختلفة (CPU Edge TPU Mobile)، فإن Ultralytics يوفر تجربة مطور أكثر سلاسة بشكل ملحوظ.
الأداء والمقاييس
عند تقييم النماذج، يعتبر متوسط الدقة (mAP) وسرعة الاستدلال أمرين بالغين الأهمية. يقارن الجدول التالي أداء YOLO11 YOLOv6. YOLOv6 عبر نماذج مختلفة الحجم. تم تمييز المقاييس الأفضل أداءً بالخط العريض.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
كما هو موضح، يحقق YOLO11 دقة أعلى (mAP) مع عدد أقل بكثير من المعلمات وعمليات FLOP عبر المستويات المكافئة. وتترجم كفاءة المعلمات هذه مباشرة إلى متطلبات ذاكرة أقل أثناء تدريب النموذج والاستدلال.
ميزة Ultralytics
اختيار النموذج لا يقتصر على المقاييس الأولية فحسب، بل يتعلق بدورة حياة التعلم الآلي بأكملها. توفر Ultralytics ميزة واضحة للمطورين والباحثين على حد سواء.
- سهولة الاستخدام: تتيح لكPython Ultralytics Python تدريب النماذج والتحقق من صحتها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية. ولا داعي لتكوين أشجار التبعية المعقدة يدويًا.
- نظام بيئي جيد الصيانة: Ultralytics نظامًا بيئيًا موحدًا يتم تحديثه بشكل متكرر. من خلال استخدام Ultralytics يمكن للمطورين الوصول إلى التعليقات التوضيحية التعاونيّة لمجموعات البيانات والتدريب السحابي ومراقبة النماذج بسلاسة.
- تعدد الاستخدامات: على عكس YOLOv6. YOLOv6، الذي يعد في الأساس كاشفًا للمربعات المحيطة، يدعم YOLO11 تصنيف الصور والمربعات المحيطة الموجهة (OBB)، مما يتيح لك دمج مجموعة التقنيات الخاصة بك.
- كفاءة التدريب: من خلال الاستفادة من التحسينات الحديثة والتجميع التلقائي، YOLO11 بكفاءة على أجهزة المستهلكين، مما يتيح الوصول إلى أحدث تقنيات الذكاء الاصطناعي في مجال الرؤية.
مثال على الكود: التدريب والاستدلال
العمل مع Ultralytics سهل للغاية. فيما يلي مثال قابل للتشغيل بنسبة 100٪ يوضح كيفية تدريب وتشغيل الاستدلال باستخدام Ultralytics .
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image from the web
prediction = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format for easy deployment
model.export(format="onnx")
حالات الاستخدام المثالية
فهم نقاط تميز كل نموذج يضمن لك اختيار الأداة المناسبة للمهمة.
متى تختار YOLOv6: إذا كنت تحتفظ بنظام صناعي قديم تم تصميمه خصيصًا حول خطوط أنابيب TensorRT .x/8.x محددة، وتشتمل أجهزتك بالكامل على وحدات معالجة رسومات NVIDIA أو A100 مخصصة لأتمتة التصنيع عالية السرعة، YOLOv6 محركًا قابلاً للتطبيق وفعالاً.
متى تختار YOLO11: بالنسبة لجميع التطبيقات الحديثة تقريبًا، YOLO11 الخيار الأفضل. سواء كنت تقوم ببناء حلول تصنيع ذكية، أو نشر الذكاء الاصطناعي المتطور على أجهزة Raspberry Pi، أو تنفيذ عمليات متعددة المهام مثل الكشف عن الصور الطبية وتقسيمها، YOLO11 التوازن الأمثل بين السرعة والدقة ومرونة النشر.
التطلع إلى المستقبل: YOLO26 المتطور
بينما YOLO11 قفزة هائلة إلى الأمام، Ultralytics تخطي حدود الرؤية الحاسوبية. تم إصدار الإصدار الجديد في يناير 2026، YOLO26 هي أحدث ما توصلت إليه التكنولوجيا، وهي النموذج الموصى به لجميع المشاريع الجديدة.
يقدم YOLO26 العديد من الميزات الرائدة المصممة خصيصًا لمواجهة تحديات النشر الحديثة:
- تصميم شامل NMS: بناءً على المفاهيم التي ابتكرتها YOLOv10، فإن YOLO26 هو تصميم شامل أصلاً. فهو يلغي تماماً المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما ينتج عنه خطوط إنتاج أسرع وأبسط بشكل كبير.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يبسط YOLO26 رأس الشبكة، مما يعزز بشكل كبير التوافق مع إنترنت الأشياء (IoT) منخفضة الطاقة والأجهزة الطرفية.
- مُحسّن MuSGD: مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM) (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26SGD هجينًا، مما يضمن استقرارًا لا مثيل له في التدريب وتقاربًا أسرع.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : بالنسبة للتطبيقات التي تعمل بدون GPU مخصصة، تم تحسين YOLO26 بشكل كبير من أجل CPU الخام.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة لصور الطائرات بدون طيار والمراقبة الجوية.
- تحسينات خاصة بالمهام: يتضمن YOLO26 تحسينات مخصصة لجميع المهام، مثل النماذج الأولية متعددة المقاييس للتجزئة وتقدير احتمالية السجل المتبقي (RLE) لتقدير الوضع.
إذا كنت تبدأ اليوم مبادرة جديدة في مجال الرؤية الحاسوبية، فإن الاستفادة من Ultralytics لتدريب نموذج YOLO26 سيضمن أن تطبيقك مبني على أكثر البنى كفاءة ودقة ومستقبلية.
بالنسبة للمطورين المهتمين باستكشاف الكشف عن المفردات المفتوحة، يمكنكم أيضًا مراجعة وثائقنا على YOLO.