تخطي إلى المحتوى

YOLOv6.0 مقابل YOLO11: نظرة متعمقة على الكشف عن الكائنات في الوقت الفعلي

عند تقييم نماذج الرؤية الحاسوبية للتطبيقات عالية الأداء، يعد اختيار البنية المناسبة أمرًا بالغ الأهمية. أدى تطور الذكاء الاصطناعي للرؤية إلى ظهور نماذج متخصصة مصممة خصيصًا لبيئات متميزة. يقارن هذا الدليل الشامل بين نموذجين بارزين في النظام البيئي: YOLOv6. YOLOv6 الذي يركز على الصناعة و Ultralytics YOLO11.

يقدم كلا النموذجين حلولاً قوية لممارسي التعلم الآلي، لكنهما يلبيان نماذج نشر مختلفة. أدناه، نفصل بنياتهما، ومنهجيات التدريب، وسيناريوهات النشر المثالية في العالم الحقيقي لمساعدتك على اتخاذ قرار مستنير.

YOLOv6.0: التخصص في الإنتاجية الصناعية

تم تطوير YOLOv6. YOLOv6 من قبل قسم الرؤية الاصطناعية في Meituan، ويُعد إطار عمل من الجيل التالي لاكتشاف الأجسام تم تحسينه بشكل صريح للتطبيقات الصناعية.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
  • المؤسسة:Meituan
  • التاريخ: 2023-01-13
  • أرخايف:2301.05586
  • GitHub:meituan/YOLOv6
  • الوثائق:وثائق YOLOv6

أبرز ملامح الهيكلة

يركز YOLOv6.YOLOv6 بشكل كبير على تعظيم الإنتاجية على مسرعات الأجهزة مثل NVIDIA . يعتمد هيكله الأساسي على تصميم EfficientRep، الذي يتوافق بشكل كبير مع الأجهزة لعمليات GPU باستخدام GPU باستخدام منصات مثل TensorRT.

من الميزات المعمارية الرئيسية هي وحدة الربط ثنائي الاتجاه (BiC) في رقبتها، والتي تعزز دمج الميزات عبر مقاييس مختلفة. لتحسين التقارب خلال مرحلة التدريب، يستخدم YOLOv6 استراتيجية التدريب بمساعدة الارتساء (AAT). تستفيد هذه الاستراتيجية مؤقتًا من مربعات الارتساء (anchor boxes) أثناء التدريب لجني فوائد النماذج القائمة على الارتساء، بينما يظل الاستدلال خاليًا من الارتساء بشكل أساسي.

بينما يتفوق YOLOv6. YOLOv6 في بيئات المعالجة الجماعية عالية السرعة مثل تحليلات الفيديو غير المتصلة بالإنترنت على أجهزة قوية من فئة الخوادم، فإن هذا التخصص العميق قد يؤدي في بعض الأحيان إلى زمن انتقال أقل من الأمثل على الأجهزة الطرفية CPU مقارنة بالنماذج المصممة للحوسبة العامة الأوسع نطاقًا.

تعرف على المزيد حول YOLOv6

Ultralytics YOLO11: المعيار المتعدد المهام المتعدد الاستخدامات

صدر عن Ultral Ultralytics، YOLO11 تحولًا كبيرًا نحو إطار عمل موحد وعالي الكفاءة قادر على التعامل مع مجموعة ضخمة من مهام الرؤية في وقت واحد.

ميزة Ultralytics

على الرغم من أهمية النماذج الصناعية المتخصصة، إلا أن معظم المطورين المعاصرين يفضلون التوازن بين الأداء وسهولة الاستخدام وكفاءة الذاكرة ودعم المهام المتنوعة. YOLO11 بتقديمه حلاً شاملاً.

على عكس YOLOv6 الذي يركز بشكل صارم على الكشف عن المربعات المحددة،YOLO11 Ultralytics YOLO11 أصلاً لتقسيم المثال، وتقدير الوضع، وتصنيف الصور، واستخراج المربعات المحددة الموجهة (OBB). ويحقق ذلك مع الحفاظ على نظام بيئي سهل الوصول إليه بشكل لا يصدق.

عمليات سير عمل التعلم الآلي المبسطة

Ultralytics تجربة "من الصفر إلى القمة". بدلاً من الإعدادات المعقدة للبيئة الشائعة في مستودعات الأبحاث، يمكنك تدريب النماذج والتحقق من صحتها وتصديرها عبر Python موحدة أو واجهة سطر الأوامر. تعمل Ultralytics على تبسيط عملية تسمية مجموعات البيانات والتدريب السحابي.

تعرف على المزيد حول YOLO11

مقارنة الأداء والتقنية

يقدم الجدول أدناه نظرة تفصيلية على أداء هذه النماذج عبر أحجام مختلفة. لاحظ الانخفاض الكبير في عدد المعلمات وعمليات FLOPs في YOLO11 مقارنة YOLOv6 مما يمنح YOLO11 فائقًا YOLO11 الأداء.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

متطلبات الذاكرة وكفاءة التدريب

عند إعداد البيانات المخصصة، تعد كفاءة التدريب أمرًا بالغ الأهمية. تتطلبYOLO Ultralytics YOLO استخدامًا أقل بكثير لذاكرة VRAM أثناء التدريب مقارنة بالشبكات الصناعية المخصصة بشكل كبير أو البنى الضخمة القائمة على المحولات. وهذا يؤدي إلى إتاحة الذكاء الاصطناعي للجميع، مما يسمح للباحثين بضبط النماذج عالية الدقة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين. علاوة على ذلك، يضمن Ultralytics النشط أن تكون أدوات مثل ضبط المعلمات الفائقة وتكاملات التسجيل (مثل Weights & Biases Comet ) محدثة دائمًا.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv6 و YOLO11 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv6

YOLOv6 خيار قوي لـ:

  • النشر الصناعي المدرك للأجهزة: سيناريوهات حيث يوفر تصميم النموذج المدرك للأجهزة وإعادة التكوين الفعالة أداءً محسنًا على أجهزة مستهدفة محددة.
  • detect سريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
  • تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس تقنية Meituan والبنية التحتية للنشر.

متى تختار YOLO11

YOLO11 في الحالات التالية:

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

مثال برمجي: واجهة برمجة تطبيقات python الموحدة

Ultralytics تدريب نموذج متطور باستخدام Ultralytics سوى بضع أسطر من التعليمات البرمجية. تتولى واجهة برمجة التطبيقات (API) نفسها معالجة التنبؤات والتحقق من الصحة والتصدير إلى تنسيقات مثل ONNX أو OpenVINO.

from ultralytics import YOLO

# Load a pretrained YOLO11 Nano model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export for edge deployment
model.export(format="onnx")

التطلع إلى المستقبل: وصول YOLO26

بينما YOLO11 قفزة هائلة مقارنة بالبنى القديمة، يجب على المطورين الباحثين عن الحدود القصوى للأداء التفكير في الترقية إلى Ultralytics .

صدر YOLO26 في يناير 2026، ويضع معيارًا جديدًا لكفاءة نماذج الذكاء الاصطناعي، حيث يقدم ابتكارات لم يسبق لها مثيل في مجال الرؤية الحاسوبية:

  • تصميم خالٍ من NMS وشامل: تجاوز الحاجة إلى قمع غير الحد الأقصى (NMS) يقلل من زمن انتقال النشر بشكل كبير—وهي طريقة تم تقديمها لأول مرة في YOLOv10.
  • مُحسِّن MuSGD: بدمج استقرار تدريب نماذج LLM في مهام الرؤية، يجمع هذا المُحسِّن بين SGD و Muon لتحقيق تقارب مستقر وسريع بشكل لا يصدق.
  • مُحسّن لوحدة المعالجة المركزية (CPU): من خلال إزالة Distribution Focal Loss (DFL)، يحقق YOLO26 استدلال CPU أسرع بنسبة تصل إلى 43%، مما يجعله الخيار الأمثل لتطبيقات الهاتف المحمول وإنترنت الأشياء (IoT) والذكاء الاصطناعي الحافي (edge AI).
  • دوال الخسارة المتقدمة: تعمل تطبيقات ProgLoss و STAL على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر حيوي للتصوير الجوي والروبوتات.

تعرف على المزيد حول YOLO26

الخلاصة والتوصيات

إذا كانت بيئة النشر الخاصة بك تقتصر بشكل صارم على GPU الصناعية عالية الهندسة التي تتطلب استدلالًا دفعيًا، فإن YOLOv6.YOLOv6 تظل أداة مثيرة للاهتمام. ومع ذلك، بالنسبة للغالبية العظمى من السيناريوهات الواقعية التي تتطلب نماذج قابلة للتطوير وسهلة التدريب وعالية الدقة، Ultralytics YOLO11—و YOLO26المتطورة —هي التوصيات التي لا جدال فيها.

يتيح لك Ultralytics الانتقال بسرعة من جمع مجموعات البيانات إلى النشر المتطور، مما يضمن أن مشاريعك مستقبلية ومدعومة بوثائق شاملة ودعم مجتمعي. بالنسبة لأولئك الذين يستكشفون بنى أخرى فعالة، نوصي أيضًا بالاطلاع على YOLOv8 للحصول على دعم قوي ومثبت، أو الانطلاق مباشرة إلى الجيل التالي مع YOLO26.


تعليقات