تخطي إلى المحتوى

YOLO YOLO11: مقارنة تقنية شاملة

عند اختيار بنية الكشف عن الكائنات في الوقت الفعلي لمشروع الرؤية الحاسوبية التالي، من الضروري فهم الفروق الدقيقة بين النماذج الرائدة. يقدم هذا الدليل الشامل تحليلاً تقنياً متعمقاً يقارنYOLO Ultralytics YOLO11 ويستكشف بنياتهما ومقاييس أدائهما ومنهجيات التدريب وسيناريوهات النشر المثالية في العالم الواقعي.

YOLO :
المؤلفون: Xianzhe Xu، Yiqi Jiang، Weihua Chen، Yilun Huang، Yuan Zhang، و Xiuyu Sun
المنظمة: Alibaba Group التاريخ: 2022-11-23
Arxiv: 2211.15444v2
GitHub: YOLO
YOLO

YOLO11 :
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: ultralytics
YOLO11 : وثائق YOLO11

فلسفة التصميم المعماري

تحدد البنية الأساسية لنموذج الكشف عن الكائنات سرعة الاستدلال ودقته وقدرته على التكيف مع مختلف بيئات الأجهزة.

يقدم YOLO العديد من الابتكارات الأكاديمية، معتمدا بشكل كبير على البحث في البنية العصبية (NAS) لتصميم هيكله الأساسي تلقائيا. ويستخدم شبكة RepGFPN (شبكة هرمية عامة معاد تقييمها) فعالة لتعزيز دمج الميزات وتصميم ZeroHead الذي يقلل بشكل كبير من حجم رأس التنبؤ الثقيل الذي غالبا ما يوجد في البنى السابقة. بينما تسمح هذه الطريقة المدفوعة بـ NASYOLO كفاءات محددة على وحدات معالجة الرسومات المختارة، فإن البنى الناتجة قد تفتقر أحيانًا إلى المرونة اللازمة للتعميم بسلاسة عبر أجهزة الحافة المتنوعة.

في المقابل، YOLO11 على سنوات من الأبحاث الأساسية لتقديم بنية مصممة يدويًا ومُحسّنة للغاية. وهي تركز على هيكل أساسي مبسط ورقبة عالية الكفاءة تقلل من الحسابات الزائدة. YOLO11 إحدى المزايا الرئيسية لـ YOLO11 كفاءة معلماتها المحسّنة؛ فهي تحقق تمثيلًا عاليًا للميزات دون متطلبات VRAM الثقيلة التي تتميز بها النماذج القائمة على المحولات مثل RT-DETR. وهذا يجعل YOLO11 متعدد الاستخدامات YOLO11 وقادرًا على العمل بسلاسة على وحدات معالجة الرسومات (GPU) الاستهلاكية والأجهزة المحمولة ومسرعات الحافة المتخصصة.

الأداء والمقاييس

يتطلب تقييم الأداء النظر إلى ما هو أبعد من دقة الخطوط العليا للنظر في التوازن بين السرعة وحجم النموذج والحمل الحسابي (FLOPs).

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

كما يوضح الجدول، YOLO11 توازنًا عاليًا في الأداء. YOLO11s المتغير، على سبيل المثال، يتفوق على DAMO-YOLOs في الدقة مع الحفاظ على حجم معلمات أصغر بكثير. هذا التخفيض في متطلبات الذاكرة يترجم مباشرة إلى انخفاض تكاليف النشر وأداء أكثر مرونة على الأجهزة الطرفية.

تعرف على المزيد حول YOLO11

منهجيات التدريب وسهولة الاستخدام

يُقضي المطورون معظم وقتهم في مسار التدريب، مما يجعل كفاءة التدريب مسألة بالغة الأهمية.

YOLO عملية تدريب متعددة المراحل تعتمد بشكل كبير على تقطير المعرفة. ويستخدم AlignedOTA (تخصيص النقل الأمثل) لتخصيص التسميات، وغالبًا ما يتطلب تدريب نموذج "معلم" أكبر لتقطير المعرفة إلى نماذج "طالب" أصغر. تزيد هذه المنهجية بشكل كبير من حجم CUDA والوقت الإجمالي اللازم للحساب لتحقيق التقارب الأمثل.

على العكس من ذلك، YOLO11 Ultralytics يزيل تعقيد تدريب النماذج. YOLO11 تصميم YOLO11 ليكون سهل الاستخدام بشكل استثنائي، حيث يتميز Python مبسطة CLI شاملة تسمح للمهندسين ببدء التدريب على مجموعات بيانات مخصصة بأمر واحد. خط التدريب فعال من حيث الموارد بطبيعته، حيث يقلل من ارتفاعات الذاكرة إلى الحد الأدنى بحيث يمكن تدريب النماذج الأكبر حجماً على الأجهزة القياسية.

تدريب مبسط مع Ultralytics

لا يتطلب تدريب Ultralytics أي كود نمطي. تم تحسين خطوط الأنابيب المدمجة لتحميل البيانات وزيادتها وحساب الخسائر بشكل كامل.

فيما يلي مثال سريع يوضح مدى سهولة تدريب ونشر Ultralytics :

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX for seamless deployment
model.export(format="onnx")

تعرف على المزيد حول YOLO11

التطبيقات الواقعية والتنوع

غالبًا ما يعتمد الاختيار بين هذه البنى على نطاق المهام المطلوبة في بيئة النشر الخاصة بك.

أينYOLO

YOLO إطار عمل مخصص حصريًا لاكتشاف الأجسام. وهو يتفوق في بيئات البحث الأكاديمي حيث تعمل الفرق على استكشاف إعادة المعلمات أو إعادة إنتاج تجارب محددة للبحث في البنية العصبية. كما يمكن استخدامه في بيئات صناعية شديدة التقييد حيث يتطابق GPU محدد تمامًا مع العمود الفقري الناتج عن NAS.

ميزة Ultralytics

تتألق Ultralytics ، بما في ذلك YOLO11، في التطبيقات التجارية الواقعية بفضل تنوعها الفريد ونظامها البيئي الذي يتم صيانته جيدًا. على عكسYOLO يدعم Ultralytics المهام متعددة الوسائط بشكل أصلي. من تقسيم الحالات في التصوير الطبي إلى تقدير الوضع لتحليل الميكانيكا الحيوية في الرياضة، تتعامل قاعدة كود واحدة موحدة مع كل ذلك.

YOLO11 الصناعات التي تستفيد من YOLO11 ما يلي:

  • الزراعة الذكية: استخدام خاصية الكشف عن الأجسام لرصد صحة المحاصيل وأتمتة آلات الحصاد.
  • تحليلات البيع بالتجزئة: تنفيذ المراقبة الذكية لتحليل حركة العملاء وأتمتة إدارة المخزون.
  • اللوجستيات وسلسلة التوريد: الكشف عالي السرعة عن الباركود والطرود باستخدام الصناديق المحددة الاتجاه (OBB) على سيور النقل سريعة الحركة.

حالات الاستخدام والتوصيات

YOLO11 الاختيار بينYOLO YOLO11 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار DAMO-YOLO

YOLO خيار قوي لـ:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.

متى تختار YOLO11

YOLO11 في الحالات التالية:

  • نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

الجيل القادم: تقديم YOLO26

بينما YOLO11 خيارًا قويًا وموثوقًا، YOLO11 مجال الرؤية الحاسوبية يتطور بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة، فإن أحدث إصدار من YOLO26 يمثل أحدث ما توصلت إليه التكنولوجيا.

صدر YOLO26 في يناير 2026، ويقدم العديد من التطورات الرائدة:

  • تصميم شامل NMS: من خلال التخلص من معالجة ما بعد القمع غير الأقصى، يضمن YOLO26 أوقات استدلال أسرع وحتمية ويبسط بشكل كبير خطوط أنابيب النشر.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة خسارة التركيز التوزيعي (DFL)، يعد النموذج مناسبًا بشكل استثنائي للأجهزة المتطورة والأجهزة منخفضة الطاقة التي تفتقر إلى وحدات معالجة رسومات مخصصة.
  • MuSGD Optimizer: من خلال دمج ابتكارات تدريب LLM (مستوحاة من Moonshot AI)، يضمن هذا المحسن الهجين تقاربًا مستقرًا وسريعًا أثناء التدريب.
  • وظائف الخسارة المتقدمة: باستخدام ProgLoss + STAL، يُظهر YOLO26 تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والروبوتات.

تعرف على المزيد حول YOLO26

الخلاصة

YOLO11 كل منYOLO YOLO11 بشكل كبير في تطوير الرؤية الحاسوبية السريعة والدقيقة. بينماYOLO رؤى أكاديمية مثيرة للاهتمام في مجال البحث عن الهندسة المعمارية والتقطير، يوفر Ultralytics YOLO11 و YOLO26 الرائد) تجربة مطورين فائقة الجودة.

بفضل متطلبات الذاكرة المنخفضة، والوثائق الشاملة، وقدرات المهام المتعددة، والتكامل مع Ultralytics القوية، تظل Ultralytics هي التوصية الأولى للباحثين ومهندسي المؤسسات الذين يسعون إلى بناء حلول ذكاء اصطناعي قوية وقابلة للتطوير. بالنسبة لأولئك الذين يستكشفون بنى متقدمة أخرى، فإن مقارنة YOLO26 مع RT-DETR توفر رؤى إضافية حول البدائل القائمة على المحولات.


تعليقات