تخطي إلى المحتوى

YOLO11 YOLO: تطور هياكل الكشف عن الكائنات في الوقت الفعلي

تتقدم أبحاث الرؤية الحاسوبية بوتيرة سريعة للغاية، حيث تعيد البنى الجديدة تعريف حدود السرعة والدقة باستمرار. ومن المساهمات المهمة في هذا المجال ما يلي YOLO11 من Ultralytics YOLO من Alibaba Group. في حين أن كلا النموذجين يهدفان إلى حل مشكلة الكشف عن الكائنات في الوقت الفعلي، إلا أنهما يتعاملان معها بفلسفتين مختلفتين، حيث يركز أحدهما على سهولة الاستخدام والنشر، بينما يركز الآخر على البحث الدقيق في البنية العصبية (NAS) والاستكشاف الأكاديمي.

يقدم هذا الدليل مقارنة تقنية متعمقة لمساعدة المطورين والباحثين والمهندسين على اختيار الأداة المناسبة لتطبيقات الرؤية الحاسوبية الخاصة بهم.

نظرات عامة على النموذج

YOLO11

YOLO11 يمثل تتويجًا لسنوات من التحسين المتكرر في عائلة YOLO You Only Look Once). تم إصداره في أواخر عام 2024 بواسطة Ultralytics وهو يعتمد على نجاح YOLOv8 من خلال إدخال تحسينات معمارية تعزز كفاءة استخراج الميزات مع الحفاظ على فلسفة "bag-of-freebies" — مما يوفر أداءً عاليًا دون الحاجة إلى إعدادات تدريب معقدة.

تعرف على المزيد حول YOLO11

DAMO-YOLO

YOLO هو نموذج يركز على البحث طورته أكاديمية DAMO (مجموعة Alibaba). ويقدم هذا النموذج عدة تقنيات مبتكرة، بما في ذلك البحث عن البنية العصبية (NAS) لتحسين العمود الفقري، و Reparameterized Generalized-FPN (RepGFPN) الفعال، وإطار عمل للتدريب قائم على التقطير. ويركز هذا النموذج بشكل كبير على تحقيق أقصى قدر من التوازن بين زمن الاستجابة والدقة من خلال البحث التلقائي عن التصميم.

مقارنة فنية

الهندسة المعمارية وفلسفة التصميم

يكمن الاختلاف الأساسي بين هذين الطرازين في أصول تصميمهما. YOLO11 مصمم يدويًا ليكون متعدد الاستخدامات وسهل الاستخدام. ويستخدم هيكل C3k2 (Cross Stage Partial) محسّن detect محسّن يوازن بين عدد المعلمات وتمثيل الميزات. يضمن هذا التصميم أن يكون النموذج قويًا في مجموعة متنوعة من المهام — ليس فقط اكتشاف الكائنات، ولكن أيضًا مهام تقسيم الحالات وتقدير الوضع والتصنيف ومهام Oriented Bounding Box (OBB).

في المقابل، يستخدم YOLO MAE-NAS (طريقة البحث الآلي الفعال عن البنية العصبية) لاكتشاف هيكله الأساسي. وينتج عن ذلك شبكة ذات طوبولوجيا مثالية نظريًا لقيود الأجهزة المحددة، ولكنها قد تكون غير شفافة ويصعب تعديلها يدويًا. بالإضافة إلى ذلك،YOLO بشكل كبير على خط تدريب معقد يتضمن تصميم "ZeroHead" وتقطير من نماذج تعليمية أكبر، مما يزيد من تعقيد التدريب على مجموعات البيانات المخصصة.

مقاييس الأداء

يوضح الجدول أدناه مقارنة بين أداء نماذج مختلفة. YOLO11 كفاءة فائقة، خاصة في سيناريوهات زمن الاستجابة المنخفض (نماذج N/S/M)، مع الحفاظ على دقة متطورة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

تحليل الأداء

YOLO11 يحقق باستمرار mAP أعلى مع معلمات أقل مقارنةًYOLO المماثلة. على سبيل المثال، يتفوق YOLO11s على DAMO-YOLOs بمقدار 1.0 mAP استخدام معلمات أقل بنسبة 40٪ تقريبًا (9.4 مليون مقابل 16.3 مليون). تترجم هذه الكفاءة مباشرة إلى استخدام أقل للذاكرة واستنتاج أسرع على الأجهزة الطرفية.

كفاءة التدريب وسهولة الاستخدام

YOLO11 تتميز بسهولة الوصول إليها. مدمجة في ultralytics Python تدريب النموذج أمر بسيط مثل تعريف ملف YAML لمجموعة البيانات وتشغيل أمر واحد. يتولى النظام البيئي ضبط المعلمات الفائقة وزيادة البيانات و تتبع التجربة تلقائياً.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with one line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

على العكس من ذلك، يستخدم YOLO عملية تدريب متعددة المراحل. وغالبًا ما يتطلب ذلك تدريب نموذج "مدرس" ثقيل أولاً لتقطير المعرفة إلى نموذج "طالب" أصغر. وهذا يزيد بشكل كبير من وقت GPU و VRAM المطلوب للتدريب. على الرغم من فعالية هذه العملية في استخلاص آخر جزء من الدقة للمعايير الأكاديمية، إلا أن هذه التعقيدات يمكن أن تشكل عائقًا أمام فرق الهندسة المرنة.

حالات الاستخدام المثالية

لماذا تختار نماذج Ultralytics؟

بالنسبة للغالبية العظمى من التطبيقات في العالم الواقعي، YOLO11YOLO26 الأحدث) أفضل توازن بين الأداء والطابع العملي.

  • سهولة الاستخدام: تم تصميم واجهة برم Ultralytics لتلبية احتياجات المطورين. CLI الأدلة الشاملة وواجهة CLI الموحدة الانتقال من النموذج الأولي إلى الإنتاج.
  • نظام بيئي جيد الصيانة: على عكس العديد من مستودعات الأبحاث التي تصبح خاملة بعد النشر، يتم صيانة Ultralytics بشكل نشط. تضمن التحديثات المنتظمة التوافق مع أحدث إصدارات PyTorchCUDA وتنسيقات التصدير مثل OpenVINO و CoreML.
  • تعدد الاستخدامات: في حين أنYOLO مجرد كاشف للأجسام، YOLO11 تقدير الوضع (النقاط الرئيسية) وتجزئة الحالات بشكل أصلي. وهذا يسمح لعائلة هندسية واحدة بمعالجة مهام رؤية متنوعة في خطوط إنتاج معقدة.
  • كفاءة الذاكرة: تم تحسينYOLO Ultralytics YOLO لتقليل استخدام VRAM. فهي تتجنب الحمل الزائد على الذاكرة الذي غالبًا ما يرتبط بالبنى القائمة على المحولات أو خطوط التقطير المعقدة، مما يجعلها قابلة للتدريب على الأجهزة الاستهلاكية.

متى تستخدم DAMO-YOLO

  • البحث الأكاديمي: إذا كان هدفك هو دراسة البحث في الهندسة العصبية (NAS) أو إعادة إنتاج تقنيات معينة لإعادة تحديد المعلمات المعروضة في YOLO .
  • قيود الأجهزة المحددة: إذا كانت لديك الموارد اللازمة لإجراء عمليات بحث شاملة على شبكة التخزين المرتبطة بالشبكة (NAS) للعثور على بنية أساسية مصممة خصيصًا لتسريع الأجهزة غير القياسية والمحددة للغاية.

تطبيقات عملية في أرض الواقع

YOLO11 يستخدم على نطاق واسع في مختلف الصناعات بفضل متانته:

  • التجزئة الذكية:تحليل سلوك العملاء وإدارة المخزون الآلية باستخدام خاصية الكشف عن الأشياء.
  • الرعاية الصحية:الكشف عن الأورام في التصوير الطبي، حيث تسمح السرعة بإجراء فحوصات سريعة.
  • التصنيع: أنظمةمراقبة الجودة التي تتطلب استنتاجات عالية السرعة على الأجهزة الطرفية detect في خطوط التجميع.

المضي قدماً: ميزة YOLO26

على الرغم من YOLO11 نموذج ممتاز، YOLO11 هذا المجال استمر في التقدم. بالنسبة للمشاريع الجديدة التي ستبدأ في عام 2026، يُوصى باستخدام YOLO26.

تعرف على المزيد حول YOLO26

يقدم YOLO26 العديد من الميزات المتطورة:

  • NMS من البداية إلى النهاية: من خلال التخلص من تقنية Non-Maximum Suppression (NMS)، تعمل YOLO26 على تبسيط منطق النشر وتقليل تقلب زمن الاستجابة، وهو مفهوم رائد في YOLOv10.
  • MuSGD Optimizer: مُحسِّن هجين مستوحى من تدريب LLM يضمن تقاربًا مستقرًا.
  • تحسين اكتشاف الأجسام الصغيرة: تعمل وظائف الخسارة مثل ProgLoss و STAL على تحسين الأداء بشكل كبير على الأهداف الصغيرة، وهو أمر بالغ الأهمية لصور الطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء.

الخلاصة

كلاهما YOLO11 و YOLO قد ساهمت بشكل كبير في تطوير اكتشاف الأجسام.YOLO إمكانات البحث الآلي عن البنية. ومع ذلك، YOLO11 يظل الخيار الأفضل للتطبيق العملي بسبب سهولة سير العمل فيه، ودعمه الواسع للمهام، واستخدامه الفعال للمعلمات.

بالنسبة للمطورين الذين يسعون إلى البقاء في طليعة التكنولوجيا، يوفر الانتقال إلى YOLO26 سرعة وبساطة أكبر، مما يضمن أن تظل مشاريع الرؤية الحاسوبية الخاصة بهم قابلة للتطبيق في المستقبل.

ابدأ مشروعك

هل أنت مستعد لبدء التدريب؟ تفضل بزيارة Ultralytics لتعليق نماذجك وتدريبها ونشرها في دقائق معدودة دون الحاجة إلى إدارة بنية تحتية معقدة.


تعليقات