تخطي إلى المحتوى

YOLO YOLOv6.0: مواجهة تقنية للكشف عن الأجسام في الوقت الفعلي

يتميز مجال الكشف عن الكائنات في الوقت الفعلي بالابتكار السريع، حيث تعتبر الكفاءة المعمارية وسرعة الاستدلال أمرين بالغين الأهمية. ومن بين المنافسين البارزين في هذا المجال YOLO طورته مجموعة Alibaba، و YOLOv6.YOLOv6، وهو إطار عمل قوي من Meituan. ويهدف كلا النموذجين إلى تحقيق التوازن المثالي بين زمن الاستجابة والدقة، لكنهما يحققان ذلك من خلال منهجيات مختلفة.

يحلل هذا الدليل الشامل الفروق الفنية بين كلا النوعين من البنى، ويقدم للمطورين والباحثين الرؤى اللازمة لاختيار الأداة المناسبة لتطبيقات الرؤية الحاسوبية الخاصة بهم. سواء كنت تقوم بالبناء لأجهزة حافة الشبكة أو خوادم سحابية عالية الإنتاجية، فإن فهم هذه الاختلافات أمر بالغ الأهمية.

معيار الأداء

يوضح الجدول التالي مقاييس الأداء على COCO . يوفر YOLOv6.YOLOv6 عمومًا إنتاجية فائقة على GPU بفضل تصميمه TensorRT، بينما يُظهر YOLO كفاءة قوية في المعلمات.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

DAMO-YOLO: بحث البنية العصبية يلتقي بالكفاءة

تقدم YOLO نهجًا جديدًا من خلال دمج البحث عن البنية العصبية (NAS) مباشرة في تصميم العمود الفقري. تم تطويرها من قبل مجموعة Alibaba، وتركز على تعظيم الأداء في ظل قيود صارمة على زمن الاستجابة.

الميزات المعمارية الرئيسية

  • MAE-NAS Backbone: يستخدم بحث الهندسة العصبية للتشفير التلقائي متعدد الفروع (MAE-NAS) لاكتشاف الهياكل الشبكية المثلى. وينتج عن ذلك هيكل أساسي يستخرج الميزات بشكل أكثر كفاءة من نظرائه المصممين يدويًا مثل CSPDarknet.
  • RepGFPN الفعال: يستبدل النموذج شبكة هرم الميزات القياسية (FPN) بشبكة FPN المعممة المعاد معايرتها (RepGFPN). وهذا يحسن دمج الميزات عبر مستويات مختلفة مع الحفاظ على سرعة الاستدلال، حيث يتم دمج الفروع المعقدة في مسار واحد أثناء النشر.
  • ZeroHead: لتقليل تكلفة الحوسبة بشكل أكبر،YOLO "ZeroHead" خفيف الوزن، والذي يبسط تصميم رأس الكشف دون فقدان كبير في الدقة.
  • AlignedOTA: تستخدم عملية التدريب تخصيص التسميات Aligned One-to-Many (AlignedOTA)، الذي يخصص التسميات ديناميكيًا لتحسين سرعة التقارب والتعامل مع الغموض في المشاهد المزدحمة.

YOLO :
المؤلفون: Xianzhe Xu، Yiqi Jiang، Weihua Chen، Yilun Huang، Yuan Zhang، و Xiuyu Sun
المنظمة: Alibaba Group
التاريخ: 2022-11-23
Arxiv | GitHub | Docs

YOLOv6.0: المعيار الصناعي لوحدات معالجة الرسومات

YOLOv6.YOLOv6، الذي يشار إليه غالبًا باسم "إعادة تحميل كاملة" للإطار، تم تصميمه خصيصًا للتطبيقات الصناعية التي GPU عبر TensorRT هو المعيار.

الميزات المعمارية الرئيسية

  • الاندماج ثنائي الاتجاه (BiFusion): يعزز YOLOv6.0 الرقبة باستخدام BiFusion، مما يحسن تدفق المعلومات الدلالية بين مستويات الميزات المختلفة.
  • التدريب بمساعدة المرجع (AAT): على عكس أجهزة الكشف الخالية تمامًا من المرجع، يقدم YOLOv6. YOLOv6 فرعًا إضافيًا قائمًا على المرجع أثناء التدريب. وهذا يعمل على استقرار عملية التعلم وتعزيز الاسترجاع، بينما يظل الاستدلال خاليًا من المرجع من أجل السرعة.
  • RepOptimizer: يستفيد النموذج من تقنيات إعادة المعلمات ليس فقط في البنية (كتل RepVGG) ولكن أيضًا في عملية التحسين نفسها، مما يضمن أن تكون خطوات الانحدار التدرجي أكثر فعالية للهياكل المعاد معلمتها بشكل محدد.
  • التدريب المدرك للتكمية (QAT): من أهم مزايا هذا النموذج دعمه الأصلي لـ QAT، مما يتيح للنموذج الحفاظ على دقة عالية حتى عند ضغطه إلى دقة INT8 لنشره على وحدات معالجة الرسومات (GPU) المتطورة.

تفاصيلYOLOv6:
المؤلفون: Chuyi Li، Lulu Li، Yifei Geng، Hongliang Jiang، Meng Cheng، Bo Zhang، Zaidan Ke، Xiaoming Xu، و Xiangxiang Chu
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv | GitHub | Docs

تعرف على المزيد حول YOLOv6

Ultralytics : لماذا تختار YOLO الحديثة؟

بينما يقدمYOLO YOLOv6.0 نقاط قوة مميزة، فإن Ultralytics حلًا موحدًا يلبي الاحتياجات الأوسع نطاقًا لتطوير الذكاء الاصطناعي الحديث. يضمن اختيار Ultralytics حصولك ليس فقط على بنية، بل على سير عمل كامل ومدعوم.

1. سهولة استخدام لا مثيل لها

Ultralytics تجربة المطور Ultralytics ("من الصفر إلى القمة"). يتم تجريد العمليات المعقدة مثل زيادة البيانات وضبط المعلمات الفائقة وتصدير النماذج خلف Python بسيطة.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100)

2. تنوع عبر المهام

على عكسYOLO YOLOv6 اللذين يركزان بشكل أساسي على اكتشاف المربعات المحددة، فإن Ultralytics متعددة الوسائط بطبيعتها. تدعم قاعدة كود واحدة ما يلي:

3. كفاءة التدريب واستخدام الذاكرة

تم تحسين Ultralytics لتقليل استخدام VRAM أثناء التدريب. تتيح هذه الكفاءة للباحثين والهواة تدريب نماذج متطورة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، وهي ميزة كبيرة مقارنة بالهجينة المحولة التي تستهلك الكثير من الذاكرة مثل RT-DETR.

4. نظام بيئي جيد الصيانة

يعد Ultralytics أحد أكثر المستودعات نشاطًا في مجتمع الرؤية الحاسوبية. تضمن التحديثات المتكررة التوافق مع أحدث إصدارات PyTorchو CUDA و Python ، مما يمنع "تلف الكود" الذي غالبًا ما يظهر في مستودعات الأبحاث الثابتة.

مستقبل الذكاء الاصطناعي في مجال الرؤية: YOLO26

بالنسبة للمطورين الذين يبحثون عن أعلى مستويات الأداء وسهولة النشر، يمثل Ultralytics الجيل التالي من الذكاء الاصطناعي للرؤية.

لماذا الترقية إلى YOLO26؟

يجمع YOLO26 بين ميزات متطورة تبسط عملية النشر مع تعزيز السرعة والدقة:

  • NMS من البداية إلى النهاية: تلغي المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) ، مما يبسط التصدير إلى CoreML و TFLite.
  • CPU : CPU أسرع بنسبة تصل إلى 43٪ مقارنة بالأجيال السابقة، مما يتيح أداءً في الوقت الفعلي على الأجهزة الطرفية التي تفتقر إلى وحدات معالجة رسومات قوية.
  • MuSGD Optimizer: مُحسِّن هجين يستفيد من ابتكارات تدريب LLM (مستوحى من Kimi K2 من Moonshot AI) لتحقيق تقارب واستقرار أسرع.
  • تحسين الكشف عن الأجسام الصغيرة: الجديد ProgLoss و STAL تحسن وظائف الخسارة بشكل كبير من اكتشاف الأهداف الصغيرة والصعبة، وهو أمر بالغ الأهمية لـ تطبيقات الطائرات بدون طيار.

تعرف على المزيد حول YOLO26

توصيات حالات الاستخدام

عند الاختيار بين هذه البنى، ضع في اعتبارك بيئة النشر الخاصة بك:

مناسب بشكل مثالي لـYOLO

  • البحث والتطوير: ممتاز لدراسة تأثير البحث في الهندسة العصبية (NAS) على أساسيات الرؤية.
  • الأجهزة المخصصة: قد توفر البنية مزايا على وحدات معالجة شبكية معينة (NPU) تفضل تصميم RepGFPN.
  • متطلبات زمن انتقال منخفض: يساعد تصميم ZeroHead على توفير أجزاء من الثانية في البيئات التي تفرض قيودًا صارمة على الوقت.

مناسب بشكل مثالي لـ YOLOv6-3.0

  • GPU الصناعية: التركيز الشديد على TensorRT يجعلها قوية للغاية على بطاقات NVIDIA و A100.
  • احتياجات التكمية: إذا كان خط الإنتاج الخاص بك يعتمد بشكل كبير على التدريب المدرك للتكمية (QAT) لنشر INT8، فإن YOLOv6 أدوات أصلية.
  • التحليلات عالية الإنتاجية: سيناريوهات مثل معالجة عدة تدفقات فيديو في وقت واحد حيث يكون الإنتاجية المجمعة عاملاً أساسياً.

مناسب بشكل مثالي لـ Ultralytics YOLO11 YOLO26)

  • النشر للأغراض العامة: القدرة على التصدير إلى ONNXو OpenVINO و TensorRT و CoreML و TFLite واحد تغطي جميع الأساسيات.
  • CPU للهواتف المحمولة والأجهزة الطرفية: تعتبرYOLO26 الخيار الأمثل لنظامي iOS Android وRaspberry Pi بفضل CPU الخاصةبها وتصميمها NMS.
  • المهام المعقدة: عندما يتطلب مشروعك أكثر من مجرد مربعات — مثل أقنعة التجزئة أو نقاط مفتاحية للوضع —Ultralytics الإطار الموحد الوحيد الذي يوفر ذلك.
  • النماذج الأولية السريعة: تتيح Ultralytics إدارة سريعة لمجموعات البيانات والتدريب والنشر دون الحاجة إلى إدارة بنية تحتية معقدة.

الخلاصة

يعد كل من YOLO و YOLOv6.YOLOv6 مساهمتين رائعتين في مجال الرؤية الحاسوبية.YOLO حدود البحث الآلي في الهندسة المعمارية، بينما YOLOv6 فن الاستدلال GPU.

ومع ذلك، بالنسبة للغالبية العظمى من التطبيقات في العالم الواقعي، توفر YOLO Ultralytics YOLO حلاً أكثر توازناً وتنوعاً وقابلية للصيانة. مع إصدار YOLO26، اتسعت الفجوة أكثر، حيث توفر كفاءة شاملة CPU التي لم تصل إليها النماذج المنافسة بعد. سواء كنت شركة ناشئة تبني أول منتج للذكاء الاصطناعي أو مؤسسة تتوسع لتصل إلى ملايين المستخدمين، فإن استقرار وأداء Ultralytics يوفر أساساً متيناً للنجاح.

مزيد من القراءة

استكشف نماذج وأدوات أخرى متطورة في Ultralytics :

  • YOLOv8 - النموذج الكلاسيكي SOTA المعروف باستقراره.
  • RT-DETR - محول الكشف في الوقت الحقيقي للمهام عالية الدقة.
  • YOLOv9 - يتميز بمعلومات التدرج القابلة للبرمجة (PGI).
  • YOLOv10 - رائد التدريب NMS.
  • YOLO11 - سلف قوي للجيل الحالي.

تعليقات