YOLOv6.0 مقابلYOLO: مواجهة تقنية في مجال الكشف عن الأجسام في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية باستمرار، حيث توسع البنى الجديدة حدود ما هو ممكن في مجال الكشف عن الأجسام في الوقت الفعلي. يعد YOLOv6. YOLOv6 وYOLO منافسين بارزين في هذا المجال. يقدم كلا النموذجين ابتكارات معمارية فريدة مصممة لتحقيق أقصى قدر من الأداء على الأجهزة الصناعية. يقدم هذا الدليل مقارنة تقنية شاملة بين هذين النموذجين، ويستكشف هندستهما ومنهجيات التدريب وحالات الاستخدام المثالية، مع تقديم مزايا الجيل التالي من Ultralytics مثل YOLO26.

ملفات تعريف النماذج

YOLOv6.0: إنتاجية على مستوى صناعي

تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وهو مصمم خصيصًا للتطبيقات الصناعية عالية الإنتاجية. ويركز بشكل كبير على تعظيم الأداء على مسرعات الأجهزة مثل NVIDIA .

المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
المنظمة: ميتوان
التاريخ: 2023-01-13
أرخايف:2301.05586
GitHub:meituan/YOLOv6
الوثائق:وثائق Ultralytics YOLOv6

يقدم YOLOv6 وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين دمج الميزات ويستخدم استراتيجية التدريب بمساعدة المثبت (AAT). تجمع هذه الاستراتيجية بين مزايا أجهزة الكشف القائمة على المثبت وأجهزة الكشف الخالية من المثبت أثناء التدريب، مع الحفاظ على الاستدلال خالياً تماماً من المثبت. يجعله العمود الفقري EfficientRep سهل الاستخدام للغاية مع GPU ، مما يجعله مثالياً لمعالجة كميات هائلة من بيانات فهم الفيديو.

تعرف على المزيد حول YOLOv6

DAMO-YOLO: سريع ودقيق عبر NAS

تم تطوير DAMO-YOLO بواسطة مجموعة Alibaba، ويستفيد من البحث عن البنية العصبية (NAS) لاكتشاف هياكل الشبكة الأساسية الأكثر كفاءة تلقائيًا للاستنتاج في الوقت الفعلي.

المؤلفون: شيانزه شو، يي تشي جيانغ، ويهوا تشن، وآخرون.
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv:2211.15444v2
GitHub:tinyvision/DAMO-YOLO

يبرز DAMO-YOLO بفضل RepGFPN الخاص به (شبكة هرمية للميزات المعممة المعاد توسيطها) لدمج ميزات فعال متعدد المقاييس وتصميمه ZeroHead، الذي يقلل بشكل كبير من العبء الحسابي في رأس الكشف. كما يدمج تخصيص تسميات AlignedOTA وتقنيات تقطير المعرفة القوية لتعزيز الدقة دون زيادة عدد معلمات النموذج.

تعرف على المزيد حول DAMO-YOLO

تقطير علوي

بينماYOLO دقة ممتازة، فإن اعتماده الكبير على تقطير المعرفة أثناء التدريب يتطلب نموذج "مدرس" أكبر بكثير. وهذا يزيد بشكل كبير من CUDA المطلوبة أثناء مرحلة التدريب مقارنة بالبنى الأبسط.

مقارنة الأداء

عند تقييم نماذج الكشف عن الأجسام، من المهم تحقيق التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال. فيما يلي مقارنة مفصلة بين YOLOv6.0 وYOLO نماذج مختلفة.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

يُظهر YOLOv6.0 سرعة استثنائية على NVIDIA باستخدام TensorRT ، خاصة في إصداراته النانوية والصغيرة. ومع ذلك، فإن البنية الأساسية المُحسّنة لـ NASYOLO تتطلب عادةً عددًا أقل من FLOPs على النطاقات المتوسطة والكبيرة، مما ينتج عنه مزايا طفيفة في زمن الاستجابة بالنسبة للعمليات النشر الأكبر حجمًا.

ميزة Ultralytics: تقديم YOLO26

على الرغم منYOLO YOLOv6. YOLOv6 وYOLO أدواتYOLO المطورين غالبًا ما يواجهون تحديات تتعلق بخطوط الإنتاج المعقدة، ومتطلبات الذاكرة العالية أثناء التدريب، والبنى الصارمة أحادية المهام. يوفر Ultralytics بيئة عمل أكثر بساطة للمطورين.

مع إصدار YOLO26، Ultralytics تعريف أحدث تقنيات الذكاء الاصطناعي في مجال الرؤية. تم إصدار Ultralytics في يناير 2026، وهو يوسع حدود الكفاءة والتنوع.

الابتكارات الرئيسية في YOLO26

تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم الرائدة في YOLOv10، يلغي YOLO26 بشكل أصيل معالجة ما بعد التثبيط غير الأقصى (NMS). وهذا يقلل بشكل كبير من تباين زمن الانتقال ويبسط النشر على الأجهزة الطرفية عبر CoreML أو TFLite.
إزالة DFL: من خلال إزالة Distribution Focal Loss، يبسط YOLO26 عملية التصدير ويعزز بشكل كبير التوافق مع وحدات التحكم الدقيقة منخفضة الطاقة وأجهزة الحوسبة الطرفية.
سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: للتطبيقات التي تفتقر إلى أجهزة GPU مخصصة، توفر تحسينات YOLO26 لوحدة CPU سرعة لا مثيل لها، متفوقة على النماذج التي تعتمد بشكل كبير على GPU مثل YOLOv6.
مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّن MuSGD (وهو هجين من SGD و Muon) لضمان تدريب مستقر وتقارب سريع.
ProgLoss + STAL: وظائف الخسارة المتقدمة تحسن بشكل كبير التعرف على الكائنات الصغيرة، مما يجعل YOLO26 مثاليًا لـ عمليات الطائرات بدون طيار وتتبع الأهداف البعيدة.
تعدد استخدامات المهام المتعددة: على عكس DAMO-YOLO، الذي هو مجرد كاشف (detector)، يوفر YOLO26 دعمًا جاهزًا لـتجزئة الكائنات (Instance Segmentation)، وتقدير الوضعية (Pose Estimation) (عبر تقدير الاحتمالية اللوغاريتمية المتبقية)، والصناديق المحيطة الموجهة (OBB) ضمن واجهة برمجة تطبيقات (API) موحدة واحدة.

تعرف على المزيد حول YOLO26

تدريب فعال من حيث الاستهلاك للذاكرة

على عكس هياكل المحولات المعقدة مثل RT-DETR أو خطوط الأنابيب الثقيلةYOLO، تشتهر Ultralytics بانخفاض مساحة VRAM التي تشغلها. يمكنك بسهولة تدريب نموذج YOLO26 على أجهزة من فئة المستهلكين.

Python مبسط

لا ينبغي أن يتطلب تدريب ونشر النماذج الحديثة مئات الأسطر من التعليمات البرمجية النمطية. تعملPython Ultralytics Python على تبسيط دورة حياة التعلم الآلي.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")

حالات الاستخدام المثالية

يعتمد اختيار البنية الصحيحة كليًا على قيود النشر لديك:

متى تستخدم YOLOv6.0

تحليلات الفيديو ذات الدفعات الكبيرة: ممتاز لمعالجة تدفقات الفيديو الكثيفة على خوادم GPU للمؤسسات حيث يمكن الاستفادة الكاملة من TensorRT.
الأتمتة الصناعية: خطوط التصنيع عالية السرعة التي تقوم بفحص الجودة واكتشاف العيوب.

متى تستخدم DAMO-YOLO

السيليكون المخصص: البحث في تعيين البحث عن البنية العصبية (Neural Architecture Search) لأجهزة NPU محددة ومملوكة.
البحث الأكاديمي: قياس أداء تقنيات تكثيف المعرفة الجديدة للشبكات في الوقت الفعلي.

متى تستخدم Ultralytics

عمليات النشر على الحافة والأجهزة المحمولة: التصميم الخالي من NMS، وإزالة DFL، وزيادة سرعة CPU بنسبة 43% يجعله البطل بلا منازع لتكاملات iOS و Android و Raspberry Pi.
من النماذج الأولية السريعة إلى الإنتاج: يتيح التكامل السلس مع منصة Ultralytics للفرق الانتقال من تسمية مجموعة البيانات إلى النشر السحابي العالمي في أيام، وليس شهورًا.
مسارات رؤية معقدة: عندما يتطلب المشروع detect مربعات الإحاطة جنبًا إلى جنب مع نقاط مفتاح الوضعية البشرية وأقنعة segment الدقيقة في وقت واحد.

الخلاصة

لقد ساهم كل من YOLOv6-3.0 وDAMO-YOLO بشكل كبير في علم اكتشاف الكائنات في الوقت الفعلي. قام YOLOv6 بتحسين تعظيم استخدام GPU، بينما أظهر DAMO-YOLO قوة البحث التلقائي عن البنية.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن المزيج المثالي بين الدقة وسرعة الاستدلال وقابلية صيانة النظام البيئي، فإن Ultralytics YOLO هي الخيار الأول. بفضل التحسينات الرائدة التي أدخلت على YOLO26، أصبح إنشاء تطبيقات الرؤية الحاسوبية على مستوى المؤسسات أسهل من أي وقت مضى.

لمزيد من الاستكشاف، قد تكون مهتمًا أيضًا بمقارنة هذه النماذج مع بنى أخرى في وثائقنا، مثل YOLO11 أو النهج القائمة على المحولات مثل RT-DETR.