Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 مقابل DAMO-YOLO: مواجهة تقنية في اكتشاف الكائنات في الوقت الفعلي#

يشهد مشهد رؤية الحاسوب تطوراً مستمراً، حيث تدفع البنيات الجديدة حدود الممكن في اكتشاف الكائنات في الوقت الفعلي. من أبرز المنافسين في هذا المجال YOLOv6-3.0 وDAMO-YOLO. يقدم كلا النموذجين ابتكارات معمارية فريدة مصممة لزيادة الأداء إلى أقصى حد على الأجهزة الصناعية. يقدم هذا الدليل مقارنة تقنية شاملة بين هذين النموذجين، مستكشفاً بنيتيهما ومنهجيات التدريب وحالات الاستخدام المثالية، مع تقديم مزايا الجيل التالي لنماذج Ultralytics مثل YOLO26.

Link to this sectionملفات تعريف النموذج#

Link to this sectionYOLOv6-3.0: إنتاجية بمستوى صناعي#

تم تطوير YOLOv6-3.0 بواسطة قسم الذكاء الاصطناعي للرؤية في Meituan، وهو مصمم خصيصاً للتطبيقات الصناعية ذات الإنتاجية العالية. ويركز بشكل كبير على تعظيم الأداء على مسرعات الأجهزة مثل وحدات معالجة الرسومات NVIDIA.

يقدم YOLOv6-3.0 وحدة تسلسل ثنائية الاتجاه (BiC) لتحسين دمج الميزات ويستخدم استراتيجية التدريب بمساعدة المرساة (AAT). تجمع هذه الاستراتيجية بين فوائد الكاشفات المعتمدة على المرساة والكاشفات الخالية من المرساة أثناء التدريب، مع الحفاظ على الاستنتاج خالياً تماماً من المرساة. تجعل بنيته الأساسية EfficientRep منه صديقاً للغاية للأجهزة من أجل معالجة الدفعات على GPU، وهو مثالي لمعالجة كميات هائلة من بيانات فهم الفيديو.

اعرف المزيد عن YOLOv6

Link to this sectionDAMO-YOLO: سريع ودقيق عبر NAS#

تم إنشاء DAMO-YOLO بواسطة Alibaba Group، ويستفيد من البحث عن البنية العصبية (NAS) لاكتشاف أكثر هياكل البنية الأساسية كفاءة للاستنتاج في الوقت الفعلي تلقائياً.

  • المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen، وآخرون.
  • المنظمة: Alibaba Group
  • التاريخ: 2022-11-23
  • Arxiv: 2211.15444v2
  • GitHub: tinyvision/DAMO-YOLO

يتميز DAMO-YOLO بشبكة هرم ميزات معممة معاد معاييرتها (RepGFPN) لدمج ميزات متعددة المقاييس بكفاءة وتصميم ZeroHead الخاص به، والذي يقلل بشكل كبير من العبء الحسابي في رأس الكشف. كما يدمج تعيين التسميات AlignedOTA وتقنيات تقطير المعرفة القوية لتعزيز الدقة دون زيادة عدد معلمات النموذج.

اعرف المزيد عن DAMO-YOLO

عبء التقطير

بينما يحقق DAMO-YOLO دقة ممتازة، فإن اعتماده الكبير على تقطير المعرفة أثناء التدريب يتطلب نموذج "معلم" أكبر بكثير. وهذا يزيد بشكل كبير من ذاكرة CUDA المطلوبة خلال مرحلة التدريب مقارنة بالبنيات الأبسط.

Link to this sectionمقارنة الأداء#

عند تقييم نماذج اكتشاف الكائنات، يعد التوازن بين متوسط دقة متوسط (mAP) وسرعة الاستنتاج أمراً بالغ الأهمية. فيما يلي مقارنة تفصيلية بين YOLOv6-3.0 وDAMO-YOLO عبر مقاييس نماذج مختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

يُظهر YOLOv6-3.0 سرعة استثنائية على وحدات معالجة الرسومات NVIDIA باستخدام تحسينات TensorRT، خاصة في متغيراته النانو والصغيرة. ومع ذلك، تميل البنيات الأساسية المحسنة بواسطة NAS في DAMO-YOLO إلى طلب عدد أقل من عمليات الفاصلة العائمة (FLOPs) عند المقاييس المتوسطة والكبيرة، مما يؤدي إلى مزايا طفيفة في زمن الوصول للنشر الأكبر.

Link to this sectionميزة Ultralytics: ظهور YOLO26#

بينما يعد كل من YOLOv6-3.0 وDAMO-YOLO أدوات قوية، غالباً ما يواجه المطورون تحديات تتعلق بخطوط أنابيب النشر المعقدة، ومتطلبات الذاكرة العالية أثناء التدريب، والبنيات الجامدة ذات المهمة الواحدة. يوفر نظام Ultralytics البيئي تجربة مطور مبسطة بشكل ملحوظ.

مع إطلاق YOLO26، أعادت Ultralytics تعريف حالة الفن في ذكاء الرؤية الاصطناعي. تم إطلاق Ultralytics YOLO26 في يناير 2026، وهو يدفع حدود الكفاءة والتنوع.

Link to this sectionالابتكارات الرئيسية في YOLO26#

  • تصميم من طرف إلى طرف بدون NMS: بناءً على المفاهيم التي تم ريادتها في YOLOv10، يلغي YOLO26 محلياً معالجة ما بعد الكبت غير الأقصى (NMS). وهذا يقلل بشكل كبير من تباين زمن الوصول ويبسط النشر على أجهزة الحافة عبر CoreML أو TFLite.
  • إزالة DFL: من خلال إزالة توزيع خسارة البؤرة، يبسط YOLO26 عملية التصدير ويعزز التوافق بشكل كبير مع وحدات التحكم الدقيقة منخفضة الطاقة وأجهزة الحافة.
  • استنتاج أسرع بنسبة تصل إلى 43% على CPU: للتطبيقات التي تفتقر إلى أجهزة GPU مخصصة، توفر تحسينات CPU في YOLO26 سرعة لا مثيل لها، متفوقة على النماذج التي تعتمد بشكل كبير على GPU مثل YOLOv6.
  • محسن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 محسن MuSGD (هجين من SGD وMuon) لضمان تدريب مستقر وتقارب سريع.
  • ProgLoss + STAL: تعمل دوال الخسارة المتقدمة على تحسين التعرف على الكائنات الصغيرة بشكل كبير، مما يجعل YOLO26 مثالياً لـ عمليات الطائرات بدون طيار وتتبع الأهداف البعيدة.
  • تعدد المهام: على عكس DAMO-YOLO، الذي يعد كاشفاً فقط، يوفر YOLO26 دعماً جاهزاً لـ تجزئة المثيلات وتقدير الوضع (عبر تقدير احتمالية اللوغاريتم المتبقي)، وصناديق التقييد الموجهة (OBB) ضمن واجهة برمجة تطبيقات واحدة وموحدة.

تعرف على المزيد حول YOLO26

تدريب فعال في استهلاك الذاكرة

على عكس بنيات Transformer المعقدة مثل RT-DETR أو خطوط أنابيب DAMO-YOLO الثقيلة في التقطير، تشتهر نماذج Ultralytics ببصمتها المنخفضة في ذاكرة الفيديو (VRAM). يمكنك تدريب نموذج YOLO26 بسهولة على أجهزة المستهلك العادية.

Link to this sectionسير عمل Python مبسط#

لا ينبغي أن يتطلب تدريب ونشر أحدث النماذج مئات الأسطر من الكود القياسي. تعمل حزمة Python من Ultralytics على تبسيط دورة حياة التعلم الآلي.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")

Link to this sectionحالات الاستخدام المثالية#

يعتمد اختيار البنية الصحيحة تماماً على قيود النشر الخاصة بك:

Link to this sectionمتى تستخدم YOLOv6-3.0#

  • تحليلات الفيديو عالية الدفعات: ممتاز لمعالجة تدفقات الفيديو الكثيفة على خوادم GPU للمؤسسات حيث يمكن استخدام TensorRT بالكامل.
  • الأتمتة الصناعية: خطوط التصنيع عالية السرعة التي تقوم باكتشاف عيوب مراقبة الجودة.

Link to this sectionمتى تستخدم DAMO-YOLO#

  • السيليكون المخصص: البحث في تعيين البحث عن البنية العصبية لأجهزة NPU محددة ومملوكة.
  • البحث الأكاديمي: قياس أداء تقنيات تقطير المعرفة الجديدة للشبكات في الوقت الفعلي.

Link to this sectionمتى تستخدم Ultralytics YOLO26#

  • نشر الحافة والجوال: التصميم الخالي من NMS، وإزالة DFL، وزيادة سرعة CPU بنسبة 43% تجعل منه البطل بلا منازع لتكاملات iOS وAndroid وRaspberry Pi.
  • النماذج الأولية السريعة إلى الإنتاج: يتيح التكامل السلس مع منصة Ultralytics للفرق الانتقال من تعليق مجموعة البيانات إلى النشر السحابي العالمي في أيام، وليس أشهر.
  • خطوط أنابيب الرؤية المعقدة: عندما يتطلب المشروع اكتشاف صناديق التقييد إلى جانب النقاط الرئيسية لوضع الإنسان وأقنعة التجزئة الدقيقة في وقت واحد.

Link to this sectionالخلاصة#

ساهم كل من YOLOv6-3.0 وDAMO-YOLO بشكل كبير في علم اكتشاف الكائنات في الوقت الفعلي. قام YOLOv6 بتحسين تعظيم GPU، بينما عرض DAMO-YOLO قوة البحث الآلي عن البنية.

ومع ذلك، بالنسبة للمطورين الذين يسعون للحصول على المزيج النهائي من الدقة وسرعة الاستنتاج وقابلية صيانة النظام البيئي، تظل عائلة Ultralytics YOLO هي الخيار الأول. مع التحسينات الرائدة التي تم تقديمها في YOLO26، لم تكن حاجز الدخول لإنشاء تطبيقات رؤية حاسوبية على مستوى المؤسسات أقل من أي وقت مضى.

لمزيد من الاستكشاف، قد تكون مهتماً أيضاً بمقارنة هذه النماذج ببنيات أخرى في وثائقنا، مثل YOLO11 أو الأساليب القائمة على Transformer مثل RT-DETR.

المساهمون

التعليقات