Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv8 و DAMO-YOLO#

يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، حيث تدفع المعماريات الجديدة بحدود الممكن على أجهزة الحافة ومجموعات السحابة الضخمة. في هذا التحليل التقني المعمق، نقارن بين نموذجين بارزين للكشف عن الكائنات في الوقت الفعلي: YOLOv8 و DAMO-YOLO. من خلال فحص معمارياتهما، ومقاييس الأداء، ومنهجيات التدريب، يمكن لمهندسي تعلم الآلة اتخاذ قرارات مدروسة لخطوط أنابيب النشر الخاصة بهم.

Link to this sectionخلفيات ونشأة النماذج#

تم تقديم كلا النموذجين في نفس الفترة تقريباً، لكنهما ينبعان من فلسفات تصميم وأهداف بحثية مختلفة.

Link to this sectionتفاصيل YOLOv8#

تعرف على المزيد حول YOLOv8

Link to this sectionتفاصيل DAMO-YOLO#

تعرف على المزيد حول DAMO-YOLO

Link to this sectionالابتكارات المعمارية#

Link to this sectionYOLOv8: تصميم مرن بدون نقاط ارتكاز (Anchor-Free)#

قدم Ultralytics YOLOv8 تحسينات كبيرة مقارنة بسابقاته، مما رسخ مكانته كنموذج رائد وعالي الموثوقية. يتميز برأس كشف خالٍ من نقاط الارتكاز (anchor-free)، مما يقلل من عدد تنبؤات الصناديق ويسرع عملية الاستنتاج. تستخدم المعمارية رأساً مفككاً (decoupled head)، يفصل بين مهام تحديد الكائن، والتصنيف، والانحدار، مما يؤدي إلى تنبؤات أكثر دقة لصناديق الإحاطة.

علاوة على ذلك، يطبق YOLOv8 دالة خسارة توزيع البؤرة (DFL) جنباً إلى جنب مع خسارة CIoU، مما يعزز قدرة النموذج على تحديد حدود الكائنات بدقة، خاصة للأهداف الصغيرة أو المحجوبة. تم تحسين هيكله الأساسي (backbone) بشكل كبير لكل من التنفيذ على GPU و CPU.

Link to this sectionDAMO-YOLO: مدفوع بالبحث عن المعماريات#

يتبع DAMO-YOLO نهجاً مختلفاً، معتمداً بشكل كبير على البحث عن معمارية الشبكات العصبية (NAS) لتصميم هيكله الأساسي تلقائياً. قدم فريق Alibaba نظام "MAE-NAS" لإيجاد هياكل توفر مقايضات مثالية بين زمن الاستجابة والدقة، وتحديداً تحت تسريع TensorRT.

يدمج النموذج RepGFPN (شبكة هرمية للميزات معادة التقييس) لدمج الميزات بكفاءة، وتصميماً "ZeroHead" لتقليل العبء الحسابي لرأس الكشف. أثناء التدريب، يستفيد من AlignedOTA لتخصيص التسميات ويعتمد بشكل كبير على عملية معقدة لتقطير المعرفة، مما يتطلب نموذجاً معلماً أكبر للإشراف على نموذج الطالب المستهدف.

تعقيد التدريب

بينما يحقق DAMO-YOLO مقاييس زمن استجابة مبهرة عبر NAS والتقطير، فإن هذا يتطلب ذاكرة CUDA ووقت حوسبة أكبر بكثير أثناء التدريب مقارنة بخط أنابيب التدريب أحادي المرحلة والمحسن للغاية في YOLOv8.

Link to this sectionالأداء والمقاييس#

عند نشر نماذج الرؤية الحاسوبية في بيئة الإنتاج، يعد تحقيق التوازن بين الدقة (mAP) وسرعة الاستنتاج أمراً حاسماً. يوضح الجدول أدناه أداء كلا النموذجين عبر أحجام مختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

يُظهر YOLOv8 توازناً استثنائياً في الأداء. يتطلب نموذج YOLOv8n (نانو) 3.2 مليون معامل فقط مقارنة بـ 8.5 مليون في DAMO-YOLOt، مما يجعله متفوقاً بشكل كبير للأجهزة المحمولة أو البيئات ذات متطلبات الذاكرة الصارمة. علاوة على ذلك، يوفر YOLOv8 نطاقاً أوسع من الأحجام، يصل إلى YOLOv8x عالي الدقة لأحمال العمل المستندة إلى السحابة.

Link to this sectionتجربة المطور والنظام البيئي#

Link to this sectionسهولة الاستخدام وكفاءة التدريب#

أحد أكبر العوامل المميزة هو تجربة المستخدم. تم تصميم النظام البيئي لـ Ultralytics لسرعة المطورين. يتطلب تدريب نموذج YOLOv8 مخصص استخداماً منخفضاً جداً للذاكرة ويمكن تنفيذه عبر Python API موحدة أو واجهة سطر الأوامر.

على العكس من ذلك، يتطلب إعادة إنتاج تدريب DAMO-YOLO المعزز بالتقطير غالباً التنقل عبر ملفات تكوين معقدة والتعامل مع تتبع التجارب متعدد المراحل بين المعلم والطالب.

فيما يلي مثال على مدى سهولة التدريب والتحقق والتصدير لـ YOLOv8 باستخدام Python:

from ultralytics import YOLO

# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")

# Export the trained model to ONNX format
path = model.export(format="onnx")

Link to this sectionتعدد الاستخدامات عبر مهام الرؤية#

تم بناء DAMO-YOLO بشكل صارم للكشف عن الكائنات بصناديق الإحاطة. على النقيض من ذلك، تدعم معمارية YOLOv8 أصلياً مهام متعددة. من خلال تبديل أوزان النموذج ببساطة، يمكن للمطورين إجراء تجزئة الكائنات، وتصنيف الصور، وتقدير الوضعية دون تغيير قاعدة بيانات النشر الأساسية الخاصة بهم. هذا التنوع يجعل نماذج Ultralytics عملية أكثر بكثير للتطبيقات المعقدة.

Link to this sectionحالات الاستخدام في العالم الحقيقي#

Link to this sectionمتى تستخدم YOLOv8#

مزيج YOLOv8 من السرعة والدقة وسهولة النشر يجعله مثالياً لـ:

  • تحليلات البيع بالتجزئة الذكية: إجراء تتبع الكائنات لمراقبة سلوك العملاء أو أتمتة فحص المخزون.
  • روبوتات الزراعة: الاستفادة من أدائه القوي على الأجهزة المتنوعة لتحديد المحاصيل أو الآفات في الوقت الفعلي.
  • تشخيصات الرعاية الصحية: استخدام تجزئة الكائنات لتخطيط الشذوذ في الصور الطبية بسرعة ودقة.
  • نشر الحافة: التكامل السلس مع تنسيقات التصدير مثل OpenVINO و CoreML يسمح لـ YOLOv8 بالتألق على الأجهزة المحدودة.

Link to this sectionمتى تستخدم DAMO-YOLO#

يمكن أن يكون DAMO-YOLO مفيداً في سيناريوهات متخصصة، لا سيما:

  • أبحاث NAS الأكاديمية: للفرق التي تدرس إعادة التقييس أو منهجيات تصميم المعماريات المؤتمتة.
  • خطوط الأنابيب المقيدة بـ GPU بشكل صارم: التطبيقات التي تعمل حصرياً على أجهزة NVIDIA محددة حيث تم تحسين هياكل NAS بشكل كبير لحدود تنفيذ TensorRT.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv8 و DAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv8#

يعد YOLOv8 خياراً قوياً لـ:

  • النشر متعدد المهام المتنوع: المشاريع التي تتطلب نموذجاً ثابتاً لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعية داخل نظام Ultralytics البيئي.
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع خطوط أنابيب نشر مستقرة ومختبرة جيداً.
  • دعم مجتمعي ونظام بيئي واسع: التطبيقات التي تستفيد من دروس YOLOv8 الواسعة، والتكاملات مع أطراف ثالثة، وموارد المجتمع النشطة.

Link to this sectionمتى تختار DAMO-YOLO#

يوصى باستخدام DAMO-YOLO من أجل:

  • تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionنظرة إلى المستقبل: نماذج Ultralytics الأحدث#

بينما يظل YOLOv8 حصاناً طموحاً يمكن الاعتماد عليه، فإن مجال الرؤية الحاسوبية يتحرك بسرعة. يجب على المستخدمين أيضاً التفكير في استكشاف الأجيال الأحدث:

YOLO26: يمثل الجيل الأحدث، Ultralytics YOLO26، تحولاً نموذجياً. يقدم تصميماً أصلياً شاملاً وخالياً من NMS، مما يلغي تماماً اختناقات زمن الاستجابة المرتبطة بمعالجة Non-Maximum Suppression اللاحقة. مدعوماً بـ MuSGD Optimizer الجديد (هجين من SGD و Muon) ووظائف خسارة ProgLoss + STAL متخصصة، يحقق YOLO26 تدريباً مستقراً بشكل ملحوظ وتحسيناً كبيراً في التعرف على الأشياء الصغيرة. مع إزالة DFL (تمت إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع أجهزة الحافة/منخفضة الطاقة)، توفر التعديلات المعمارية سرعة تصل إلى 43% أسرع في استنتاج CPU مقارنة بالأجيال السابقة، مما يجعله الخيار النهائي لحوسبة الحافة الحديثة.

YOLO11: بديل ممتاز آخر، يقدم Ultralytics YOLO11 تحسينات معمارية تدريجية على YOLOv8 ويظل نموذجاً قوياً ومتبنى على نطاق واسع في المجتمع.

بسّط سير عملك

هل أنت مستعد لنقل نماذجك من النموذج الأولي إلى الإنتاج؟ استخدم منصة Ultralytics لتعيين مجموعات البيانات تلقائياً، وتتبع التجارب، ونشر النماذج بسلاسة إلى السحابة أو أجهزة الحافة.

في الختام، بينما يقدم DAMO-YOLO رؤى أكاديمية مثيرة للاهتمام حول البحث عن المعماريات، توفر نماذج Ultralytics نظاماً بيئياً أكثر نضجاً وتنوعاً وصديقاً للمطورين بشكل ملحوظ. سواء كنت متمسكاً باستقرار YOLOv8 المثبت أو قمت بالترقية إلى معمارية YOLO26 فائقة السرعة والخالية من NMS، تظل مجموعة Ultralytics الخيار الأول لرؤية الذكاء الاصطناعي في الوقت الفعلي.

المساهمون

التعليقات