Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين DAMO-YOLO و YOLOv8#

يشهد مجال الرؤية الحاسوبية في الوقت الفعلي تغيراً مستمراً مع دفع الباحثين والمهندسين لحدود السرعة والدقة. وتعد كل من DAMO-YOLO و Ultralytics YOLOv8 محطتين هامتين في هذه الرحلة. وفي حين تهدف كلتا النماذج إلى تحسين التوازن بين زمن الاستجابة ومتوسط دقة الملاءمة (mAP)، إلا أنهما تتبعان نهجاً معمارياً وفلسفياً مختلفاً تماماً في حل تحديات كشف الكائنات.

سيقدم هذا التحليل التقني الشامل مقارنة بين بنياتهما الأساسية، ومنهجيات التدريب، وعمليات النشر العملية لمساعدتك في اختيار الأداة المناسبة لمشروعك القادم في مجال الذكاء الاصطناعي.

Link to this sectionسلالة النماذج والمواصفات#

يوفر فهم أصول نماذج التعلم العميق هذه سياقاً قيماً فيما يتعلق بأهداف تصميمها وأنظمة النشر الخاصة بها.

Link to this sectionتفاصيل DAMO-YOLO#

المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
المؤسسة: Alibaba Group
التاريخ: 23-11-2022
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: tinyvision/DAMO-YOLO

تعرف على المزيد حول DAMO-YOLO

Link to this sectionتفاصيل Ultralytics YOLOv8#

المؤلفون: Glenn Jocher, Ayush Chaurasia, و Jing Qiu
المؤسسة: Ultralytics
التاريخ: 10-01-2023
GitHub: ultralytics/ultralytics
التوثيق: وثائق YOLOv8

تعرف على المزيد حول YOLOv8

Link to this sectionالابتكارات المعمارية#

تنبثق خصائص الأداء لكلتا البنيتين من قراراتهما الهيكلية الفريدة.

Link to this sectionDAMO-YOLO: مدفوع بالبحث عن المعماريات#

يعتمد DAMO-YOLO بشكل كبير على البحث في معمارية الشبكات (NAS) لاكتشاف هياكل الشبكة المثلى تلقائياً. وهو يقدم مفهوماً يسمى MAE-NAS، والذي يبحث عن هياكل أساسية توفر أداءً عالياً مع زمن استجابة منخفض. بالإضافة إلى ذلك، فإنه يستخدم RepGFPN (شبكة هرمية للميزات العامة المعاد تسيير معلماتها) بكفاءة لتعزيز دمج الميزات عبر مقاييس مكانية مختلفة.

لتحسين التدريب، قام فريق Alibaba بدمج تصميم ZeroHead وتخصيص التسميات باستخدام AlignedOTA. علاوة على ذلك، فإنهم يعتمدون بشدة على عملية معقدة لتقطير المعرفة، حيث يوجه نموذج معلم ثقيل نموذج طالب خفيف الوزن، مما يحقق مقاييس دقة أعلى في المعايير الأكاديمية.

Link to this sectionYOLOv8: مبسط ومتعدد الاستخدامات#

اتبعت Ultralytics نهجاً يركز على المطورين مع YOLOv8. فقد انتقلت من التصميم المعتمد على المرساة في YOLOv5 إلى معمارية خالية من المراسي، مما قلل بشكل كبير من عدد تنبؤات صناديق الإحاطة وتسريع الاستنتاج. أدى إدخال وحدة C2f (عنق الزجاجة الجزئي متعدد المراحل مع التلافيف 2) إلى تحسين تدفق التدرج وتمثيل الميزات دون إضافة عبء حسابي مفرط.

على عكس النماذج التي تستهدف صناديق الإحاطة بدقة، تم تصميم YOLOv8 من الألف إلى الياء ليكون متعدد الوسائط. ويدعم PyTorch الموحد برمجياً محلياً تجزئة الحالات، وتقدير الوضعية، وتصنيف الصور، مما يوفر على المهندسين عناء تجميع مستودعات متباينة.

التدريب الفعال

تتطلب نماذج Ultralytics بطبيعتها ذاكرة أقل أثناء التدريب مقارنة بالمعماريات الثقيلة القائمة على Transformer، مما يسمح بتحقيق نتائج متطورة على وحدات معالجة الرسومات الاستهلاكية القياسية.

Link to this sectionمواجهة الأداء#

عند مقارنة المقاييس الخام، من الضروري تحليل كيفية ترجمة القدرات النظرية إلى أداء الأجهزة. يوضح الجدول أدناه المقايضات عبر أحجام النماذج المختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

بينما يُظهر DAMO-YOLO نسباً قوية بين المعاملات والدقة بفضل تقنيات التقطير الخاصة به، يوفر YOLOv8 تدرجاً أوسع لأحجام النماذج (من Nano إلى Extra-large). يمثل نموذج YOLOv8 Nano نموذجاً رائعاً في تحسين الحافة، حيث يستهلك موارد أقل بينما يقدم دقة عالية الاستخدام.

Link to this sectionالنظام البيئي وتجربة المطور#

المميز الحقيقي بين الأوراق الأكاديمية والأنظمة الجاهزة للإنتاج هو النظام البيئي.

يمكن أن تجعل اعتمادية DAMO-YOLO على خطوط أنابيب تقطير المعرفة المكثفة عملية التدريب المخصص مرهقة. يتطلب إنشاء نموذج معلم، ونقل المعرفة، وضبط الهياكل الأساسية القائمة على NAS ذاكرة CUDA عالية وتكوينات متقدمة، مما يؤدي غالباً إلى إبطاء فرق الهندسة الرشيقة.

على العكس من ذلك، يدعم النظام البيئي لـ Ultralytics سهولة الاستخدام. من خلال منصة Ultralytics، يمكن للمطورين الوصول إلى واجهات برمجة تطبيقات بسيطة، وتوثيق شامل، وتكاملات قوية لتتبع التجارب. تجعل إطار عمل Python الموحد بناء خطوط الأنابيب المعقدة أمراً تافهاً.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

يضمن سير العمل المبسط هذا، إلى جانب عمليات التصدير السلسة إلى OpenVINO و TensorRT، مساراً خالياً من الاحتكاك من النماذج الأولية المحلية إلى عمليات النشر في السحابة أو الحافة.

Link to this sectionتطبيقات العالم الحقيقي وحالات الاستخدام المثالية#

غالباً ما يعتمد الاختيار بين هذه المعماريات على القيود التشغيلية لبيئتك.

Link to this sectionأين يتناسب DAMO-YOLO#

يعد DAMO-YOLO خياراً ممتازاً للبيئات الأكاديمية التي تدرس البحث في معمارية الشبكات أو للباحثين الذين يحاولون تكرار استراتيجيات إعادة تسيير المعلمات المعقدة. كما يمكن أن يتفوق في التطبيقات الصناعية الخاضعة لرقابة صارمة، مثل كشف العيوب عالي السرعة في خطوط التصنيع، بشرط أن يمتلك الفريق موارد الحوسبة للتعامل مع تدريبه متعدد المراحل.

Link to this sectionلماذا تتصدر Ultralytics في الإنتاج#

بالنسبة للغالبية العظمى من المشاريع التجارية، توفر نماذج Ultralytics توازناً متفوقاً في الأداء.

  • تجزئة التجزئة الذكية: استخدام قدرات المهام المتعددة في YOLOv8 للتعامل مع كشف صناديق الإحاطة للمخزون وتقدير الوضعية لتحليل سلوك العملاء.
  • الزراعة: توظيف تجزئة الحالات للكشف عن حدود النباتات الدقيقة والأعشاب الضارة في خلاصات الجرارات في الوقت الفعلي.
  • التصوير الجوي: الاستفادة من صناديق الإحاطة الموجهة (OBB) لتتبع المركبات والسفن المدارة بدقة من الطائرات بدون طيار أو الأقمار الصناعية.
نماذج أخرى بارزة

إذا كنت تستكشف المشهد الأوسع، فقد تكون مهتماً أيضاً بمقارنة YOLOv10 أو YOLO11 اللذين يجلبان مزيداً من التطورات للكشف بدون مراسي.

Link to this sectionالتطلع للمستقبل: دخول YOLO26#

بينما يظل YOLOv8 نموذجاً أساسياً، استمر المجال في التقدم. بالنسبة لجميع التطورات الجديدة، فإن YOLO26 هو المعيار الموصى به. تم إصداره في يناير 2026، ويمثل قفزة نوعية في تشكيلة Ultralytics.

يتبنى YOLO26 تصميماً أصلياً شاملاً لا يحتاج إلى NMS، مما يقضي تماماً على عنق زجاجة كبت غير الحد الأقصى التقليدي. تؤدي هذه الطفرة الهيكلية إلى استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية، مما يجعله قوة مطلقة لحوسبة الحافة وأجهزة IoT.

علاوة على ذلك، يقدم YOLO26 محسن MuSGD، وهو هجين مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) التي تضمن تقارباً أسرع وحلقات تدريب مستقرة للغاية. جنباً إلى جنب مع خوارزميات ProgLoss + STAL الجديدة، يُظهر YOLO26 تحسينات دراماتيكية في التعرف على الأشياء الصغيرة، مما يضمن أن عمليات النشر الخاصة بك ليست سريعة فحسب، بل دقيقة بلا هوادة.

تعرف على المزيد حول YOLO26

التعليقات