Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 في مقابل DAMO-YOLO#

عند بناء خطوط أنابيب رؤية حاسوبية حديثة، يعد اختيار بنية الكشف عن الأشياء في الوقت الفعلي المناسبة أمراً بالغ الأهمية. في هذا التحليل الفني الشامل، نستكشف البنيات، ومقاييس الأداء، وحالات الاستخدام المثالية لكل من YOLOv10 و DAMO-YOLO. يمثل كلا النموذجين قفزات كبيرة في قدرات الكشف عن الأشياء، لكنهما يسلكان مسارات معمارية مختلفة لتحقيق أهدافهما.

سواء كان مشروعك يتطلب النشر على أجهزة ذكاء اصطناعي طرفي مقيدة أو يتطلب أقصى درجات الدقة على وحدات معالجة الرسومات السحابية، فإن فهم الفروق الدقيقة في هذه البنيات سيساعدك على اتخاذ قرار مستنير.

Link to this sectionاستكشاف YOLOv10#

تم تقديم YOLOv10 من قبل باحثين في جامعة تسينغhua، وقد أحدث ثورة في عائلة YOLO من خلال تقديم نهج أصيل من الطرف إلى الطرف (end-to-end)، مما يلغي بشكل فعال الحاجة إلى خوارزمية كبت العناصر غير القصوى (NMS) أثناء المعالجة اللاحقة.

تفاصيل YOLOv10:

Link to this sectionالميزات المعمارية الرئيسية#

الابتكار الرئيسي في YOLOv10 هو استراتيجية التخصيص المزدوج المتسق للتدريب الخالي من NMS. تعتمد كاشفات الأشياء التقليدية بشكل كبير على NMS لتصفية الصناديق المحيطة المتداخلة، مما يؤدي إلى زمن انتقال لا يمكن التنبؤ به—وهو عنق زجاجة كبير للتطبيقات في الوقت الفعلي مثل المركبات ذاتية القيادة والروبوتات عالية السرعة. من خلال التنبؤ بصندوق محيط أمثل واحد لكل كائن مباشرةً، يحقق YOLOv10 استنتاجاً يمكن التنبؤ به وبزمن انتقال منخفض للغاية.

علاوة على ذلك، يستخدم النموذج تصميماً شاملاً مدفوعاً بالكفاءة والدقة. تعمل البنية على تحسين المكونات المختلفة، بما في ذلك رأس تصنيف خفيف الوزن وأخذ عينات فرعية مفكك مكانيًا وقناتيًا، مما يقلل بشكل كبير من التكرار الحسابي. وينتج عن ذلك بنية تفتخر بعدد بارامترات أقل وعدد أقل من عمليات FLOP مع الحفاظ على متوسط دقة متوسط (mAP) تنافسي.

تصدير مبسط للإنتاج

نظراً لأن YOLOv10 يزيل عمليات NMS من مخطط الاستنتاج، فإن تصدير النموذج إلى تنسيقات مثل ONNX أو TensorRT يصبح مبسطاً للغاية، مما يجعله مناسباً بشكل استثنائي للنشر على الأجهزة الطرفية.

تعرف على المزيد حول YOLOv10

Link to this sectionمثال على الاستخدام#

تم دمج YOLOv10 بشكل عميق في نظام Ultralytics البيئي، مما يجعله سهل الاستخدام للغاية عبر حزمة Ultralytics Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to TensorRT format
model.export(format="engine", quantize=16)

Link to this sectionاستكشاف DAMO-YOLO#

تم تطوير DAMO-YOLO بواسطة مجموعة Alibaba، ويركز على اكتشاف هياكل شبكات عالية الكفاءة من خلال البحث التلقائي في بنية الشبكة (NAS)، بهدف دفع حدود باريتو للسرعة والدقة.

تفاصيل DAMO-YOLO:

Link to this sectionالميزات المعمارية الرئيسية#

يقدم DAMO-YOLO العديد من التقنيات الجديدة المصممة للتطبيقات الصناعية. أساس النموذج هو العمود الفقري MAE-NAS، الذي يتم إنشاؤه عبر بحث تطوري متعدد الأهداف. تكتشف هذه العملية الآلية هياكل العمود الفقري التي تلتزم بصرامة بميزانيات حسابية محددة مسبقاً، مما يحقق توازناً دقيقاً بين الدقة وزمن انتقال الاستنتاج.

بالإضافة إلى ذلك، تستخدم البنية عنق Efficient RepGFPN. تم تصميم شبكة هرم الميزات هذه لتحسين دمج الميزات عبر مقاييس مختلفة، وهو أمر بالغ الأهمية للمهام المعقدة مثل تحليل الصور الجوية حيث تختلف الكائنات بشكل كبير في الحجم. لتكملة ذلك، ينفذ DAMO-YOLO ZeroHead، وهو رأس كشف بسيط يقلل بشكل كبير من تعقيد طبقات التنبؤ النهائية، مما يوفر وقتاً حسابياً ثميناً أثناء الاستنتاج.

اعرف المزيد عن DAMO-YOLO

Link to this sectionمقارنة الأداء#

عند تقييم بنيات الكشف عن الأشياء، يعد العثور على المقايضة الصحيحة بين سرعة الاستنتاج، وكفاءة البارامترات، ودقة الكشف أمراً بالغ الأهمية. يقارن الجدول أدناه أداء YOLOv10 و DAMO-YOLO عبر أحجام نماذجهم الخاصة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

كما لوحظ في المعايير، يقدم YOLOv10 باستمرار ملفات تعريف زمن انتقال استثنائية على TensorRT، خاصة في نسخته النانو، مما يتطلب بارامترات وعمليات FLOP أقل بكثير من نماذج DAMO-YOLO المماثلة. في حين أن DAMO-YOLO يوفر mAP قوياً في نسخته الصغيرة، فإن كفاءة البارامترات وزمن انتقال الاستنتاج لعائلة YOLOv10 توفر ميزة مميزة لبيئات النشر المقيدة.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv10 و DAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv10#

يعد YOLOv10 خياراً قوياً لـ:

  • الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار DAMO-YOLO#

يوصى باستخدام DAMO-YOLO من أجل:

  • تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics#

على الرغم من أن كلا النموذجين مثيران للإعجاب تقنياً، فإن اختيار بنية للإنتاج يتضمن النظر إلى ما هو أبعد من المقاييس الخام. البناء باستخدام نماذج مدعومة أصلياً بواسطة نظام Ultralytics البيئي يوفر مزايا لا مثيل لها للمطورين والباحثين على حد سواء.

Link to this sectionسهولة الاستخدام ونظام بيئي تتم صيانته جيداً#

على عكس المستودعات الأكاديمية المستقلة التي غالباً ما تواجه الهجر، تقدم Ultralytics نظاماً بيئياً قوياً ومصاناً بنشاط. قد يكون إعداد بيئات معقدة للنماذج التي تعتمد بشكل كبير على خطوط أنابيب NAS أمراً شاقاً. في المقابل، توفر Ultralytics واجهة برمجة تطبيقات Python موحدة وبديهية و CLI قوية، مدعومة بـ توثيق شامل. وهذا يقلل بشكل جذري من الوقت اللازم لطرح حلول الرؤية المخصصة في السوق.

Link to this sectionكفاءة التدريب ومتطلبات الذاكرة#

يمكن أن يصبح تدريب النماذج الكبيرة مكلفاً حسابياً بسرعة. تُعرف بنيات Ultralytics YOLO تاريخياً ببصمة ذاكرة CUDA المنخفضة أثناء التدريب والاستنتاج. تسمح هذه الكفاءة للمطورين بتدريب النماذج على الأجهزة الاستهلاكية أو مثيلات السحاب فعالة التكلفة دون مواجهة أخطاء نفاد الذاكرة التي تشيع عند العمل مع النماذج القائمة على المحولات (transformer) مثل RT-DETR.

تتبع التجارب

تتكامل Ultralytics أصلياً مع أهم أدوات MLOps. يمكنك بسهولة تتبع تقدم تدريب النموذج الخاص بك باستخدام عمليات التكامل مع Weights & Biases أو Comet أو ClearML بدون أي كود إضافي.

Link to this sectionتعدد الاستخدامات عبر المهام#

أحد القيود الهامة للعديد من نماذج الكشف المتخصصة هو تركيزها الضيق. ضمن نظام Ultralytics البيئي، أنت لا تقتصر على الكشف عن الأشياء فقط. تمتد الأدوات بسلاسة لتشمل مهام رؤية حاسوبية متعددة، بما في ذلك تجزئة المثيلات، تصنيف الصور، تقدير الوضعية، و الكشف عن الصناديق المحيطة الموجهة (OBB).

Link to this sectionالتطلع إلى المستقبل: تطور YOLO26#

بينما كان YOLOv10 رائداً في الاستنتاج الخالي من NMS وأظهر DAMO-YOLO قوة NAS، فإن مجال الرؤية الحاسوبية يتحرك بسرعة. للمطورين الذين يبحثون عن أحدث الحلول المتطورة، نوصي بالتحقق من Ultralytics YOLO26.

تم إصداره باعتباره الخلف النهائي لـ YOLO11، يعتمد YOLO26 على الأساس الخالي من NMS الذي وضعه YOLOv10 ولكنه يأخذ الأمر إلى أبعد من ذلك بكثير.

تشمل التطورات الرئيسية في YOLO26 ما يلي:

  • استنتاج CPU أسرع بنسبة تصل إلى 43%: تم تحسينه خصيصاً للحوسبة الطرفية والأجهزة منخفضة الطاقة.
  • إزالة DFL: تمت إزالة Distribution Focal Loss، مما يضمن عمليات تصدير أبسط وتعزيز التوافق مع أهداف نشر متنوعة.
  • مُحسِّن MuSGD: هجين من SGD و Muon، مما يوفر استقرار تدريب نماذج لغوية كبيرة (LLM) متقدم وتقارباً أسرع مباشرة في الرؤية الحاسوبية.
  • ProgLoss + STAL: وظائف خسارة محسنة بشكل كبير توفر تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر ضروري لحالات الاستخدام مثل الزراعة والاستشعار عن بعد.

من خلال استخدام منصة Ultralytics المجددة حديثاً، يمكن للمطورين تعليق وتدريب ونشر نماذج الجيل التالي مثل YOLO26 بسلاسة ببضع نقرات فقط، مما يضمن أن خط أنابيب الرؤية الحاسوبية الخاص بك متطور ومستقبلي في آن واحد.

التعليقات