YOLOv10 YOLO: تطور هياكل الكشف عن الأجسام في الوقت الفعلي

في عالم الرؤية الحاسوبية سريع التطور، يدفع السعي لتحقيق التوازن الأمثل بين زمن الاستجابة والدقة إلى الابتكار المستمر. ومن المعالم الهامة في هذه الرحلة YOLOv10، المعروف بتدريبه المبتكر NMS و YOLO الذي استفاد من البحث عن البنية العصبية (NAS) لرفع حدود الكفاءة. تستكشف هذه المقارنة الاختلافات في البنية ومقاييس الأداء ومدى ملاءمتها لتطبيقات الذكاء الاصطناعي الحديثة.

تحليل مقاييس الأداء

يقدم الجدول التالي مقارنة مفصلة لمؤشرات الأداء الرئيسية. YOLOv10 كفاءة فائقة في استخدام المعلمات وسرعة الاستدلال على وحدات معالجة الرسومات الحديثة، لا سيما في نماذج النماذج الأكبر حجماً.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv10: الرائد الشامل

صدر في مايو 2024 من قبل باحثين من جامعة تسينغهوا،YOLOv10 تحولًا جذريًا في النموذج من خلال التخلص من الحاجة إلى تقنية Non-Maximum Suppression (NMS). تعالج هذه البنية التباين في زمن الاستجابة الذي غالبًا ما تسببه خطوات المعالجة اللاحقة في أجهزة الكشف التقليدية.

الميزات المعمارية الرئيسية

تدريبNMS: يستخدم مهام مزدوجة متسقة للتدريب NMS، مما يسمح للنموذج بالتنبؤ بمربع حدود واحد لكل كائن مباشرةً. وهذا أمر بالغ الأهمية للتطبيقات التي تتطلب زمن انتقال يمكن التنبؤ به، مثل المركبات ذاتية القيادة أو الروبوتات الصناعية.
تصميم شامل للكفاءة والدقة: قام المؤلفون، آو وانغ وآخرون، بتحسين مختلف المكونات بما في ذلك العمود الفقري والرأس لتقليل التكرار الحسابي.
رأس تصنيف خفيف الوزن: يقلل من عبء فرع التصنيف، الذي غالبًا ما يمثل عقبة في أجهزة الكشف الخالية من المثبتات.

يمكنك تشغيل YOLOv10 من خلالPython Ultralytics Python والاستفادة من الواجهة الموحدة.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")
results[0].show()

تعرف على المزيد حول YOLOv10

YOLO: البحث عن بنية عصبية على نطاق واسع

يركز YOLO طورته مجموعة Alibaba Group وأطلقته في نوفمبر 2022، على الاكتشاف الآلي للبنى الفعالة. من خلال استخدام البحث العصبي عن البنية (NAS)، سعى الفريق إلى إيجاد العمق والعرض الأمثل للبنى الأساسية للكشف في ظل ميزانيات حسابية محدودة.

الميزات المعمارية الرئيسية

MAE-NAS Backbone: يستخدم بحثًا تطوريًا متعدد الأهداف للعثور على هياكل أساسية توازن بين دقة الكشف وسرعة الاستدلال.
RepGFPN الفعال: تصميم ثقيل الرقبة يحسن دمج الميزات، وهو أمر بالغ الأهمية لاكتشاف الأجسام بمقاييس مختلفة، مثل تحليل الصور الجوية.
ZeroHead: رأس detect مبسط يقلل من تعقيد طبقات التوقع النهائية.

على الرغم من أنYOLO أداءً قويًا، إلا أن اعتماده على عمليات NAS معقدة قد يجعل من الصعب على المطورين العاديين إعادة تدريب أو تعديل البنية لمجموعات البيانات المخصصة مقارنةً بالتكوين سهل الاستخدام Ultralytics .

ميزة Ultralytics: تقديم YOLO26

في حين أن YOLOv10 YOLO خطوات مهمة إلى الأمام، إلا أن هذا المجال استمر في التقدم. يعتمد Ultralytics على إرث YOLOv10 NMS YOLOv10 يدمجه في نظام بيئي أكثر قوة وجاهزية للإنتاج.

لماذا تختار Ultralytics؟

Ultralytics نظامًا بيئيًا جيد الصيانة يضمن أن نماذجك لا تعمل فقط اليوم، بل تستمر في العمل مع تطور مكتبات الأجهزة والبرامج. على عكس العديد من المستودعات الأكاديمية، Ultralytics تحديثات متسقة ووثائق شاملة وتكاملًا سلسًا مع أدوات النشر مثل TensorRT و OpenVINO.

ابتكارات YOLO26

للمطورين الباحثين عن أفضل أداء من حيث السرعة والدقة، يقدم YOLO26 العديد من التحسينات الهامة مقارنة بسابقيه:

NMS من البداية إلى النهاية: مثل YOLOv10، YOLO26 هي بطبيعتها خالية من البداية إلى النهاية. ومع ذلك، فإنها تحسن ذلك بشكل أكبر من خلال إزالة Distribution Focal Loss (DFL)، مما يبسط الرسم البياني للنموذج من أجل توافق أفضل مع الأجهزة الطرفية والرقائق منخفضة الطاقة.
مُحسّن MuSGD: مستوحى من الابتكارات في تدريب LLM (على وجه التحديد Kimi K2 من Moonshot AI)، يستخدم YOLO26 مُحسّن MuSGD. يوفر هذا المزيج من SGD Muon استقرارًا غير مسبوق للتدريب، مما يتيح تقاربًا أسرع وتقليل GPU .
CPU : تم تحسين YOLO26 خصيصًا للحوسبة الطرفية، مما يوفر استنتاجًا أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية. وهذا يجعله الخيار المثالي لتطبيقات إنترنت الأشياء حيث لا تتوفر وحدات معالجة الرسومات.
وظائف الخسارة المحسّنة: أدى إدخال ProgLoss و STAL (التعلم الذاتي للمرساة) إلى تحسين الأداء بشكل ملحوظ على الأجسام الصغيرة والخلفيات الصعبة.

تعرف على المزيد حول YOLO26

حالات الاستخدام المقارنة

يعتمد اختيار النموذج المناسب بشكل كبير على قيود النشر الخاصة بك ومتطلبات سير العمل.

متى تستخدم DAMO-YOLO

YOLO مرشح قوي لسيناريوهات البحث التي تتضمن البحث عن البنية العصبية (NAS). إذا كان مشروعك يتطلب دراسة كيفية تأثير استراتيجيات البحث الآلي على استخراج الميزات، أو إذا كنت مندمجًا بعمق في نظام Alibaba البيئي، فإن هذا النموذج يوفر رؤى قيّمة. كما أن وحدة RepGFPN الخاصة به تعد مرجعًا ممتازًا لدراسات دمج الميزات.

متى تستخدم YOLOv10

YOLOv10 ممتازًا للتطبيقات التي يكون فيها التباين المنخفض في زمن الاستجابة أمرًا بالغ الأهمية. يضمن تصميمه NMS بقاء زمن الاستدلال مستقرًا بغض النظر عن عدد الكائنات المكتشفة، وهو أمر حيوي لأنظمة السلامة في الوقت الفعلي.

المراقبة في الوقت الحقيقي: معدلات إطارات ثابتة للمشاهد المزدحمة.
الروبوتات: توقيت يمكن التنبؤ به لدورات التحكم.

لماذا YOLO26 هو الخيار الأفضل

بالنسبة لغالبية المطورين والتطبيقات التجارية، يقدم Ultralytics الحزمة الأكثر جاذبية. فهو يجمع YOLOv10 مزايا YOLOv10 NMS وكفاءة التدريب الفائقة والدعم الواسع النطاق للأجهزة.

سهولة الاستخدام: قم بالتدريب والتحقق من الصحة والنشر باستخدام Python واحدة.
تعدد الاستخدامات: على عكسYOLO، يدعم YOLO26 مجموعة كاملة من المهام بما في ذلك تقسيم المثيلات، وتقدير الوضع، والتصنيف، والمربعات المحددة الاتجاه (OBB).
كفاءة الذاكرة: يتطلب YOLO26 CUDA أقل بكثير أثناء التدريب مقارنة بالنماذج الهجينة المحولة، مما يتيح التدريب على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.
تكامل المنصة: تصدير سلس إلى ONNXو CoreML و TFLite Ultralytics ، مما يبسط المسار من النموذج الأولي إلى الإنتاج.

مثال على الكود: سير عمل YOLO26

يمكن الانتقال إلى أحدث التقنيات بسهولة مع Ultralytics. يوضح مقتطف الشفرة التالي كيفية تحميل نموذج YOLO26 المتطور، وتشغيل الاستدلال، وتصديره للنشر.

from ultralytics import YOLO

# Load the YOLO26s model (Small version)
model = YOLO("yolo26s.pt")

# Train on COCO8 dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified deployment
model.export(format="onnx", opset=13)

الخلاصة

YOLO كل من YOLOv10 YOLO ابتكارات قيّمة في مجال الرؤية الحاسوبية. YOLOv10 أثبتت جدوى الكشف NMS بينما أظهرت YOLO قوة NAS. ومع ذلك، فإن Ultralytics تجمع بين هذه التطورات في أداة شاملة وسهلة الاستخدام وعالية الأداء. بفضل سرعتها الفائقة وتعدد مهامها ودعمها بنظام بيئي قوي، تعد YOLO26 الحل الموصى به للمطورين الذين يعملون على بناء الجيل التالي من تطبيقات الذكاء الاصطناعي.

لمزيد من الاستكشاف، يمكنك مراجعة YOLO11 أو RT-DETR للحصول على نهج معمارية بديلة.

YOLOv10 YOLO: تطور هياكل الكشف عن الأجسام في الوقت الفعلي

تحليل مقاييس الأداء

YOLOv10: الرائد الشامل

الميزات المعمارية الرئيسية

YOLO: البحث عن بنية عصبية على نطاق واسع

الميزات المعمارية الرئيسية

ميزة Ultralytics: تقديم YOLO26

ابتكارات YOLO26

حالات الاستخدام المقارنة

متى تستخدم DAMO-YOLO

متى تستخدم YOLOv10

لماذا YOLO26 هو الخيار الأفضل

مثال على الكود: سير عمل YOLO26

الخلاصة

تعليقات