YOLOv10 YOLO11: جسر بين الابتكار الأكاديمي والنطاق الواقعي

تطور الكشف عن الأجسام في الوقت الفعلي تميز بتقدم سريع في السرعة والدقة وكفاءة البنية. اثنان من اللاعبين الرئيسيين في هذا التاريخ الحديث هما YOLOv10 و YOLO11. ورغم أن كلا النموذجين يوسعان حدود الإمكانات المتاحة للرؤية الحاسوبية، إلا أنهما ينبعان من فلسفتين تصميميتين مختلفتين ويستهدفان احتياجات متميزة داخل مجتمع الذكاء الاصطناعي. تستكشف هذه المقارنة المواصفات الفنية والاختلافات المعمارية والتطبيقات العملية لكلا النموذجين لمساعدة المطورين على اختيار الأداة المناسبة لمتطلباتهم المحددة.

YOLOv10: الرائد الأكاديمي في مجال الكشف الشامل

صدر في مايو 2024 من قبل باحثين من جامعة تسينغهوا، YOLOv10 تغييرًا جذريًا في YOLO من خلال التركيز على استراتيجية تدريبNMS. تاريخيًا، اعتمدت YOLO على Non-Maximum Suppression (NMS) لتصفية المربعات المتداخلة أثناء الاستدلال. على الرغم من فعالية NMS إلا NMS اختناقًا في زمن انتقال النشر ويعقد عملية التصدير إلى تنسيقات مثل TensorRT أو ONNX.

الابتكارات المعمارية الرئيسية

YOLOv10 هذه التحديات من خلال استراتيجية مزدوجة المهام أثناء التدريب. فهو يستخدم رأسًا واحدًا إلى عدة رؤوس للإشراف الغني أثناء التعلم ورأسًا واحدًا إلى واحد للاستدلال، مما يسمح للنموذج بالتنبؤ بصندوق واحد أفضل لكل كائن مباشرةً. وهذا يلغي الحاجة إلى NMS مما يقلل بشكل كبير من زمن الاستجابة على الأجهزة الطرفية.

بالإضافة إلى ذلك، YOLOv10 تصميم نموذج شامل قائم على الكفاءة والدقة. ويشمل ذلك رؤوس تصنيف خفيفة الوزن، وتقليل الدقة المكانية المنفصلة عن القناة، وتصميم الكتل الموجهة بالترتيب، والتي تعمل مجتمعة على تقليل التكرار الحسابي.

البيانات الفنية:

المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المؤسسة:جامعة تسينغ - هوا
التاريخ: 2024-05-23
Arxiv:YOLOv10: Real-Time End-to-End Object Detection
GitHub:THU-MIG/yolov10

تعرف على المزيد حول YOLOv10

Ultralytics YOLO11: مُحسّن ليلائم حجم المؤسسات

صدر في سبتمبر 2024، Ultralytics YOLO11 على الإطار القوي لـ YOLOv8 و YOLOv9. بينما يحتفظ بنهج تقليدي NMS(على عكس YOLOv10 الأصلي من البداية إلى النهاية)، YOLO11 بشكل كبير على كفاءة استخراج الميزات وتحسين المعلمات. وهو مصمم ليكون "سكين الجيش السويسري" للرؤية الحاسوبية، حيث يتفوق ليس فقط في الكشف ولكن في مجموعة واسعة من المهام بما في ذلك تقسيم الحالات وتقدير الوضع والتصنيف والكشف عن الصندوق المحيط الموجه (OBB).

التطورات في YOLO11

YOLO11 بنية أساسية محسّنة (C3k2) تعمل على تحسين تكامل الميزات عبر مختلف المستويات. وهذا يتيح للنموذج التقاط التفاصيل الدقيقة في المشاهد المعقدة — مثل الأجسام الصغيرة في الصور الجوية — بشكل أكثر فعالية من النماذج السابقة. علاوة على ذلك، يضمن دمجه في نظام Ultralytics الدعم السلس للتدريب والتحقق والنشر عبر منصات الأجهزة المتنوعة، من NVIDIA إلى وحدات المعالجة المركزية الأساسية.

البيانات الفنية:

المؤلفون: غلين جوشر وجينغ تشيو
المؤسسة:Ultralytics
التاريخ: 2024-09-27
المستندات:توثيق YOLO11
GitHub:ultralytics/ultralytics

تعرف على المزيد حول YOLO11

مقارنة الأداء

عند مقارنة الأداء، من الضروري النظر إلى ما وراء mAP الأولية mAP ومراعاة التوازن بين السرعة وحجم النموذج (المعلمات) والتكلفة الحسابية (FLOPs).

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

تحليل البيانات

بينما YOLOv10 يتميز بعدد أقل من المعلمات في بعض التكوينات (مثل نموذج "M")، YOLO11 يحقق في كثير من الأحيان mAP وسرعات استدلال تنافسية أو متفوقة على وحدات معالجة الرسومات T4، مما يدل على فعالية بنية العمود الفقري المُحسّنة.

حالات الاستخدام المثالية

متى تختار YOLOv10

YOLOv10 خيارًا ممتازًا للمشاريع البحثية أو سيناريوهات النشر المحددة على الحافة حيث يكون إزالة NMS أمرًا بالغ الأهمية لتقليل زمن الاستجابة. تعمل بنيته الشاملة على تبسيط خط أنابيب التصدير لبعض الأنظمة المدمجة التي يصعب فيها تنفيذ منطق المعالجة اللاحقة بكفاءة.

الأنظمة المدمجة: أجهزة ذات CPU محدودة للمعالجة اللاحقة.
البحث الأكاديمي: دراسة البنى NMS واستراتيجيات التدريب المزدوجة المهام.
التطبيقات الحساسة للكمون: الروبوتات عالية السرعة حيث كل مللي ثانية من زمن استنتاج الكمون مهمة.

متى تختار Ultralytics YOLO11

YOLO11 الحل المفضل للتطبيقات على مستوى الإنتاج التي تتطلب توازناً بين الدقة العالية والتنوع وسهولة الاستخدام. مدعوم Ultralytics يوفر سير عمل مبسط من تعليق البيانات إلى مراقبة النموذج.

حلول المؤسسات: عمليات النشر واسعة النطاق التي تتطلب قواعد برمجية موثوقة ومحفوظة وتراخيص تجارية.
مهام الرؤية المعقدة: المشاريع التي تتطلب تقدير الوضع أو التجزئة إلى جانب الكشف.
التدريب على السحابة: تكامل سلس مع Ultralytics لإدارة مجموعات البيانات وعمليات التدريب.
تعدد الاستخدامات: المطورون الذين يحتاجون إلى إطار عمل واحد للتعامل مع التصنيف والكشف والتجزئة باستخدام واجهة برمجة تطبيقات موحدة.

ميزة النظام البيئي لـ Ultralytics

أحد أهم العوامل المميزة لـ YOLO11 هو النظام البيئي المحيط به. في حين أن YOLOv10 مساهمة أكاديمية رائعة، فإن YOLO11 من التحديثات المستمرة والوثائق الشاملة والتكامل الوثيق مع أدوات مثل Ultralytics .

سهولة الاستخدام: تتيح Python البسيطة تدريب النموذج باستخدام بضع أسطر من التعليمات البرمجية فقط.
كفاءة الذاكرة: تم تحسين Ultralytics لتقليل استخدام الذاكرة أثناء التدريب مقارنة بالعديد من البدائل القائمة على Transformer، مما يجعلها متاحة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.
توافق واسع النطاق: قم بتصدير YOLO11 إلى CoreMLو OpenVINO، TensorRTوغيرها باستخدام أمر واحد.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

التطلع إلى المستقبل: المستقبل مع YOLO26

في حين YOLO11 YOLOv10 YOLO11 إنجازات مهمة، إلا أن هذا المجال يتطور بسرعة. بالنسبة للمطورين الذين يسعون إلى تحقيق أحدث ما توصلت إليه التكنولوجيا، يجمع YOLO26 (الذي تم إصداره في يناير 2026) يجمع بين أفضل ما في كلا العالمين.

يستخدم YOLO26 التصميم الشاملNMS الذي ابتكره YOLOv10 يحسنه باستخدام تحسين Ultralytics المميز على نطاق المؤسسات. يتميز بإزالة DFL (توزيع الخسارة البؤرية) لتسهيل عمليات التصدير ومحسن MuSGD المبتكر لتحقيق تقارب تدريب مستقر ومستوحى من LLM. مع CPU أسرع بنسبة تصل إلى 43٪ من الأجيال السابقة ووظائف خسارة محسنة مثل ProgLoss + STAL، يعد YOLO26 التوصية المثلى لمشاريع الرؤية الحاسوبية الحديثة.

تعرف على المزيد حول YOLO26

بالنسبة للمستخدمين المهتمين ببنى متخصصة أخرى، تغطي الوثائق أيضًا RT-DETR للكشف القائم على المحولات و YOLO للمهام ذات المفردات المفتوحة.