Link to this sectionYOLOv10 مقابل RTDETRv2#

يتحرك مشهد computer vision بوتيرة متسارعة، حيث تعيد البنيات الجديدة باستمرار تعريف أحدث ما توصلت إليه التقنية في اكتشاف الكائنات في الوقت الفعلي. ومن بين المعالم الهامة في هذا التطور نموذجا YOLOv10 و RTDETRv2. يهدف كلا النموذجين إلى حل عقبة أساسية في مسارات الاكتشاف التقليدية من خلال التخلص من الحاجة إلى المعالجة اللاحقة غير القصوى (NMS)، ومع ذلك، فهما يتعاملان مع هذا التحدي من نماذج معمارية مختلفة تماماً.

يوفر هذا المقارنة التقنية تحليلاً متعمقاً لبنيتها، ومنهجيات التدريب، وسيناريوهات النشر المثالية لمساعدة المطورين والباحثين على اختيار الأداة المناسبة لمشروعهم التالي في vision AI.

Link to this sectionYOLOv10: الرائد في تقنية NMS-Free#

يركز YOLOv10، الذي طوره باحثون في جامعة تسينغهوا، بشكل كبير على الكفاءة المعمارية وإزالة عقبات المعالجة اللاحقة. ومن خلال تقديم تعيينات مزدوجة متسقة للتدريب بدون NMS، فإنه يحقق أداءً تنافسياً مع خفض زمن انتقال الاستدلال بشكل كبير.

Link to this sectionالمواصفات الفنية#

المؤلفون: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
المؤسسة: Tsinghua University
التاريخ: 2024-05-23
ArXiv: ورقة بحث YOLOv10
GitHub: THU-MIG/yolov10
الوثائق: توثيق YOLOv10

Link to this sectionالهندسة المعمارية والمنهجيات#

تتمثل نقطة التحول الرئيسية في YOLOv10 في تصميمه النموذجي الموجه نحو كفاءة الدقة الشاملة. فهو يعمل على تحسين المكونات المختلفة من كلا المنظورين، مما يقلل بشكل كبير من العبء الحسابي. تسمح استراتيجية التعيينات المزدوجة المتسقة للنموذج بالتدريب دون الاعتماد على NMS، وهو ما يترجم إلى مسار نشر مبسط من البداية إلى النهاية. وهذا مفيد بشكل خاص عند تصدير النماذج إلى تنسيقات الحافة مثل ONNX أو TensorRT، حيث يمكن لعمليات المعالجة اللاحقة أن تؤدي إلى زمن انتقال غير متوقع.

Link to this sectionنقاط القوة والضعف#

يفتخر النموذج بمقايضات استثنائية بين السرعة والدقة، خاصة في المتغيرات الأصغر (N و S). إن الحد الأدنى من زمن الانتقال يجعله مثالياً لبيئات الحافة عالية السرعة. ومع ذلك، في حين يتفوق YOLOv10 في سرعة الاكتشاف الخام، فإنه يظل نموذجاً متخصصاً للاكتشاف فقط. ستحتاج الفرق التي تتطلب instance segmentation أو pose estimation إلى البحث عن أطر عمل أكثر تنوعاً.

تعرف على المزيد حول YOLOv10

Link to this sectionRTDETRv2: تطوير محول الاكتشاف (Detection Transformer)#

بناءً على محول الاكتشاف الأصلي في الوقت الفعلي، يدمج RTDETRv2 "مجموعة من الميزات الإضافية" لتحسين خط الأساس الخاص به، مما يظهر أن المحولات يمكنها منافسة شبكات CNN في سيناريوهات الوقت الفعلي.

Link to this sectionالمواصفات الفنية#

المؤلفون: Wenyu Lv، Yian Zhao، Qinyao Chang، Kui Huang، Guanzhong Wang، و Yi Liu
المؤسسة: Baidu
التاريخ: 2024-07-24
ArXiv: ورقة بحث RTDETRv2
GitHub: lyuwenyu/RT-DETR
الوثائق: توثيق RTDETRv2

Link to this sectionالهندسة المعمارية والمنهجيات#

يستخدم RTDETRv2 بنية هجينة، تجمع بين هيكل الشبكة العصبية التلافيفية (CNN) لاستخراج الميزات المرئية ومحول التشفير وفك التشفير لفهم المشهد بشكل شامل. تسمح آلية الانتباه الذاتي في المحول للنموذج برؤية الصورة عالمياً، مما يجعله فعالاً للغاية في التعامل مع المشاهد المعقدة، والكائنات المتداخلة، والحشود الكثيفة.

Link to this sectionنقاط القوة والضعف#

توفر بنية المحول دقة ممتازة، خاصة على مقاييس المعلمات الأكبر، وتخرج الاكتشافات النهائية أصلاً دون NMS. ومع ذلك، يأتي هذا بتكلفة. تتطلب نماذج المحولات تقليدياً ذاكرة CUDA أكبر بكثير أثناء التدريب ويمكن أن تكون أبطأ في التقارب مقارنة ببنيات CNN البحتة. في حين أن RTDETRv2 قد حسّن سرعات الاستدلال، فإنه يستهلك عموماً ذاكرة أكثر من متغيرات YOLO خفيفة الوزن.

اعرف المزيد عن RTDETRv2

Link to this sectionمقارنة الأداء#

يوفر تقييم مقاييس الأداء صورة أوضح للمجالات التي يتفوق فيها كل نموذج. يسلط الجدول التالي الضوء على قدراتها على COCO dataset:

النموذج	الحجم ^(بكسل)	mAP^val 50-95	السرعة ^{CPU ONNX (ms)}	السرعة ^{T4 TensorRT10 (ms)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

RTDETRv2-s	640	48.1	-	5.03	20	60
RTDETRv2-m	640	51.9	-	7.51	36	100
RTDETRv2-l	640	53.4	-	9.76	42	136
RTDETRv2-x	640	54.3	-	15.03	76	259

عند تحليل البيانات، يحافظ YOLOv10 على ميزة صارمة في كفاءة المعلمات وسرعة استدلال TensorRT عبر الأحجام القابلة للمقارنة. يطابق RTDETRv2-x نموذج YOLOv10x الضخم في الدقة ولكنه يتطلب ما يقرب من 20 مليون معلمة إضافية و FLOPs أعلى بكثير.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv10 و RT-DETR على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv10#

يعد YOLOv10 خياراً قوياً لـ:

الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار RT-DETR#

يوصى بـ RT-DETR لـ:

أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: النظام البيئي والابتكار#

بينما يوفر كل من YOLOv10 و RTDETRv2 قدرات اكتشاف قوية، فإن اختيار النموذج غالباً ما يتعلق بالنظام البيئي للبرمجيات المحيط به. توفر Ultralytics Platform واجهة سلسة وموحدة تجرد تعقيدات التعلم العميق.

Link to this sectionالمعيار الجديد: Ultralytics YOLO26#

بالنسبة للمطورين الذين يسعون للحصول على أفضل أداء مطلق، يمثل Ultralytics YOLO26 تتويجاً للتقدم المعماري الأخير. تم إصدار YOLO26 في أوائل عام 2026، ويرث تصميم NMS-Free من البداية إلى النهاية الذي ابتكره YOLOv10، مما يلغي تماماً المعالجة اللاحقة NMS لنشر أسرع وأبسط.

لماذا تختار YOLO26؟

يجلب YOLO26 ابتكارات تدريب LLM إلى الرؤية الحاسوبية عبر MuSGD Optimizer (هجين من SGD و Muon)، مما يؤدي إلى تدريب أكثر استقراراً وتقارب أسرع. كما يتميز بـ استدلال CPU أسرع بنسبة تصل إلى 43%، مما يجعله الخيار الأول لحوسبة الحافة.

علاوة على ذلك، يقدم YOLO26 ProgLoss + STAL لتحسينات ملحوظة في التعرف على الكائنات الصغيرة، وعلى عكس YOLOv10 المتخصص، فإنه يوفر تنوعاً فائقاً. فهو يدعم أصلاً object detection، التجزئة، الوضع، و oriented bounding boxes (OBB) مع تحسينات خاصة بالمهمة مثل فقدان التجزئة الدلالية وتقدير احتمالية السجل المتبقي (RLE) للوضع. علاوة على ذلك، تضمن إزالة فقدان التوزيع البؤري (DFL) تصديراً مبسطاً وتوافقاً أفضل مع الأجهزة منخفضة الطاقة.

تعرف على المزيد حول YOLO26

Link to this sectionسهولة الاستخدام وكفاءة التدريب#

سواء كنت تقوم بالتجربة مع نماذج الجيل الأقدم مثل Ultralytics YOLO11 أو YOLO26 المتطور، تضمن واجهة برمجة تطبيقات Python المبسطة استخداماً أقل للذاكرة أثناء التدريب وسير عمل سريعاً للغاية.

from ultralytics import RTDETR, YOLO

# Train the end-to-end YOLOv10 model
model_yolo = YOLO("yolov10n.pt")
model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Alternatively, evaluate RTDETR within the same API
model_rtdetr = RTDETR("rtdetr-l.pt")
results = model_rtdetr.predict("https://ultralytics.com/images/bus.jpg")

يوفر النظام البيئي المُصان جيداً أدوات لسهولة hyperparameter tuning ويتكامل بشكل لا تشوبه شائبة مع حلول التتبع الشاملة و model deployment options.

Link to this sectionالخلاصة#

يمثل كل من YOLOv10 و RTDETRv2 معالم هائلة في السعي لاكتشاف الكائنات بدون NMS. يثبت RTDETRv2 أن المحولات يمكنها تحقيق زمن انتقال في الوقت الفعلي مع فهم سياق عالمي ممتاز، وإن كان ذلك بمتطلبات ذاكرة أعلى. يوفر YOLOv10 بديلاً فعالاً وسريعاً لشبكات CNN مصمماً لمهام الاكتشاف محدودة الموارد.

ومع ذلك، من أجل أداء متوازن، وتنوع في المهام المتعددة، والنظام البيئي الأكثر نضجاً، يتم تشجيع المطورين بشدة على الاستفادة من Ultralytics YOLO26. فهو يدمج بشكل جميل الابتكارات المعمارية لسلفه مع الأدوات القوية وسهلة الاستخدام التي تجعل نشر الذكاء الاصطناعي البصري حقيقة سلسة.

المساهمون

GLglenn-jocher¹⁴ PDpderrenger¹

تم الإنشاء 27 يناير 2025تم التحديث قبل 3 أسابيع

Link to this sectionYOLOv10 مقابل RTDETRv2#

Link to this sectionYOLOv10: الرائد في تقنية NMS-Free#

Link to this sectionالمواصفات الفنية#

Link to this sectionالهندسة المعمارية والمنهجيات#

Link to this sectionنقاط القوة والضعف#

Link to this sectionRTDETRv2: تطوير محول الاكتشاف (Detection Transformer)#

Link to this sectionالمواصفات الفنية#

Link to this sectionالهندسة المعمارية والمنهجيات#

Link to this sectionنقاط القوة والضعف#

Link to this sectionمقارنة الأداء#

Link to this sectionحالات الاستخدام والتوصيات#

Link to this sectionمتى تختار YOLOv10#

Link to this sectionمتى تختار RT-DETR#

Link to this sectionمتى تختار Ultralytics (YOLO26)#

Link to this sectionميزة Ultralytics: النظام البيئي والابتكار#

Link to this sectionالمعيار الجديد: Ultralytics YOLO26#

Link to this sectionسهولة الاستخدام وكفاءة التدريب#

Link to this sectionالخلاصة#

التعليقات