Link to this sectionYOLOv10 في مواجهة EfficientDet: مقارنة بنيات كشف الكائنات في الوقت الفعلي#
يعد اختيار الشبكة العصبية المثلى لـ كشف الكائنات قراراً حاسماً يحدد نجاح أنظمة الرؤية الحاسوبية الحديثة. هناك بنيتان بارزتان أثرتا بشكل كبير على هذا المجال هما YOLOv10 و EfficientDet. ومع أن كلاهما يهدف إلى زيادة الدقة إلى الحد الأقصى مع تقليل العبء الحسابي، إلا أنهما تتبعان نهجين معماريين مختلفين تماماً لتحقيق هذه الأهداف.
يتعمق هذا الدليل الشامل في تصميماتهما الفريدة، ومنهجيات التدريب، وخصائص النشر، مما يساعد المطورين ومهندسي تعلم الآلة على اتخاذ قرارات مبنية على البيانات لـ تطبيقات الذكاء الاصطناعي للرؤية. سنفحص كيفية أدائهما على أجهزة تتراوح من أجهزة الذكاء الاصطناعي الطرفية المدمجة وصولاً إلى وحدات معالجة الرسوميات (GPUs) القوية في السحابة.
Link to this sectionYOLOv10: الرائد في تقنية NMS-Free#
طُوِّر YOLOv10 لدفع حدود زمن الاستجابة (Latency) في الوقت الفعلي، وقد عالج أحد أكثر الاختناقات إلحاحاً في عائلة YOLO، وهو كبت القيم غير القصوى (NMS). ومن خلال التخلص من خطوة المعالجة اللاحقة هذه، يحقق النموذج زمن استجابة متوقعاً للغاية، وهو أمر بالغ الأهمية لـ المركبات ذاتية القيادة والروبوتات عالية السرعة.
Link to this sectionالابتكارات المعمارية#
يقدم YOLOv10 تعيينات مزدوجة متسقة للتدريب بدون NMS. أثناء التدريب، يستفيد النموذج من تعيينات التسميات من واحد إلى متعدد ومن واحد إلى واحد، مما يسمح للشبكة بتعلم تمثيلات غنية مع إخراج صندوق إحاطة واحد أفضل لكل كائن أصلاً أثناء الاستدلال. كما تدمج البنية تصميماً شاملاً يعتمد على كفاءة الدقة، مما يبسط رأس التصنيف ويقلل التكرار الحسابي الموجود في الإصدارات السابقة.
Link to this sectionتفاصيل النموذج#
- المؤلفون: Ao Wang و Hui Chen و Lihao Liu، وآخرون.
- المنظمة: Tsinghua University
- التاريخ: 2024-05-23
- الورقة البحثية: YOLOv10: كشف الكائنات في الوقت الفعلي من البداية إلى النهاية
- GitHub: THU-MIG/yolov10
- التوثيق: توثيق YOLOv10
نظراً لأن YOLOv10 يزيل خطوة NMS، فإنه أسهل بطبيعته في التصدير إلى تنسيقات مثل تنسيق ONNX و NVIDIA TensorRT دون الاعتماد على إضافات وقت تشغيل مخصصة لتصفية صناديق الإحاطة.
نقاط القوة:
- استدلال يمكن التنبؤ به: تضمن إزالة NMS أوقات استدلال متسقة بغض النظر عن عدد الكائنات في المشهد.
- استخدام أقل للذاكرة: مقارنة بالنماذج القائمة على المحولات مثل RT-DETR، يتمتع YOLOv10 بمتطلبات ذاكرة أقل بكثير أثناء التدريب والاستدلال.
- مفاضلة ممتازة بين السرعة والدقة: مُحسَّن خصيصاً لسيناريوهات زمن الاستجابة المنخفض دون التضحية بـ مقاييس الأداء.
نقاط الضعف:
- التركيز على مهمة واحدة: على عكس نظام Ultralytics البيئي الأوسع، يركز مستودع YOLOv10 الأصلي بشكل كبير على الكشف، ويفتقر إلى دعم أصلي لـ تجزئة المثيلات أو تقدير الوضعية.
Link to this sectionEfficientDet: قابل للتوسع ومتوازن#
يتبع EfficientDet، الذي قدمه Google Brain، نهجاً في كشف الكائنات من خلال عدسة توسيع الشبكة المنهجي. وهو يعتمد على العمود الفقري لتصنيف الصور EfficientNet ويقدم آلية جديدة لدمج الميزات.
Link to this sectionالابتكارات المعمارية#
جوهر EfficientDet هو شبكة هرم الميزات ثنائية الاتجاه (BiFPN)، التي تسمح بدمج ميزات متعدد المقاييس بسهولة وسرعة. وخلافاً لشبكات FPN التقليدية التي تجمع الميزات من الأعلى إلى الأسفل فقط، تقدم BiFPN اتصالات ثنائية الاتجاه عبر المقاييس وأوزاناً قابلة للتدريب لتعلم أهمية ميزات الإدخال المختلفة. علاوة على ذلك، يستخدم EfficientDet طريقة توسيع مركبة تقوم بتوسيع الدقة والعمق والعرض بشكل موحد لجميع الشبكات الأساسية، وشبكة الميزات، وشبكات التنبؤ بالصندوق/الفئة.
Link to this sectionتفاصيل النموذج#
- المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
- المنظمة: Google Brain
- التاريخ: 2019-11-20
- الورقة البحثية: EfficientDet: كشف كائنات قابل للتوسع وفعال
- GitHub: Google AutoML EfficientDet
نقاط القوة:
- كفاءة عالية: نسبة ممتازة بين المعلمات والدقة، مما يجعل المتغيرات الأصغر من
-d0إلى-d2خفيفة الوزن للغاية. - توسيع مبدئي: يسمح التوسيع المركب للمستخدمين باختيار حجم النموذج بسهولة ليتناسب مع ميزانيتهم الحسابية المحددة.
نقاط الضعف:
- تكامل الإطار القديم: يعتمد التنفيذ الأصلي بشكل كبير على إصدارات TensorFlow القديمة، مما قد يعقد خطوط أنابيب النشر الحديثة.
- تدريب أبطأ: تدريب EfficientDet من الصفر بطيء بشكل ملحوظ ويتطلب ضبطاً دقيقاً للمعلمات الفائقة مقارنة بالتقارب السريع لبنيات YOLO.
- سرعة الاستدلال: على الرغم من كفاءة المعلمات، غالباً ما تؤدي عمليات BiFPN المعقدة إلى سرعات استدلال واقعية أبطأ على الأجهزة القياسية مقارنة بنماذج YOLO المحسنة للغاية.
Link to this sectionالأداء والمعايير القياسية#
يكمن الاختبار الحقيقي لهذه النماذج في أدائها التجريبي على معايير قياسية مثل مجموعة بيانات COCO. يوضح الجدول أدناه الاختلافات الحاسمة في عدد المعلمات، وعمليات الفاصلة العائمة (FLOPs)، وزمن استدلال على وحدات معالجة الرسوميات NVIDIA T4.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
كما هو موضح أعلاه، يحتفظ YOLOv10 بميزة كبيرة في سرعة الاستدلال الخام. على سبيل المثال، يحقق YOLOv10-S دقة 46.7 mAP مع زمن استدلال TensorRT يبلغ 2.66 مللي ثانية فقط، بينما يحقق EfficientDet-d3 دقة مماثلة تبلغ 47.5 mAP ولكنه يستغرق ما يقرب من 20 مللي ثانية، مما يجعل YOLOv10 متفوقاً بشكل كبير لبث الفيديو في الوقت الفعلي أو خطوط أنابيب التصنيع سريعة الحركة.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين YOLOv10 و EfficientDet على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار YOLOv10#
يعد YOLOv10 خياراً قوياً لـ:
- الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
- الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
- تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.
Link to this sectionمتى تختار EfficientDet#
يُنصح باستخدام EfficientDet في الحالات التالية:
- خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
- النشر عبر الهاتف المحمول باستخدام TFLite: المشاريع التي تتطلب تحديداً تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionالمعيار الحديث: دخول Ultralytics YOLO26#
بينما قدم YOLOv10 نموذجاً ثورياً خالياً من NMS واستعرض EfficientDet توسيعاً مبدئياً، استمر مشهد الرؤية الحاسوبية في التطور. بالنسبة للمطورين الذين يبدأون مشاريع جديدة اليوم، يمثل Ultralytics YOLO26 أحدث ما توصلت إليه التقنية بلا منازع. صدر في يناير 2026، وهو يدمج أفضل ما في جميع العوالم في حزمة مصقولة وجاهزة للإنتاج داخل منصة Ultralytics.
Link to this sectionلماذا يتفوق YOLO26 على المنافسة#
- تصميم شامل خالٍ من NMS: يتبنى YOLO26 أصلاً بنية شاملة خالية من NMS كانت رائدة في YOLOv10، مما يبسط النشر ويسرع الاستدلال.
- سرعة استدلال على وحدة المعالجة المركزية (CPU) أعلى بنسبة تصل إلى 43%: بالنسبة للأجهزة الطرفية التي تفتقر إلى مسرعات مخصصة، تم تحسين YOLO26 خصيصاً ليعمل بكفاءة على وحدات المعالجة المركزية القياسية.
- مُحسّن MuSGD المتقدم: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM)، يستخدم YOLO26 مزيجاً من SGD و Muon لتدريب مستقر بشكل لا يصدق وتقارب سريع، مما يحسن كفاءة التدريب بشكل كبير مقارنة بـ EfficientDet.
- ProgLoss + STAL: تقدم دوال الخسارة المحسنة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهي نقطة ضعف تقليدية لكل من YOLOv10 و EfficientDet.
- إزالة DFL: من خلال إزالة خسارة البؤرة التوزيعية (Distribution Focal Loss)، يتم تصدير YOLO26 بسلاسة إلى أي تنسيق أجهزة تقريباً، بما في ذلك OpenVINO و CoreML.
علاوة على ذلك، يوفر YOLO26 تنوعاً لا مثيل له. فبينما تعد EfficientDet و YOLOv10 نماذج كشف بحتة، يتعامل YOLO26 بسلاسة مع صناديق الإحاطة الموجهة، تصنيف الصور، وتجزئة المثيلات باستخدام نفس حزمة Ultralytics Python البديهية.
Link to this sectionسهولة الاستخدام مع Ultralytics#
يضمن النظام البيئي المُدار جيداً الذي توفره Ultralytics تجربة مطور سلسة. تدريب نموذج، والتحقق منه، وتصديره إلى تكامل TensorRT لا يتطلب سوى بضعة أسطر من التعليمات البرمجية.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 model (or upgrade to YOLO26 natively)
model = YOLO("yolov10n.pt")
# Train the model efficiently on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference and immediately visualize results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
# Export for rapid deployment
model.export(format="engine", half=True)Link to this sectionالخلاصة#
عند مقارنة YOLOv10 و EfficientDet، يعتمد الاختيار بشكل كبير على تفضيلات إطار عملك وقيود السرعة. يوفر EfficientDet نهجاً منظماً لتوسيع النموذج داخل نظام TensorFlow البيئي. ومع ذلك، يوفر YOLOv10 أداءً متفوقاً في الوقت الفعلي، واستخداماً أقل للذاكرة، ومسار نشر أكثر مباشرة بفضل بنيته الخالية من NMS.
للحصول على أفضل توازن في الأداء، وسهولة الاستخدام، وتعدد المهام، يوصى بشدة بالترقية إلى منصة Ultralytics واستخدام YOLO26. فهو يأخذ ابتكارات YOLOv10 الخالية من NMS، ويطبق تقنيات تدريب حديثة مثل مُحسّن MuSGD، ويغلفها في إطار عمل قوي ومفتوح المصدر مدعوم من قبل مجتمع عالمي ضخم.