تخطي إلى المحتوى

YOLOv10 EfficientDet: تطور كفاءة اكتشاف الكائنات

تم تحديد مشهد الرؤية الحاسوبية من خلال السعي لتحقيق التوازن، وتحديداً التوازن بين سرعة الاستدلال ودقة الكشف. تستكشف هذه المقارنة معلمتين هامتين في هذا التاريخ: YOLOv10، الاختراق الأكاديمي من جامعة تسينغهوا الذي أدخل الكشف NMS و EfficientDet، البنية الرائدة Google التي دافعت عن الكفاءة القابلة للتطوير.

بينما وضع EfficientDet معايير مرجعية في عام 2019 بفضل طريقة التوسع المركب، يمثل YOLOv10 2024) تحولًا جذريًا نحو إزالة معوقات المعالجة اللاحقة تمامًا. يحلل هذا الدليل هياكلهما ومقاييس أدائهما ومدى ملاءمتهما لتطبيقات الذكاء الاصطناعي الحديثة.

YOLOv10: الكاشف الشامل في الوقت الفعلي

صدر YOLOv10 في مايو 2024، YOLOv10 مشكلة عدم الكفاءة التي طالما عانت منها YOLO وهي الاعتماد على تقنية Non-Maximum Suppression (NMS). من خلال التخلص من خطوة المعالجة اللاحقة هذه، يقلل YOLOv10 من زمن الاستجابة ويبسط خطوط الإنتاج.

YOLOv10 :

الابتكارات المعمارية الرئيسية

السمة المميزة لـ YOLOv10 استراتيجية التعيين المزدوج المتسقة. أثناء التدريب، يستخدم النموذج رأسًا واحدًا إلى عدة رؤوس للحصول على إشارات إشرافية غنية ورأسًا واحدًا إلى واحد لتعلم التنبؤات الفريدة المثلى. وهذا يسمح للنموذج بالتنبؤ بمربعات الحدود الدقيقة دون الحاجة NMS التكرارات أثناء الاستدلال.

بالإضافة إلى ذلك، YOLOv10 تصميمًا شاملاً يجمع بين الكفاءة والدقة، حيث يعمل على تحسين مكونات العمود الفقري والرقبة لتقليل التكرار الحسابي. وينتج عن ذلك نموذج ليس أسرع فحسب، بل وأكثر كفاءة من حيث المعلمات مقارنة بنماذج سابقة.

تعرف على المزيد حول YOLOv10

EfficientDet: قابل للتطوير وقوي

تم تطوير EfficientDet بواسطة Google في أواخر عام 2019، وقد صُمم لتوسيع حدود الكفاءة باستخدام فلسفة مختلفة: التوسع المركب. فهو يقوم بتوسيع الدقة والعمق والعرض للشبكة بشكل منهجي لتحقيق أداء أفضل عبر مجموعة واسعة من قيود الموارد.

تفاصيل EfficientDet:

مزايا BiFPN

يستخدم EfficientDet العمود الفقري EfficientNet مقترناً بشبكة هرمية ثنائية الاتجاه مرجحة (BiFPN). على عكس شبكات FPN القياسية التي تجمع الميزات دون تمييز، تخصص BiFPN أوزاناً للميزات المدخلة، مما يسمح للشبكة بتعلم أهمية مستويات الإدخال المختلفة. على الرغم من دقتها العالية، تتضمن هذه البنية اتصالات معقدة عبر المستويات يمكن أن تكون مكلفة حسابياً على الأجهزة غير المُحسّنة لأنماط الوصول غير المنتظمة إلى الذاكرة.

مقارنة الأداء الفني

يقدم الجدول التالي مقارنة مباشرة بين المقاييس. لاحظ الفرق الكبير في سرعات الاستدلال، خاصة وأن YOLOv10 من إزالة NMS .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

تحليل نقدي

  1. الكمون مقابل الدقة: يحقق YOLOv10x متوسط دقة متوسطmAP ) فائقًا بنسبة 54.4٪ مع TensorRT يبلغ 12.2 مللي ثانية فقط. في المقابل، يحقق EfficientDet-d7 متوسط mAP مماثلًا بنسبة 53.7٪ mAP يتطلب حوالي 128 مللي ثانية، أي أبطأ بأكثر من 10 مرات. وهذا يسلط الضوء على القفزة الجيلية في التحسين في الوقت الفعلي.
  2. نشر الحافة: YOLOv10 تصميم YOLOv10 NMS YOLOv10 نقطة تحول في نشر النماذج. غالبًا NMS عملية صعبة للتسريع على وحدات المعالجة العصبية (NPU) أو الرقائق المدمجة. تسمح إزالته بتشغيل النموذج بأكمله كرسم بياني واحد، مما يحسن بشكل كبير التوافق مع أدوات مثل OpenVINO و TensorRT.
  3. كفاءة التدريب: يعتمد EfficientDet على TensorFlow واستراتيجيات البحث المعقدة في AutoML. تم بناءYOLO Ultralytics YOLO بما في ذلك YOLOv10 YOLO26 الأحدث، على PyTorch بخطوط تدريب محسّنة تعالج تلقائيًا المعلمات الفائقة، مما يؤدي إلى تقارب أسرع ومتطلبات ذاكرة أقل.

ميزة النظام البيئي لـ Ultralytics

نادراً ما يقتصر اختيار النموذج على البنية الهندسية فحسب، بل يتعلق أيضاً بسير العمل. توفر Ultralytics تجربة سلسة للمطورين.

  • سهولة الاستخدام: باستخدام Ultralytics Python يمكنك تحميل النماذج وتدريبها ونشرها بثلاث أسطر من التعليمات البرمجية. غالبًا ما تتطلب تطبيقات EfficientDet إدارة معقدة للتبعيات TensorFlow القديمة.
  • تعدد الاستخدامات: في حين أن EfficientDet هو في المقام الأول أداة للكشف عن الكائنات، فإن Ultralytics يدعم مجموعة كاملة من المهام بما في ذلك تقسيم الحالات، وتقدير الوضع، والكشف عن OBB (مربع الحدود الموجه).
  • نظام بيئي جيد الصيانة: Ultralytics تحديثات متكررة، مما يضمن التوافق مع أحدث مكتبات الأجهزة والبرامج. يتيح التكامل مع Ultralytics سهولة إدارة مجموعات البيانات والتدريب السحابي.

تدريب مبسط

Ultralytics عمليات زيادة البيانات المعقدة وجدولة معدلات التعلم تلقائيًا. لا تحتاج إلى ضبط المراسي أو أوزان الخسارة يدويًا للحصول على نتائج متطورة.

مثال على الكود: التدريب باستخدام Ultralytics

يوضح الكود التالي مدى سهولة تدريب نموذج باستخدام Ultralytics . يعمل هذا بشكل مماثل مع YOLOv10 و YOLO11 و YOLO26 الموصى به.

from ultralytics import YOLO

# Load the latest recommended model (YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
# Ultralytics automatically handles device selection (CPU/GPU)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")

لماذا نوصي بـ YOLO26

بينما YOLOv10 مفهوم NMS Ultralytics قام بتحسينه وتطويره. تم إصدار YOLO26 في يناير 2026، وهو أحدث ما توصلت إليه التكنولوجيا في مجال الذكاء الاصطناعي المتطور وأنظمة الإنتاج.

يستخدم YOLO26 التصميم الشامل NMS الذي ابتكره YOLOv10 يعززه بعدة ابتكارات مهمة:

  • مُحسّن MuSGD: مستوحى من تدريب LLM (على وجه التحديد Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجًا من SGD حسّن Muon. وينتج عن ذلك ديناميكيات تدريب أكثر استقرارًا وتقاربًا أسرع بكثير من الأجيال السابقة.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، يبسط YOLO26 بنية طبقة الإخراج. وهذا يجعل التصدير إلى تنسيقات مثل CoreML ONNX نظافة، مما يضمن توافقًا أفضل مع الأجهزة الطرفية منخفضة الطاقة.
  • الأداء: يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بالإصدارات السابقة، مما يجعله الخيار المثالي للأجهزة التي لا تحتوي على وحدات معالجة رسومات مخصصة، مثل أجهزة الكمبيوتر المحمولة القياسية أو أجهزة Raspberry Pi.
  • مكاسب خاصة بالمهام: يتضمن وظائف خسارة متخصصة مثل ProgLoss و STAL، والتي توفر تحسينات ملحوظة في التعرف على الأجسام الصغيرة — وهو نقطة ضعف شائعة في أجهزة الكشف السابقة.

تعرف على المزيد حول YOLO26

توصيات حالات الاستخدام

  • التطبيقات في الوقت الفعلي: المركبات ذاتية القيادة، ومراقبة حركة المرور، وتحليلات الألعاب الرياضية حيث يكون انخفاض زمن الاستجابة أمراً بالغ الأهمية.
  • نشر الحافة: يعمل على الهواتف المحمولة أو الطائرات بدون طيار أو أجهزة إنترنت الأشياء حيث تكون CPU وعمر البطارية محدودين.
  • متطلبات المهام المتعددة: عندما يتطلب مشروعك تقسيمًا أو تقديرًا للموقف أو اكتشافًا للأجسام المدورة (OBB) بالإضافة إلى المربعات المحيطة القياسية.

متى يجب التفكير في EfficientDet

  • البحوث القديمة: إذا كنت تقوم بإعادة إنتاج أوراق أكاديمية من الفترة 2019-2020 التي تقارن بشكل خاص مع بنى EfficientDet.
  • قيود الأجهزة (محددة): في حالات نادرة، حيث يتم تحسين مسرعات الأجهزة القديمة بشكل صارم لهياكل BiFPN ولا يمكنها التكيف مع الكتل الحديثة rep-vgg أو الكتل القائمة على المحولات.

الخلاصة

كان EfficientDet علامة فارقة في كفاءة التوسع، ولكن هذا المجال قد تطور. YOLOv10 أن الكشف NMS ممكن، وقد أتقن YOLO26 ذلك من أجل الإنتاج. بالنسبة للمطورين الذين يبحثون عن أفضل توازن بين السرعة والدقة وسهولة الاستخدام، فإن Ultralytics هو الخيار الأمثل. تتيح لك بنيته المبسطة، جنبًا إلى جنب مع نظام Ultralytics القوي، الانتقال من المفهوم إلى النشر بشكل أسرع من أي وقت مضى.

لمزيد من القراءة حول بنى النماذج، اطلع على مقارناتنا بين YOLOv8 YOLOv10 أو استكشف Ultralytics لبدء التدريب اليوم.


تعليقات