Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 في مقابل EfficientDet: تقييم بنى كشف الكائنات في الوقت الفعلي#

عند الشروع في مشروع جديد لـ الرؤية الحاسوبية، يُعد اختيار بنية الشبكة العصبية الصحيحة أحد أكثر القرارات أهمية التي ستتخذها. يوفر هذا الدليل مقارنة تقنية متعمقة بين Ultralytics YOLOv5 و EfficientDet من جوجل. من خلال تحليل بنيتهما ومقاييس الأداء وأنظمة التدريب البيئية، نهدف إلى مساعدة المطورين والباحثين على تحديد أفضل نموذج لكشف الكائنات لبيئات النشر الخاصة بهم.

بينما قدمت EfficientDet مفاهيم جديدة في التحجيم المركب ودمج الميزات، أحدثت YOLOv5 ثورة في الصناعة من خلال إضفاء الطابع الديمقراطي على الوصول إلى الذكاء الاصطناعي عالي الأداء عبر تنفيذ PyTorch البديهي للغاية، وتجربة المستخدم المبسطة، والتوازن الفريد بين السرعة والدقة.

Link to this sectionUltralytics YOLOv5: معيار الصناعة للسهولة والوصول#

تم إصدار YOLOv5 في صيف عام 2020، ومثلت تحولاً محورياً في سلالة YOLO. ومع الانتقال من إطار عمل Darknet المعتمد على C إلى PyTorch الأصلي، أصبحت البنية المفضلة للمطورين الذين يتطلعون إلى بناء النماذج وتدريبها ونشرها بسرعة.

Link to this sectionالابتكارات المعمارية#

تشتهر YOLOv5 ببنيتها المحسنة للغاية التي تعطي الأولوية لدورة حياة تعلم الآلة سلسة. وهي تستخدم هيكلاً أساسياً معدلاً من CSPDarknet53 مقترناً بعنق شبكة تجميع المسار (PANet)، مما يحسن بشكل كبير انتشار الميزات عبر مقاييس مكانية متعددة.

تشمل التطورات الرئيسية ما يلي:

  • تعزيز البيانات بالفسيفساء (Mosaic Data Augmentation): تدمج تقنية التدريب هذه أربع صور تدريبية متميزة في فسيفساء واحدة. وهذا يجبر النموذج على تعلم كيفية تحديد الكائنات في سياقات مكانية معقدة ويعزز بشكل كبير قدرته على اكتشاف الأهداف الصغيرة.
  • صناديق الارتساء ذاتية التعلم (Auto-Learning Anchor Boxes): قبل بدء التدريب، تقوم YOLOv5 بتحليل بيانات التدريب المخصصة لك وتحسب تلقائياً أبعاد صندوق الارتساء المثالية باستخدام تجميع k-means.
  • كفاءة الذاكرة: مقارنة بالنماذج الثقيلة القائمة على Transformer، تحافظ YOLOv5 على بصمة ذاكرة أقل بكثير أثناء التدريب والاستدلال، مما يسمح لها بالعمل بسلاسة على الأجهزة المخصصة للمستهلكين.

اعرف المزيد عن YOLOv5

Link to this sectionEfficientDet: كشف الكائنات القابل للتوسع#

تم تقديم EfficientDet بواسطة Google Research في عام 2019، بهدف توفير عائلة من كواشف الكائنات القابلة للتوسع. وهي تعتمد على هيكل تصنيف الصور EfficientNet وتقدم آلية مبتكرة لدمج الميزات.

Link to this sectionالابتكارات المعمارية#

تكمن الفكرة الأساسية لـ EfficientDet في نهجها المنهجي في التحجيم وتجميع الميزات:

  • BiFPN (شبكة هرم الميزات ثنائية الاتجاه): على عكس شبكات FPN التقليدية التي تمرر المعلومات من الأعلى إلى الأسفل فقط، تتيح BiFPN دمج الميزات متعددة المقاييس بسرعة وسهولة من خلال إدخال أوزان قابلة للتعلم لمعرفة أهمية ميزات الإدخال المختلفة.
  • التحجيم المركب: تقوم EfficientDet بشكل مشترك بزيادة الدقة والعمق والعرض لجميع الشبكات الأساسية وشبكات الميزات وشبكات التنبؤ بالصندوق/الفئة، مما ينتج عنه نماذج تتراوح من D0 خفيف الوزن إلى D7 الضخم.

اعرف المزيد عن EfficientDet

اختلافات إطار العمل

بينما تعتمد EfficientDet بشكل كبير على نظام TensorFlow البيئي ومكتبات AutoML، تعمل YOLOv5 بشكل أصلي داخل PyTorch، مما يوفر ما يجده العديد من المطورين سير عمل أكثر بديهية و pythonic وقابلية للتصحيح.

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج، يعد تقييم أدائها على معايير قياسية مثل مجموعة بيانات COCO أمراً بالغ الأهمية. يسلط الجدول أدناه الضوء على المقايضات بين الحجم، والمتطلبات الحسابية (FLOPs)، وسرعة الاستدلال.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Link to this sectionتحليل متوازن#

تتألق YOLOv5 في مرونة النشر وتوافق تسريع الأجهزة الخام. لاحظ سرعات TensorRT السريعة للغاية على وحدة معالجة الرسومات T4. وهذا يجعل YOLOv5 مناسبة بشكل لا يصدق لتحليلات الفيديو ذات الإنتاجية العالية وخطوط أنابيب الاستدلال في الوقت الفعلي. علاوة على ذلك، يجعل نظام Ultralytics البيئي التصدير إلى تنسيقات مثل ONNX و CoreML و TensorRT أمراً يتم بأمر برمجي واحد.

توفر EfficientDet كفاءة ممتازة في المعلمات. بالنسبة لعدد معين من المعلمات، غالباً ما تستخرج متوسط دقة متوسط (mAP) عالٍ. ومع ذلك، لا تترجم هذه الكفاءة النظرية دائماً إلى أوقات استدلال أسرع على وحدات معالجة الرسومات الطرفية بسبب التوجيه المعقد لطبقة BiFPN، والتي قد تكون مقيدة بعرض نطاق الذاكرة بدلاً من كونها مقيدة بالحوسبة.

Link to this sectionالنظام البيئي وسهولة الاستخدام#

الميزة الحاسمة لاختيار نموذج Ultralytics تكمن في النظام البيئي المحيط. تعد YOLOv5 جزءاً من مستودع تتم صيانته بشكل مكثف وتطويره بنشاط مع دعم مجتمعي هائل.

مع تقديم منصة Ultralytics، يمكن للمستخدمين الانتقال بسلاسة من جمع البيانات إلى النشر. تدعم هذه المنصة التعليق التوضيحي التلقائي، والتدريب السحابي، ومراقبة النموذج مباشرة. في المقابل، يتطلب تدريب EfficientDet غالباً التعامل مع تعقيدات واجهات برمجة تطبيقات كشف الكائنات القديمة في TensorFlow، والتي يمكن أن تمثل منحنى تعليمي حاد للنماذج الأولية السريعة.

علاوة على ذلك، يمتد تنوع YOLOv5 إلى ما هو أبعد من صناديق التحديد. من خلال التحديثات المستمرة، يدعم إطار عمل Ultralytics أصلياً تجزئة المثيلات و تصنيف الصور، مما يوفر واجهة برمجة تطبيقات موحدة لمهام رؤية حاسوبية متعددة.

Link to this sectionحالات الاستخدام المثالية#

  • اختر YOLOv5 عندما: تحتاج إلى نماذج أولية سريعة، وتجربة تدريب خالية من الاحتكاك، ونشر طرفي محسّن للغاية. إنه مثالي للطائرات بدون طيار، تحليلات التجزئة، وتطبيقات الأجهزة المحمولة حيث يكون زمن الانتقال المنخفض أمراً بالغ الأهمية.
  • اختر EfficientDet عندما: تعمل بدقة داخل بيئة Google Cloud/TensorFlow AutoML وتحتاج إلى أقصى دقة لكل معلمة دون قيود زمن انتقال صارمة في الوقت الفعلي.

Link to this sectionالجيل القادم: تبني YOLO26#

بينما تظل YOLOv5 خياراً موثوقاً، فقد تقدم مشهد الرؤية الحاسوبية. بالنسبة للمطورين الذين يبحثون عن أحدث ما توصلت إليه التكنولوجيا في عام 2026، تمثل YOLO26 القمة الجديدة في مجموعة Ultralytics.

بناءً على إرث سابقاتها (مثل YOLOv8 و YOLO11)، تقدم YOLO26 ابتكارات رائدة:

  • تصميم شامل خالٍ من NMS: تلغي YOLO26 أصلياً الحاجة إلى معالجة لاحقة لإخماد القيم غير القصوى (Non-Maximum Suppression). وهذا يقلل بشكل كبير من تباين زمن الانتقال ويبسط بنية النشر.
  • Up to 43% Faster CPU Inference: Heavily optimized for edge AI, it brings unprecedented speeds to low-power edge devices and standard CPUs without dedicated GPUs.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة (LLM)، يضمن هذا الهجين من SGD و Muon تدريباً مستقراً للغاية وتقارباً سريعاً.
  • وظائف خسارة متقدمة: يؤدي دمج ProgLoss و STAL إلى تحسين التعرف على الأهداف الصغيرة بشكل كبير، وهو أمر حيوي لصور الطائرات بدون طيار على ارتفاعات عالية و الروبوتات.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss، يتم تبسيط عملية تصدير النموذج، مما يعزز التوافق عبر مسرعات الأجهزة المختلفة.

قد يرغب المستخدمون المهتمون باستكشاف بنيات حديثة أخرى ضمن نظام Ultralytics البيئي في مقارنة نماذج مثل YOLOv10 أو RT-DETR.

الترحيل سهل

صُممت واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics لتكون متوافقة مع الإصدارات السابقة واللاحقة. الترقية من YOLOv5 إلى YOLO26 بسيطة حرفياً مثل تغيير سلسلة أوزان النموذج في الكود الخاص بك!

Link to this sectionمثال برمجي: التدريب والاستدلال#

لإثبات سهولة الاستخدام التي لا تضاهى لنظام Ultralytics البيئي، إليك كيفية التدريب وتشغيل الاستدلال باستخدام نموذج YOLO حديث. هذا الكود قابل للتشغيل بنسبة 100% ويتعامل مع تنزيل مجموعة البيانات، وحلقات التدريب، والتحقق من الصحة تلقائياً.

from ultralytics import YOLO

# Load a modern model (Swap 'yolov5s.pt' for 'yolo26n.pt' to test the newest architecture!)
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset for 20 epochs
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# Run inference on an image from the web
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with bounding boxes
inference_results[0].show()

من خلال إعطاء الأولوية لتجربة المستخدم، والحفاظ على نظام بيئي قوي، ودفع حدود ما هو ممكن باستمرار من خلال تحديثات مثل YOLO26، تضمن Ultralytics أن المطورين لديهم دائماً أفضل الأدوات المتاحة لحل تحديات الذكاء البصري في العالم الحقيقي.

المساهمون

التعليقات