Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet مقابل YOLOv9#

لقد تشكل مشهد الرؤية الحاسوبية من خلال اختراقات مستمرة في تصميم الشبكات العصبية. يعد العثور على التوازن الصحيح بين الكفاءة الحسابية ودقة الكشف أمراً بالغ الأهمية عند اختيار النموذج. أرست EfficientDet من جوجل أساساً قوياً في عام 2019 من خلال تقديم بنيات قابلة للتوسع، بينما دفعت YOLOv9، التي تم إصدارها في عام 2024، حدود اكتشاف الكائنات باستخدام معلومات التدرج القابلة للبرمجة (PGI).

يقدم هذا الدليل مقارنة فنية شاملة بين هذين النموذجين ويقدم إطار العمل الحديث Ultralytics YOLO26، الذي يوفر حلاً قوياً وشاملاً ومحسناً لبيئات الإنتاج.

Link to this sectionبنيات النماذج والابتكارات#

يعد فهم الآليات الأساسية لـ EfficientDet و YOLOv9 ضرورياً لتحديد حالات الاستخدام الأمثل لهما.

Link to this sectionEfficientDet: القياس المركب وBiFPN#

تم تطوير EfficientDet بواسطة Google Research، وهي تركز على القياس المنهجي ودمج الميزات بكفاءة. وتستخدم EfficientNet كعمود فقري لها وتقدم بنية شبكة ميزات جديدة.

  • المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
  • المنظمة: Google
  • التاريخ: 20 نوفمبر 2019
  • روابط: Arxiv، GitHub

الميزات المعمارية الرئيسية: تعتمد EfficientDet بشكل كبير على شبكة هرمية للميزات ثنائية الاتجاه (BiFPN)، مما يسمح بدمج ميزات متعددة المقاييس بسهولة وسرعة. إلى جانب ذلك، تستخدم طريقة قياس مركبة تقوم بتوسيع الدقة والعمق وعرض الشبكة بشكل موحد. على الرغم من دقتها العالية في وقتها، فإن EfficientDet مرتبطة بشكل كبير ببيئات TensorFlow القديمة، مما يجعل مسارات النشر الحديثة معقدة.

اعرف المزيد عن EfficientDet

Link to this sectionYOLOv9: حل اختناق المعلومات#

تم تطوير YOLOv9 بواسطة باحثين في Academia Sinica، وهي تعالج تدهور المعلومات أثناء مرور البيانات عبر الشبكات العصبية العميقة.

  • المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، Academia Sinica
  • التاريخ: 21 فبراير 2024
  • روابط: Arxiv، GitHub، المستندات

الميزات المعمارية الرئيسية: تقدم YOLOv9 معلومات التدرج القابلة للبرمجة (PGI) لتوفير إشراف إضافي، مما يضمن الاحتفاظ بالبيانات المهمة لتحديث أوزان الشبكة بشكل موثوق. كما أنها تتميز بشبكة تجميع الطبقات الفعالة المعممة (GELAN) لزيادة كفاءة المعلمات إلى أقصى حد. على الرغم من هذه التطورات، لا تزال YOLOv9 تتطلب قمع غير الحد الأقصى (NMS) أثناء المعالجة اللاحقة، مما يضيف زمن انتقال.

اعرف المزيد عن YOLOv9

Link to this sectionمقارنة الأداء#

عند تقييم هذه النماذج، يساعد تحليل البيانات التجريبية في تحديد البنية التي توفر أفضل مقايضة لمتطلبات الأجهزة الخاصة بك.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionتحليل نقدي#

توفر YOLOv9 قفزة جيلية في السرعة. على سبيل المثال، تحقق YOLOv9e 55.6% mAP مع زمن انتقال TensorRT يبلغ 16.77 مللي ثانية. وعلى النقيض تماماً، تقدم EfficientDet-d7 معدل mAP أقل بنسبة 53.7% ولكنها تعاني من زمن انتقال هائل (128.07 مللي ثانية)، مما يجعل من الصعب للغاية نشرها في تدفقات الفيديو في الوقت الفعلي.

تصدير النماذج للإنتاج

يؤدي تصدير بنيتك إلى تنسيقات محسنة مثل TensorRT أو OpenVINO إلى تقليل أوقات الاستدلال بشكل كبير مقارنة بتشغيل PyTorch الخام.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين EfficientDet و YOLOv9 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار EfficientDet#

يعد EfficientDet خياراً قوياً في الحالات التالية:

  • خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
  • النشر عبر الهاتف المحمول باستخدام TFLite: المشاريع التي تتطلب تحديداً تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

Link to this sectionمتى تختار YOLOv9#

يوصى بـ YOLOv9 لـ:

  • أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: اختيار YOLO26#

بينما مهدت YOLOv9 و EfficientDet الطريق، يجب على المطورين الذين يبحثون عن إطار عمل حديث وجاهز للإنتاج التفكير في نماذج Ultralytics YOLO، وتحديداً YOLO26 الذي تم إصداره حديثاً.

توفر منصة Ultralytics سهولة لا مثيل لها في الاستخدام، حيث تجمع بين برامج تدريب محلية قوية وواجهة تدعم السحابة. يمثل YOLO26 إصلاحاً شاملاً في تصميم النموذج، مما يجعل البنيات القديمة عفا عليها الزمن للعديد من التطبيقات التجارية.

Link to this sectionأبرز الميزات التقنية لـ YOLO26#

  • تصميم شامل بدون NMS: يلغي YOLO26 اختناقات المعالجة اللاحقة تماماً. من خلال إزالة قمع غير الحد الأقصى، يتم توحيد رسوم بيانية النشر وتصبح أسرع بطبيعتها على رقائق الذكاء الاصطناعي المتطورة.
  • سرعة استدلال وحدة المعالجة المركزية تصل إلى 43%: محسنة بشكل كبير للأجهزة المضمنة، مما يجعلها أسرع بكثير من كل من YOLOv9 و EfficientDet عندما تكون وحدات معالجة الرسومات غير متوفرة.
  • مُحسِّن MuSGD: من خلال دمج ابتكارات النماذج اللغوية الكبيرة في رؤية الذكاء الاصطناعي، يعمل هذا المُحسِّن الهجين على استقرار جولات التدريب، مما يسمح للنماذج بالتقارب بشكل أسرع بموارد أقل.
  • متطلبات ذاكرة منخفضة: على عكس البنيات الثقيلة للمحولات أو شبكات CNN غير المحسنة، يقلل YOLO26 من استهلاك ذاكرة CUDA أثناء التدريب، مما يتيح لك استخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.
  • ProgLoss + STAL: يعزز تصميم دالة الخسارة المتفوق الدقة بشكل كبير لاكتشاف الكائنات الصغيرة، مما يجعل YOLO26 مثالياً للتصوير الجوي وشبكات إنترنت الأشياء.
  • إزالة DFL: التصميم الهيكلي المبسط يتيح التحويل السلس إلى تنسيقات النشر المحمول.

تعرف على المزيد حول YOLO26

تشمل الخيارات القوية الأخرى في نظام Ultralytics البيئي YOLO11 و YOLOv8، والتي توفر أيضاً تنوعاً في المهام المتعددة مثل تجزئة المثيل و تقدير الوضع.

Link to this sectionتدريب مبسط باستخدام Python SDK#

تعطي نماذج Ultralytics الأولوية لتجربة المطور. يتم اختصار تدريب نموذج متطور في بضعة أسطر فقط من Python.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Link to this sectionتطبيقات العالم الحقيقي#

يعتمد الاختيار بين هذه البنيات بشكل كبير على هدف النشر الخاص بك.

  • عمليات النشر السحابية القديمة: كانت EfficientDet شائعة للمعالجة الجماعية غير المتصلة بالإنترنت والقائمة على السحابة حيث كانت هناك حاجة إلى دقة عالية، ولم تكن هناك قيود صارمة على الوقت الفعلي.
  • البحث الأكاديمي: تظل YOLOv9 خياراً مثيراً للاهتمام للباحثين الذين يدفعون حدود CNN النظرية ويحللون تدفقات التدرج عبر طبقات الشبكة.
  • حوسبة الحافة وإنترنت الأشياء: يسيطر YOLO26 على التطبيقات الواقعية. إن خط الأنابيب الخاص به الخالي من NMS وقدرات مربع التحديد الموجه (OBB) تجعله الخيار المتفوق لتحليل حركة المرور في المدن الذكية، ومراقبة مخزون التجزئة، والتفتيش القائم على الطائرات بدون طيار، مما يوفر توازناً لا يهزم بين الدقة العالية وسرعات الاستدلال السريعة.
المساهمون

التعليقات