Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet مقابل YOLOv10: تحليل تطور نماذج اكتشاف الكائنات#

في مجال computer vision سريع التطور، يعد اختيار بنية اكتشاف الكائنات المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة، وزمن الاستجابة، والكفاءة الحسابية. يقارن هذا الدليل التقني الشامل نموذجين مؤثرين للغاية: EfficientDet من Google و YOLOv10 من جامعة Tsinghua. في حين يمثل كلا النموذجين قفزات كبيرة في اكتشاف الكائنات، فإنهما يتعاملان مع التصميم المعماري وmodel optimization من زوايا مختلفة تماماً.

سوف نستكشف بنياتهما الأساسية، ونراجع معايير الأداء على standard datasets like COCO، ونناقش كيفية دمجهما في خطوط أنابيب تعلم الآلة الحديثة، مع تسليط الضوء بشكل خاص على مزايا Ultralytics ecosystem الشاملة.

Link to this sectionEfficientDet: رائد القياس المركب#

تم تقديم EfficientDet في أواخر عام 2019، وقد وضع معياراً جديداً لاكتشاف الكائنات القابل للتطوير وعالي الدقة من خلال تقديم نهج مبدئي لقياس أبعاد الشبكة.

Link to this sectionالابتكارات الرئيسية والبنية#

تم بناء EfficientDet على أساس EfficientNet، مستفيداً من شبكة هرمية ميزات ثنائية الاتجاه (BiFPN) مبتكرة. على عكس Feature Pyramid Networks (FPN) التقليدية التي تجمع الميزات دون تمييز أهميتها، تستخدم BiFPN أوزاناً قابلة للتعلم لدمج الميزات متعددة المقاييس. وهذا يسمح للشبكة بتعلم الميزات ذات الدقة التي تساهم أكثر في التنبؤ النهائي بفعالية. علاوة على ذلك، يستخدم EfficientDet طريقة قياس مركبة تقوم بقياس الدقة والعمق والعرض للشبكة الأساسية وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة بشكل موحد ومتزامن.

في حين يظل EfficientDet خياراً قوياً للأنظمة القديمة المدمجة بعمق مع خطوط أنابيب TensorFlow الأقدم، فإنه يأتي مع memory requirements كبيرة أثناء التدريب ويعتمد على نظام بيئي قديم يمكن أن يكون مرهقاً مقارنة بالأطر الحديثة والديناميكية.

تعرف على المزيد حول EfficientDet

Link to this sectionYOLOv10: المبتكر الخالي من NMS#

تم إصدار YOLOv10 في منتصف عام 2024، وقد غير بشكل جذري نموذج اكتشاف الكائنات في الوقت الفعلي من خلال إلغاء الحاجة إلى NMS أثناء المعالجة اللاحقة، مما أدى إلى تقليل inference latency بشكل كبير.

Link to this sectionالابتكارات الرئيسية والبنية#

يقدم YOLOv10 استراتيجية تعيين مزدوجة متسقة للتدريب الخالي من NMS. من خلال استخدام تعيينات التسميات من واحد إلى متعدد ومن واحد إلى واحد أثناء التدريب، تتعلم الشبكة إنتاج صناديق محيطة متطابقة بشكل فريد دون الاعتماد على NMS لتصفية التكرارات. يقلل تصميم النموذج الشامل هذا القائم على الكفاءة والدقة من التكرار الحسابي، مما يجعله مرشحاً ممتازاً لـ edge computing وتطبيقات بث الفيديو منخفضة زمن الاستجابة. وهو يتكامل بسلاسة مع نظام Ultralytics البيئي، مما يمنح المطورين إمكانية الوصول إلى API بسيط للغاية بلغة Python.

تعرف على المزيد حول YOLOv10

تأثير عدم الحاجة لـ NMS

من خلال إزالة خطوة NMS، يضمن YOLOv10 سرعات استنتاج متسقة بغض النظر عن عدد الكائنات التي يتم اكتشافها في المشهد، مما يقضي على ارتفاعات زمن الاستجابة التي تظهر غالباً في computer vision applications المزدحمة.

Link to this sectionمقارنة الأداء: الدقة والسرعة والكفاءة#

عند نشر النماذج في سيناريوهات العالم الحقيقي، يجب على المطورين الموازنة بين mean Average Precision (mAP) وعدد المعلمات والعمليات الحسابية (FLOPs). يوضح الجدول أدناه هذه المقاييس عبر متغيرات القياس لكلا النموذجين.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

ملاحظة: يتطلب متغير YOLOv10n معلمات أقل بكثير (2.3 مليون) ويحقق سرعات TensorRT متفوقة للغاية (1.56 مللي ثانية) مقارنة بتكرارات EfficientDet المبكرة، مما يجعله أكثر قابلية للتطبيق لـ real-time inference في الإنتاج.

Link to this sectionلماذا تختار Ultralytics لنشر النماذج؟#

بينما يتمتع كلا النموذجين بأهمية تاريخية وهيكلية، فإن دمجهما في خطوط أنابيب حديثة يمكن أن يمثل تحدياً. وهنا تتألق Ultralytics Platform. من خلال توفير نظام بيئي موحد، تبسط Ultralytics دورة الحياة بأكملها—بدءاً من data annotation وصولاً إلى النشر.

  1. سهولة الاستخدام: توفر حزمة Ultralytics بلغة Python واجهة واحدة لـ model training، وvalidation، والتصدير، مما يحل محل مئات الأسطر من الكود البرمجي المتكرر بأوامر موجزة.
  2. النظام البيئي وتعدد الاستخدامات: بينما يتخصص EfficientDet بشكل كبير في الاكتشاف، تمتد نماذج Ultralytics YOLO بشكل طبيعي إلى Instance Segmentation، وPose Estimation، وOriented Bounding Boxes (OBB)، والتصنيف.
  3. كفاءة التدريب: من خلال الاستفادة من تقنيات متطورة مثل التجميع التلقائي والتدريب الموزع، يتم تدريب نماذج Ultralytics بشكل أسرع وتستهلك ذاكرة CUDA أقل بكثير من بنى Transformer الثقيلة أو بنى TF القديمة متعددة الفروع.

Link to this sectionمثال برمجي: تدريب YOLOv10#

يعد نشر YOLOv10 باستخدام Ultralytics أمراً بسيطاً للغاية. يوضح مقتطف الكود التالي كيفية تهيئة وتدريب وتقييم شبكة YOLOv10 بالكامل داخل Python API.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Evaluate the model on the validation set
metrics = model.val()

# Export the model to ONNX for production deployment
model.export(format="onnx")

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين EfficientDet وYOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار EfficientDet#

يعد EfficientDet خياراً قوياً في الحالات التالية:

  • خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص التصدير إلى TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

Link to this sectionمتى تختار YOLOv10#

يوصى باستخدام YOLOv10 في الحالات التالية:

  • الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالمستقبل هنا: استكشف Ultralytics YOLO26#

بينما قدم YOLOv10 تصميماً ثورياً خالياً من NMS، تطورت التكنولوجيا. يمثل Ultralytics YOLO26، الذي تم إصداره في يناير 2026، أحدث ما توصلت إليه تقنيات الرؤية الحاسوبية (AI) بشكل نهائي. فهو يوحّد أفضل جوانب البنى السابقة - مثل قدرات المهام المتعددة في YOLO11 واستقرار RT-DETR - في نموذج واحد قوي ومحسّن للغاية.

ميزة YOLO26

إذا كنت تبدأ مشروعاً جديداً، فإننا نوصي بشدة بالترقية إلى YOLO26. فهو يوفر مرونة لا مثيل لها وسهولة في الاستخدام عبر منصة Ultralytics.

إنجازات رئيسية في YOLO26:

  • تصميم شامل (End-to-End) بدون NMS: بناءً على الأسس التي وضعها YOLOv10، يعد YOLO26 نموذجاً شاملاً أصلياً، مما يبسط منطق النشر إلى الحد الأدنى.
  • استدلال أسرع على CPU بنسبة تصل إلى 43%: مع إزالة Distribution Focal Loss (DFL)، يقلل YOLO26 بشكل كبير من العبء الحسابي، مما يجعله المتصدر بلا منازع لـ أجهزة AI الطرفية.
  • مُحسّن MuSGD: يستعير YOLO26 ابتكارات من تدريب النماذج اللغوية الكبيرة (LLM). من خلال دمج استقرار SGD مع سرعة Muon، فإنه يتقارب بشكل أسرع وأكثر موثوقية من أي نموذج سابق.
  • ProgLoss + STAL: صيغ خسارة فائقة تحل بفعالية القضايا طويلة الأمد المتعلقة بالكشف عن الأجسام الصغيرة، وهو مجال كان يعاني فيه EfficientDet تقليدياً.

تعرف على المزيد حول YOLO26

Link to this sectionالخلاصة: مطابقة النماذج مع حالات الاستخدام#

يعتمد الاختيار بين هذه الشبكات في النهاية على قيود النشر الخاصة بك:

  • لا يزال EfficientDet موضوع اهتمام أكاديمي فيما يتعلق بالقياس المركب وهو مناسب للباحثين الذين يحافظون على أنظمة TensorFlow الحالية حيث يكون حجم أوزان النموذج (على القرص) أكثر أهمية من سرعة وقت التشغيل.
  • يعد YOLOv10 استثنائياً للتطبيقات التي تتطلب زمن استجابة منخفضاً للغاية، مثل تتبع الأجسام المتعددة عالي السرعة ومراقبة حركة المرور، وذلك بفضل بنيته الرائدة الخالية من NMS.
  • أما YOLO26 فهو التوصية النهائية لـ مشاريع الرؤية الحاسوبية الحديثة، حيث يقدم أفضل توازن للأداء من حيث الدقة، والحد الأدنى من استهلاك الذاكرة، وتعدد مهام متنوع مدعوم بنظام Ultralytics البيئي القوي.
المساهمون

التعليقات