Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 مقارنة بـ YOLOX#

شهد مجال الرؤية الحاسوبية تطوراً سريعاً في بنيات اكتشاف الأشياء في الوقت الفعلي. يقدم هذا الدليل مقارنة شاملة بين YOLOv9 و YOLOX، مع تحليل ابتكاراتهما الهيكلية، ومقاييس الأداء، ومنهجيات التدريب. سواء كنت تبني تطبيقات ذكية لـ الذكاء الاصطناعي في التصنيع أو تستكشف النمذجة التنبؤية، فإن فهم هذه النماذج سيساعدك على اتخاذ قرارات مستنيرة لنشرك القادم.

Link to this sectionالابتكارات المعمارية#

Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#

قدم YOLOv9 تحولاً نوعياً من خلال معالجة مشكلة عنق زجاجة المعلومات المتأصلة في الشبكات العصبية العميقة. تشمل ابتكاراته الأساسية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).

  • المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
  • التاريخ: 21 فبراير 2024
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

من خلال الاحتفاظ ببيانات الميزات المهمة أثناء عملية التغذية الأمامية، يضمن YOLOv9 بقاء التدرجات المستخدمة لتحديث الأوزان أثناء الانتشار العكسي دقيقة. تتفوق هذه البنية في استخراج الميزات، مما يجعلها قادرة للغاية على اكتشاف الأشياء الصغيرة في البيئات المعقدة، مثل تلك الموجودة في صور الأقمار الصناعية والمسح الطبي المفصل.

اعرف المزيد عن YOLOv9

Link to this sectionYOLOX: الجسر بين البحث والصناعة#

بعد إصداره في منتصف عام 2021، نقل YOLOX سلسلة YOLO نحو تصميم خالٍ من نقاط الارتكاز (anchor-free). وقد قدم رأساً مفككاً (decoupled head) يفصل بين مهام التصنيف والتحديد، واستخدم استراتيجية تعيين التسميات SimOTA لتحسين تقارب التدريب.

  • المؤلفون: Zheng Ge، وSongtao Liu، وFeng Wang، وZeming Li، وJian Sun
  • المؤسسة: Megvii
  • التاريخ: 18 يوليو 2021
  • Arxiv: 2107.08430
  • GitHub: Megvii-BaseDetection/YOLOX

على الرغم من أن YOLOX كان ثورياً في وقته، حيث حقق متوسط دقة (mAP) ممتازاً وألغى الحاجة لضبط المعلمات الفائقة لصناديق الارتكاز، إلا أن بنيته الأساسية قد تجاوزتها الشبكات الحديثة التي توازن بشكل أفضل بين عدد المعلمات والاحتفاظ بالميزات.

تعرف على المزيد حول YOLOX

تطور الأنظمة الخالية من نقاط الارتكاز

تتبنى كل من YOLOX ونماذج Ultralytics الأحدث تصاميم خالية من نقاط الارتكاز، مما يقلل من تعقيد ضبط المعلمات الفائقة ويحسن التعميم عبر مجموعات بيانات متنوعة.

Link to this sectionتحليل الأداء#

عند مقارنة هذه النماذج عبر معيار MS COCO، تصبح التطورات في YOLOv9 واضحة. يحقق YOLOv9 باستمرار توازناً أفضل بين الدقة و FLOPs.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

بينما يوفر YOLOX متغيرات خفيفة الوزن مثل YOLOX-Nano لحالات الحافة المتطرفة، تتفوق متغيرات YOLOv9 باستمرار على نماذج YOLOX ذات الحجم المماثل من حيث الدقة الخالصة. على سبيل المثال، يحقق YOLOv9m دقة mAP تبلغ 51.4% مقارنة بـ 49.7% لـ YOLOXl، على الرغم من احتوائه على أقل من نصف عدد المعلمات (20.0M مقابل 54.2M).

Link to this sectionميزة Ultralytics#

لا يتضمن اختيار النموذج النظرية المعمارية فحسب؛ بل إن النظام البيئي المحيط به يحدد سرعة التطوير ونجاح النشر. يوفر استخدام YOLOv9 ضمن النظام البيئي لـ Ultralytics سهولة استخدام لا تضاهى ودعماً قوياً من المجتمع.

على عكس مستودعات الأبحاث الأصلية القديمة، يوفر إطار عمل Ultralytics واجهة برمجة تطبيقات (API) موحدة بلغة Python تبسط خطوط العمل المعقدة. يتطلب التدريب ذاكرة GPU أقل بكثير من العديد من البدائل، مما يوفر كفاءة تدريب مذهلة.

from ultralytics import YOLO

# Initialize the YOLOv9c model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export the optimized model to TensorRT format
model.export(format="engine")

مع دعم مدمج لمهام متعددة، بما في ذلك اكتشاف الأشياء، تجزئة المثيلات، و تقدير الوضعية، يمكنك تغيير حلول الرؤية الحاسوبية الخاصة بك بسرعة دون تغيير قاعدة الكود بالكامل.

تصدير سلس

هل تقوم بالنشر على الحافة (Edge)؟ تجعل Ultralytics من السهل تصدير نماذجك المدربة إلى تنسيقات محسنة للغاية مثل ONNX، TensorRT، و OpenVINO بأمر واحد فقط.

Link to this sectionتطبيقات العالم الحقيقي#

تؤهل نقاط القوة المحددة لهذه النماذج لاستخدامها في تطبيقات واقعية مميزة:

Link to this sectionتحليلات التجزئة عالية السرعة#

بالنسبة لبيئات التجزئة الحديثة التي تتطلب التعرف على المنتجات في الوقت الفعلي، يتفوق YOLOv9. قدرته على الاحتفاظ بتفاصيل الميزات المعقدة تجعله مناسباً تماماً لعمليات نشر الذكاء الاصطناعي في التجزئة حيث يكون التمييز بين المنتجات المتشابهة بصرياً على رف مزدحم أمراً ضرورياً.

Link to this sectionعمليات نشر الحافة القديمة#

في السيناريوهات التي تحكمها قيود أجهزة صارمة أو وحدات NPU متخصصة تواجه صعوبة مع كتل التجميع الأحدث، يمكن لـ YOLOX-Nano أن يجد مكاناً مناسباً أحياناً. غالباً ما تُفضل أنماط الالتفاف (convolution) الخالصة والمبسطة الخاصة به للموارد المحدودة للغاية مثل المتحكمات الدقيقة.

Link to this sectionالروبوتات المستقلة#

بالنسبة للملاحة في الروبوتات، قد يكون فقدان الأشياء الصغيرة كارثياً. تضمن بنية GELAN داخل YOLOv9 عدم فقدان ميزات العوائق الصغيرة والبعيدة في الطبقات العميقة للشبكة، مما يتفوق على النماذج القديمة في بيئات السلامة الحرجة مثل تطبيقات الذكاء الاصطناعي في السيارات.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv9 و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv9#

YOLOv9 هي خيار قوي لـ:

  • أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار YOLOX#

يوصى باستخدام YOLOX لـ:

  • أبحاث الكشف بدون نقاط ارتكاز: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من نقاط الارتكاز كخط أساس لتجربة رؤوس كشف جديدة أو دوال خسارة مبتكرة.
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الجوال القديمة حيث يكون البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91 مليون معلمة) أمراً بالغ الأهمية.
  • دراسات تخصيص التصنيفات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تخصيص التصنيفات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالمستقبل: دخول YOLO26#

بينما يمثل YOLOv9 علامة فارقة مثيرة للإعجاب، فإن متطلبات بيئات الإنتاج تدفع الحدود باستمرار. يمثل YOLO26 الذي تم إصداره حديثاً المعيار النهائي للذكاء الاصطناعي البصري الحديث.

يعيد YOLO26 تنشيط خط أنابيب النشر بالكامل بتصميم أصلي End-to-End NMS-Free. من خلال القضاء على الحاجة إلى قمع غير الحد الأقصى (Non-Maximum Suppression) المعقد أثناء المعالجة اللاحقة، فإنه يوفر زمن انتقال للاستدلال أقل بشكل ملحوظ.

علاوة على ذلك، يدمج YOLO26 مُحسِّن MuSGD الثوري، وهو مزيج من SGD و Muon يستعير ابتكارات من تدريب النماذج اللغوية الكبيرة (LLM) لتوفير تقارب سريع ومستقر بشكل لا يصدق. من خلال إزالة خسارة بؤرية التوزيع (DFL)، يحقق YOLO26 استدلالاً أسرع على CPU بنسبة تصل إلى 43% مقارنة بأسلافه، مما يجعله الخيار الأفضل على الإطلاق لأجهزة الحافة وعمليات النشر المؤسسية. مع تحسينات ملحوظة في التعرف على الأشياء الصغيرة عبر ProgLoss و STAL، يحل YOLO26 محل كل من YOLOX و YOLOv9 بفعالية.

بالنسبة للمهندسين الذين يستكشفون بنيات حديثة، نوصي أيضاً بتجربة YOLO11 و RT-DETR كبدائل قوية ضمن مجموعة Ultralytics. تأكد من أن مشروعك جاهز للمستقبل من خلال الاستفادة من الأداء الذي لا يضاهى لأحدث النماذج على منصة Ultralytics Platform.

التعليقات