Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv9 و YOLOv7#

لقد كان تطور اكتشاف الكائنات في الوقت الفعلي مدفوعًا بالسعي المستمر لتحقيق التوازن بين الكفاءة الحسابية والدقة العالية. ومن أبرز المعماريات في هذه المسيرة YOLOv9 و YOLOv7، اللتان طورهما باحثون في معهد علوم المعلومات التابع للأكاديمية الصينية (Academia Sinica) في تايوان. وفي حين قدمت YOLOv7 ابتكارات ثورية ضمن مفهوم "حقيبة الهدايا القابلة للتدريب"، فإن YOLOv9 الأحدث تعالج اختناقات معلومات التعلم العميق بشكل مباشر.

تستكشف هذه المقارنة التقنية الشاملة الاختلافات المعمارية، ومقاييس الأداء، وسيناريوهات النشر المثالية لكلا النموذجين، مما يساعد مهندسي وباحثي التعلم الآلي على اختيار الأداة المناسبة لخطوط معالجة الرؤية الحاسوبية الخاصة بهم.

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج، تعد الدقة الخام والكفاءة من العوامل الحاسمة. يوضح الجدول التالي متوسط الدقة (mAP) والمتطلبات الحسابية لمقاييس مجموعة بيانات COCO القياسية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
توازن الأداء

لاحظ كيف يحقق YOLOv9c نفس الدقة تقريبًا (53.0 mAP) مثل YOLOv7x (53.1 mAP) مع استخدام عدد أقل بكثير من المعلمات (25.3M مقابل 71.3M) وعمليات الفاصلة العائمة (FLOPs). يوضح هذا تحسينات توازن الأداء في المعماريات الحديثة.

Link to this sectionYOLOv9: حل اختناق المعلومات#

أحدثت YOLOv9، التي تم تقديمها في أوائل عام 2024، تغييرًا جذريًا في كيفية احتفاظ الشبكات العصبية العميقة بالبيانات عبر طبقاتها.

Link to this sectionالابتكارات المعمارية#

تقدم YOLOv9 شبكة تجميع الطبقات الفعالة المعممة (GELAN) ومعلومات التدرج القابلة للبرمجة (PGI). تدمج GELAN بين نقاط قوة CSPNet و ELAN لتحسين كفاءة المعلمات والتكلفة الحسابية، مما يضمن دقة عالية مع عدد أقل من المعلمات. تعد PGI إطار عمل إشرافي مساعد مصمم لمنع فقدان البيانات في الشبكات العميقة، حيث تولد تدرجات موثوقة لتحديث الأوزان أثناء عملية التدريب.

Link to this sectionنقاط القوة والقيود#

تكمن القوة الرئيسية لـ YOLOv9 في قدرتها على استخراج ميزات دقيقة دون تكلفة حسابية هائلة، مما يجعلها قادرة بشكل لا يصدق على المهام التي تتطلب دقة عالية في الميزات، مثل تحليل الصور الطبية. ومع ذلك، يمكن لهيكل PGI المعقد أثناء التدريب أن يجعل التعديلات المعمارية المخصصة أكثر صعوبة للمبتدئين مقارنة بالأطر الأكثر توحيدًا.

اعرف المزيد عن YOLOv9

Link to this sectionYOLOv7: الرائد في مفهوم حقيبة الهدايا#

وضعت YOLOv7، التي تم إصدارها في عام 2022، معيارًا جديدًا لما يمكن تحقيقه على أجهزة المستهلكين، حيث قدمت ابتكارات هيكلية عززت بشكل كبير سرعات الاستدلال في الوقت الفعلي.

Link to this sectionالابتكارات المعمارية#

تتمثل المساهمة الجوهرية لـ YOLOv7 في شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تمكن هذه المعمارية النموذج من تعلم ميزات أكثر تنوعًا بشكل مستمر. بالإضافة إلى ذلك، تستخدم YOLOv7 "حقيبة هدايا قابلة للتدريب"، وهي تقنيات مثل الالتفافات المعاد تهيئتها المخطط لها وتعيين التصنيفات الديناميكي. تعمل هذه الأساليب على تحسين دقة النموذج أثناء التدريب دون إضافة تكاليف استدلال أثناء النشر.

Link to this sectionنقاط القوة والقيود#

تم تحسين YOLOv7 بشكل كبير للمعالجة الطرفية في الوقت الفعلي ولا تزال عنصرًا أساسيًا في الأنظمة القديمة وبيئات CUDA الأقدم. قيودها الرئيسية اليوم هي حجم معلماتها الأكبر مقارنة بالنماذج الأحدث. كما هو موضح في جدول الأداء، يتطلب تحقيق دقة عالية استخدام نموذج YOLOv7x الثقيل، الذي يتطلب ذاكرة GPU أكبر بكثير من المعماريات الحديثة المماثلة.

اعرف المزيد عن YOLOv7

Link to this sectionميزة Ultralytics: نشر مبسط#

بينما توفر مستودعات الأبحاث الأصلية لـ YOLOv9 و YOLOv7 أسسًا أكاديمية ممتازة، قد يكون نشر هذه النماذج في بيئات الإنتاج معقدًا. يوفر دمجها من خلال حزمة ultralytics سهولة في الاستخدام لا مثيل لها.

من خلال استخدام منصة Ultralytics المتكاملة، يستفيد المطورون من نظام بيئي مُصان جيدًا يتميز بواجهة برمجة تطبيقات Python بديهية، ودعم مجتمعي نشط، وتتبع تجارب قوي.

Link to this sectionاستشراف المستقبل مع YOLO26#

إذا كنت تبدأ مشروع رؤية حاسوبية جديدًا، فإننا نوصي بشدة باستكشاف YOLO26 الذي تم إصداره حديثًا بدلاً من YOLOv9 و YOLOv7. وباعتباره المعيار الجديد المتطور، يقدم YOLO26 تطورات رائدة:

  • تصميم بدون NMS من البداية للنهاية: يلغي معالجة ما بعد الاستدلال الخاصة بـ Non-Maximum Suppression، مما يقلل بشكل كبير من تعقيد النشر وزمن الاستجابة.
  • سرعة استدلال على CPU أسرع بنسبة تصل إلى 43%: محسن لبيئات الحوسبة الطرفية، مما يضمن تشغيل تطبيقك بسلاسة حتى بدون وحدات GPU مخصصة.
  • مُحسِّن MuSGD: مُحسِّن هجين مستوحى من تدريب نماذج اللغة الكبيرة (LLM)، يوفر تقاربًا مستقرًا للغاية ويقلل من وقت التدريب.
  • إزالة DFL: تبسيط تصدير النموذج عن طريق إزالة Distribution Focal Loss، مما يعزز التوافق مع الأجهزة المحمولة منخفضة الطاقة.
  • ProgLoss + STAL: تحسن الأداء بشكل كبير في اكتشاف الكائنات الصغيرة، مما يجعله الخيار الأول لـ الصور الجوية والمراقبة.

تشمل البدائل الشائعة الأخرى ضمن النظام البيئي Ultralytics YOLOv8 و YOLO11، وكلاهما يوفر تعدد استخدامات هائل عبر مهام مثل تقسيم المثيلات وتقدير الوضع.

Link to this sectionمثال على التنفيذ#

إن تدريب وتصدير أي من هذه المعماريات بسيط للغاية باستخدام واجهة برمجة التطبيقات الموحدة. يوضح الكود أدناه خاصية كفاءة التدريب المبسطة لأدوات Ultralytics.

from ultralytics import YOLO

# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt")  # Swap with "yolo26n.pt" for faster edge performance

# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")
متطلبات الذاكرة

عند التدريب على أجهزة من فئة المستهلكين، تعد كفاءة الذاكرة أمرًا بالغ الأهمية. تم تحسين تطبيقات Ultralytics لـ YOLOv9 و YOLO26 بشكل كبير لتقليل ارتفاع استهلاك VRAM، على عكس النماذج القائمة على Transformer (مثل RT-DETR) التي تعاني غالبًا من تضخم الذاكرة الشديد أثناء التدريب.

Link to this sectionتطبيقات العالم الحقيقي وحالات الاستخدام المثالية#

غالبًا ما يعتمد الاختيار بين هذه المعماريات على القيود المحددة لبيئة الإنتاج الخاصة بك.

متى تستخدم YOLOv9: تتفوق YOLOv9 في البيئات التي يكون فيها الاحتفاظ بالتفاصيل الدقيقة ضروريًا. يجعلها استخراج الميزات القوي مثالية لـ تحليلات التجزئة لحساب المنتجات المعبأة بكثافة على الأرفف أو للتطبيقات الزراعية حيث يكون تحديد أمراض المحاصيل في مراحلها المبكرة على الأوراق الصغيرة أمرًا بالغ الأهمية.

متى تستخدم YOLOv7: تظل YOLOv7 مرشحًا قويًا لخطوط النشر القديمة. إذا كنت تقوم بالتكامل مع أنظمة أجهزة أقدم (مثل أجيال معينة من Google Coral Edge TPU)، فقد يكون من الأسهل تجميع معمارية CNN المباشرة لـ YOLOv7 مقارنة بفروع التدرج الأكثر تعقيدًا للنماذج الأحدث.

متى تستخدم YOLO26 (موصى به): بالنسبة لأي نشر حديث—من الطائرات بدون طيار ذاتية القيادة إلى إدارة المرور في المدن الذكية—يعد YOLO26 هو الخيار المتفوق. تضمن معماريتها الخالية من NMS أوقات استدلال حتمية، وهو أمر ضروري للروبوتات ذات الأهمية الحيوية للسلامة، بينما تتفوق دقتها العالية على كل من YOLOv9 و YOLOv7 بشكل عام.

التعليقات