Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 مقابل YOLOv9#

تطور مشهد اكتشاف الكائنات في الوقت الفعلي بسرعة كبيرة، حيث تجاوز كل إصدار جديد حدود ما كان ممكناً على أجهزة الحافة وخوادم السحابة على حد سواء. عند تقييم البنى التحتية لمشاريع رؤية الحاسوب، يقارن المطورون بشكل متكرر بين المقاييس الراسخة والابتكارات الأحدث. يقارن هذا الدليل الشامل بين محطتين محوريتين في عائلة YOLO: YOLOv7 وYOLOv9.

سنقوم بتحليل طفراتهم المعمارية، ومقاييس الأداء، وسيناريوهات النشر المثالية لمساعدتك في اختيار النموذج المناسب لتطبيقك. كما سنستكشف كيف توحد منصة Ultralytics هذه النماذج، مما يسهل عملية تدريبها والتحقق منها ونشرها.

Link to this sectionسلالة النموذج والمواصفات الفنية#

يوفر فهم أصول وفلسفات تصميم هذه النماذج سياقاً أساسياً لقدراتها. يشترك كلا النموذجين في سلالة بحثية مشتركة ولكنهما يستهدفان عنق الزجاجة المعماري المختلف.

Link to this sectionYOLOv7: الرائد في مفهوم حقيبة الهدايا#

تم إصدار YOLOv7 في منتصف عام 2022، وقد أثبت نفسه كبنية معمارية موثوقة للغاية ومحسنة بشكل مكثف. قدمت إعادة برمجة هيكلية ونهج "مجموعة الأدوات القابلة للتدريب" للحفاظ على سرعات استنتاج عالية دون المساس بـ متوسط دقة متوسط (mAP).

الابتكارات المعمارية: يتميز YOLOv7 بشبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، والتي تسمح للنموذج بتعلم ميزات أكثر تنوعاً عن طريق توسيع وخلط ودمج الكاردينالية. يؤدي هذا التصميم إلى استغلال ممتاز لوحدة معالجة الرسومات (GPU) وتأخير الاستنتاج. ومع ذلك، قد يتطلب ذاكرة كبيرة أثناء عمليات التدريب المعقدة مقارنة بالإصدارات الحديثة.

اعرف المزيد عن YOLOv7

Link to this sectionYOLOv9: حل اختناق المعلومات#

تم تقديم YOLOv9 في أوائل عام 2024 من قبل نفس الفريق البحثي، وهو يعالج "عنق زجاجة المعلومات" المتأصل في الشبكات العصبية العميقة. مع مرور البيانات عبر الطبقات العميقة، غالباً ما تُفقد تفاصيل حاسمة. يخفف YOLOv9 من هذا من خلال تصميمات طبقات جديدة جذرياً.

الابتكارات المعمارية: يقدم YOLOv9 معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). تضمن PGI الحفاظ على التدرجات الموثوقة وإعادة تغذيتها لتحديث الأوزان بدقة. تزيد GELAN من كفاءة المعاملات، مما يمكن YOLOv9 من تحقيق دقة عالية بعدد أقل بكثير من FLOPs مقارنة بأسلافه.

اعرف المزيد عن YOLOv9

Link to this sectionتحليل الأداء#

عند الاختيار بين البنى التحتية، يجب على مهندسي الذكاء الاصطناعي موازنة الدقة، وسرعة الاستنتاج، والتكلفة الحسابية. يسلط الجدول أدناه الضوء على اختلافات الأداء عبر هذه النماذج على مجموعة بيانات COCO القياسية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionالخلاصة#

  • كفاءة المعاملات: يطابق YOLOv9m دقة YOLOv7l (51.4% mAP) مع استخدام معاملات أقل بنسبة 45% تقريباً (20.0M مقابل 36.9M). هذا التخفيض الكبير يجعل نشر YOLOv9m أسهل بكثير على أجهزة ذكاء اصطناعي للحافة محدودة الذاكرة.
  • النشر المصغر: يوفر تقديم متغير YOLOv9t (tiny) سرعات مذهلة (2.3 مللي ثانية على T4 TensorRT) للبيئات التي تكون فيها قيود الوقت الفعلي مطلقة.
  • أقصى دقة: بالنسبة للتطبيقات التي تكون فيها الدقة ذات أهمية قصوى، يدفع YOLOv9e دقة الاكتشاف إلى 55.6% mAP، متفوقاً بشكل كبير على YOLOv7x.
تأمين مشاريع رؤية الحاسوب الخاصة بك للمستقبل

بينما يعد كل من YOLOv7 وYOLOv9 قويين، يمثل YOLO26 الذي تم إصداره حديثاً القفزة النوعية النهائية. يقدم YOLO26 تصميماً أصلياً خالٍ من NMS من البداية إلى النهاية، مما يلغي المعالجة اللاحقة المعقدة ويعزز سرعات استنتاج وحدة المعالجة المركزية (CPU) بنسبة تصل إلى 43%. من خلال استخدام مُحسِّن MuSGD الجديد ووظائف الخسارة المحسنة ProgLoss + STAL، يوفر YOLO26 استقراراً لا مثيل له في التدريب ودقة في اكتشاف الأجسام الصغيرة.

Link to this sectionميزة Ultralytics#

اختيار معمارية النموذج هو مجرد الخطوة الأولى. يحدد النظام البيئي للبرمجيات المحيط بالنموذج مدى سرعة انتقالك من النموذج الأولي إلى الإنتاج. توفر دمج هذه النماذج من خلال واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics فوائد كبيرة للمطورين والباحثين.

Link to this sectionسهولة الاستخدام وكفاءة التدريب#

تاريخياً، تطلب تدريب YOLOv7 إعداد بيانات معقد ونصوصاً مخصصة بشكل كبير. يقوم إطار عمل Ultralytics بتجريد تعقيدات التعلم العميق هذه. يمكن للمطورين التبديل بسهولة بين البنى التحتية، وتجربة ضبط المعلمات الفائقة، واستخدام خطوط أنابيب تعزيز البيانات الذكية بأقل قدر من الكود.

علاوة على ذلك، يعمل Ultralytics على تحسين استخدام الذاكرة أثناء التدريب والاستنتاج. على عكس نماذج المحولات الثقيلة (مثل RT-DETR)، يتم تدريب بنى Ultralytics YOLO بشكل أسرع بكثير وتتطلب ذاكرة CUDA أقل بكثير، مما يجعلها مثالية لوحدات معالجة الرسومات المخصصة للمستهلكين.

Link to this sectionمثال برمجي: تدريب مبسط#

تدريب أحدث النماذج يتم بسلاسة داخل نظام Ultralytics البيئي. إليك مثال قابل للتشغيل بالكامل يوضح كيفية تدريب والتحقق من صحة نموذج YOLOv9:

from ultralytics import YOLO

# Initialize the model (you can swap 'yolov9c.pt' with 'yolov7.pt' or 'yolo26n.pt')
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 sample dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=50,
    imgsz=640,
    device="0",  # Use GPU 0 if available
    batch=16,  # Optimized batch size for memory efficiency
)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Link to this sectionتنوع لا مثيل له عبر المهام#

نظام بيئي مُدار جيداً يعني الوصول إلى مهام رؤية حاسوب متنوعة. بينما تم بناء YOLOv7 في المقام الأول لاكتشاف الكائنات (مع إصدارات تجريبية لاحقة لمهام أخرى)، تم بناء نماذج Ultralytics الحديثة أصلاً لتكون متنوعة. يمكنك القيام بـ تقسيم المثيلات، وتقدير الوضعية، وتصنيف الصور، واكتشاف مربع التحديد الموجه (OBB) بسلاسة مباشرة خارج الصندوق.

Link to this sectionحالات الاستخدام والتطبيقات المثالية#

غالباً ما يعتمد القرار بين YOLOv7 وYOLOv9 على قيود صناعتك المحددة وتوافر الأجهزة.

Link to this sectionمتى تستخدم YOLOv7#

  • نشر الحافة القديم: بالنسبة لبيئات الأجهزة التي تم ضبطها وتحسينها بالفعل بشكل كبير لبنية E-ELAN الخاصة بـ YOLOv7، تظل خياراً قوياً لـ إنترنت الأشياء الصناعي.
  • مراقبة المرور: تجعل معدلات الإطارات العالية لـ YOLOv7 واستقراره المثبت خياراً ممتازاً للبنية التحتية للمدن الذكية وإدارة المرور في الوقت الفعلي.
  • تكامل الروبوتات: يتطلب التنقل في البيئات الديناميكية معالجة ذات زمن انتقال منخفض، وهو سيناريو تم فيه اختبار متغيرات YOLOv7 بشكل مكثف.

Link to this sectionمتى تستخدم YOLOv9#

  • التصوير الطبي: بنية PGI في YOLOv9 استثنائية في الحفاظ على التفاصيل الدقيقة عبر الطبقات العميقة، وهو أمر بالغ الأهمية عند تحليل مهام تحليل الصور الطبية المعقدة مثل اكتشاف الأورام.
  • تحليلات التجزئة الكثيفة: لتتبع وعد العناصر المعبأة بكثافة على أرفف البيع بالتجزئة، يوفر تكامل الميزات في YOLOv9 دقة فائقة ويقلل من السلبيات الكاذبة.
  • التصوير الجوي وبالطائرات بدون طيار: تسمح كفاءة المعلمات في YOLOv9m بمعالجة الصور عالية الدقة على الطائرات بدون طيار، مما يساعد في الحفاظ على الحياة البرية والمراقبة الزراعية دون استنزاف عمر البطارية.

Link to this sectionالخلاصة#

لقد رسخ كل من YOLOv7 وYOLOv9 مكانتهما في تاريخ رؤية الحاسوب. قدم YOLOv7 تحسينات أساسية للمعالجة في الوقت الفعلي، بينما عالج YOLOv9 الاختناقات الهيكلية في التعلم العميق لزيادة كفاءة المعلمات إلى الحد الأقصى.

ومع ذلك، بالنسبة للمطورين الذين يبدأون مشاريع جديدة اليوم، فإن الاستفادة من نظام Ultralytics البيئي—وخاصة النماذج من الجيل التالي مثل YOLO11 وYOLO26—توفر التوازن الأكثر ملاءمة بين السرعة والدقة وتجربة المطور. مع ابتكارات مثل مُحسِّن MuSGD وإزالة خسارة التوزيع البؤري (DFL) لتوافق أوسع مع الأجهزة، تواصل Ultralytics توفير الأدوات الأكثر سهولة وقوة لمحترفي رؤية الذكاء الاصطناعي.

المساهمون

التعليقات