Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv7 وYOLOv10#

شهد مجال الرؤية الحاسوبية تطورات ملحوظة على مدى السنوات القليلة الماضية، حيث قادت عائلة نماذج YOLO (You Only Look Once) الطليعة في مجال اكتشاف الكائنات في الوقت الفعلي. يتطلب اختيار البنية المناسبة لمشاريع الرؤية الحاسوبية فهماً عميقاً للخيارات المتاحة. في هذه المقارنة التقنية الشاملة، سنستكشف الاختلافات الرئيسية بين بنيتين بارزتين: YOLOv7 وYOLOv10.

Link to this sectionمقدمة عن النماذج#

يمثل كلا النموذجين علامات فارقة في تاريخ الذكاء الاصطناعي، ومع ذلك فإنهما يتخذان نهجين مختلفين جذرياً لحل تحديات اكتشاف الكائنات.

Link to this sectionYOLOv7: الرائد في مفهوم حقيبة الهدايا#

أصدر الباحثون تشيان-ياو وانغ، وأليكسي بوخكوفسكي، وهونغ-يوان مارك لياو من معهد علوم المعلومات في أكاديميا سينيكا نموذج YOLOv7 في 6 يوليو 2022، والذي أدخل نقلة نوعية في كيفية تحسين الشبكات العصبية. ركز البحث الأصلي، المفصل في ورقتهم الأكاديمية والموجود في مستودع GitHub الرسمي الخاص بهم، بشكل كبير على إعادة تكييف البنية و"مجموعة من الإضافات المجانية" القابلة للتدريب.

يستفيد YOLOv7 من شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN) لتوجيه الشبكة في تعلم ميزات متنوعة دون تدمير مسار التدرج الأصلي. وهذا يجعله خياراً قوياً لمعايير البحث الأكاديمي والأنظمة التي تعتمد بشكل كبير على وحدات معالجة الرسومات (GPUs) عالية الأداء.

اعرف المزيد عن YOLOv7

Link to this sectionYOLOv10: اكتشاف شامل في الوقت الفعلي#

تم تطوير YOLOv10 بواسطة آو وانغ وفريقه في جامعة تسينغhua، وتم إصداره في 23 مايو 2024. وكما هو مفصل في منشور arxiv الخاص به وفي مستودع GitHub الخاص بجامعة تسينغhua، يلغي هذا النموذج عنق زجاجة طال أمده في اكتشاف الكائنات وهو: كبت النطاقات غير القصوى (NMS).

أدخل YOLOv10 مهام مزدوجة متسقة للتدريب بدون NMS، مما أدى إلى تغيير خط معالجة ما بعد المعالجة بشكل جذري. ومن خلال نشر استراتيجية تصميم نموذج شاملة تعتمد على الكفاءة والدقة، يقلل YOLOv10 من التكرار الحسابي. وينتج عن هذا بنية مصممة خصيصاً لأجهزة الحافة التي تتطلب زمن انتقال منخفض للغاية.

تعرف على المزيد حول YOLOv10

بنية خالية من NMS

إن إزالة كبت النطاقات غير القصوى (NMS) في YOLOv10 تسمح بتصدير النموذج بالكامل كرسم بياني حسابي واحد. وهذا يبسط بشكل كبير عملية النشر باستخدام بيئات التشغيل مثل TensorRT أو OpenVINO.

Link to this sectionمقارنة الأداء والمقاييس#

عند تحليل أداء النموذج، من الضروري تقييم المقايضات بين الدقة والسرعة والوزن الحسابي. يوضح الجدول التالي كيفية مقارنة أحجام مختلفة من هذه النماذج ببعضها البعض.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionتحليل المقايضات#

تكشف المقاييس أعلاه عن فجوة جيلية واضحة. فبينما يقدم YOLOv7x قيمة mAPval قوية جداً تبلغ 53.1%، فإنه يتطلب 71.3 مليون معلمة و189.9 مليار عملية فاصلة عائمة (FLOPs). في المقابل، يتفوق YOLOv10l في الدقة (53.3% mAP) مع تطلبه لأقل من نصف عدد المعلمات (29.5 مليون) وعدد أقل بكثير من عمليات FLOPs (120.3 مليار). علاوة على ذلك، يوفر YOLOv10n المحسن للغاية سرعة استنتاج مذهلة تبلغ 1.56 مللي ثانية، مما يجعله مثالياً لتحليلات الفيديو في الوقت الفعلي وتطبيقات الهاتف المحمول.

Link to this sectionحالات الاستخدام في العالم الحقيقي#

تحدد الاختلافات الهيكلية بين هذه النماذج حالات الاستخدام المثلى لها.

Link to this sectionمتى تستخدم YOLOv7#

نظراً لتمثيله الغني للميزات، يتفوق YOLOv7 في البيئات شديدة التعقيد. تستفيد حالات الاستخدام مثل مراقبة تدفق حركة المرور في المناطق الحضرية المزدحمة، أو تحليل صور الأقمار الصناعية، أو تحديد العيوب في أتمتة التصنيع الثقيلة من إعادة تكييف بنيته القوية. كما أنه مفضل بشدة في البيئات القديمة التي تم دمجها بالفعل بعمق مع خطوط معالجة PyTorch 1.12 المحددة.

Link to this sectionمتى تستخدم YOLOv10#

يتألق التصميم خفيف الوزن والخالي من NMS الخاص بـ YOLOv10 في البيئات المقيدة. يوصى به بشدة لأجهزة حوسبة الحافة مثل NVIDIA Jetson Nano أو Raspberry Pi. تجعل سرعته المنخفضة في زمن الانتقال منه مثالياً للتطبيقات سريعة الحركة مثل تحليلات الرياضة، والملاحة بالطائرات بدون طيار المستقلة، والفرز الآلي عالي السرعة على أحزمة النقل.

Link to this sectionميزة نظام Ultralytics البيئي#

بينما يمتلك كلا النموذجين جذوراً أكاديمية قوية، فإن إمكاناتهما الحقيقية تنطلق عند استخدامهما ضمن منصة Ultralytics الموحدة. إن تطوير نماذج الرؤية الحاسوبية من الصفر أمر صعب للغاية، ولكن نظام Ultralytics البيئي يوفر تجربة لا مثيل لها لمهندسي تعلم الآلة.

  • سهولة الاستخدام: توفر واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics واجهة موحدة. يمكنك تدريب النماذج والتحقق منها وتصديرها ببضعة أسطر فقط من التعليمات البرمجية، مما يجنبك كوابيس التبعيات المعقدة المرتبطة بالمستودعات الأكاديمية النموذجية.
  • نظام بيئي مُصان جيداً: تضمن Ultralytics أن الكود الأساسي يتم تطويره بنشاط. يستفيد المستخدمون من عمليات الدمج السلسة مع أدوات تعلم الآلة الشهيرة مثل Weights & Biases للتسجيل، أو Hugging Face للعروض التوضيحية السريعة على الويب.
  • متطلبات الذاكرة: غالباً ما تستهلك كاشفات الكائنات القائمة على Transformer كميات هائلة من ذاكرة CUDA أثناء التدريب. في المقابل، تتطلب نماذج Ultralytics YOLO ذاكرة أقل بكثير، مما يسمح بأحجام دفعات أكبر بكثير على الأجهزة الاستهلاكية.
  • تعدد الاستخدامات: لا يقتصر خط معالجة Ultralytics على صناديق التحديد القياسية. فهو يدعم بسلاسة تقدير الوضع، وتقسيم المثيلات، وصناديق التحديد الموجهة عبر عائلات النماذج المدعومة مثل YOLO11 وYOLOv8.

Link to this sectionمثال على التدريب المبسط#

يعد تشغيل خط معالجة التدريب باستخدام Ultralytics أمراً مباشراً بشكل ملحوظ. وبغض النظر عما إذا كنت تستفيد من القوة التاريخية لـ YOLOv7 أو سرعة YOLOv10 الخالية من NMS، فإن الصيغة تظل ثابتة:

from ultralytics import YOLO

# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to an edge-friendly format like ONNX
model.export(format="onnx")

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv7 وYOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv7#

يعد YOLOv7 خياراً قوياً لـ:

  • قياس الأداء الأكاديمي: إعادة إنتاج نتائج متطورة من حقبة 2022 أو دراسة تأثيرات تقنيات E-ELAN و"حقيبة الأدوات المجانية" القابلة للتدريب.
  • أبحاث إعادة التقييم (Reparameterization): دراسة الالتفافات المعاد تقييمها المخطط لها واستراتيجيات قياس النموذج المركب.
  • خطوط الأنابيب المخصصة الحالية: المشاريع ذات خطوط الأنابيب المخصصة للغاية المبنية حول معمارية YOLOv7 المحددة التي لا يمكن إعادة تصميمها بسهولة.

Link to this sectionمتى تختار YOLOv10#

يوصى باستخدام YOLOv10 في الحالات التالية:

  • الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالمستقبل: تقديم YOLO26#

بينما يمثل YOLOv7 وYOLOv10 علامات فارقة مثيرة للإعجاب، فإن حدود الذكاء الاصطناعي تتقدم دائماً. تم إصدار Ultralytics YOLO26 في يناير 2026، وهو المعيار الجديد بلا منازع للكفاءة والدقة عبر جميع سيناريوهات النشر على الحافة والسحابة.

إذا كنت تبدأ مشروع رؤية حاسوبية جديداً اليوم، فإن YOLO26 هو البنية الموصى بها. فهو يبني على إرث أسلافه من خلال دمج العديد من الابتكارات الرائدة:

  • تصميم شامل خالٍ من NMS: مستوحى من YOLOv10، يلغي YOLO26 بشكل أصلي معالجة ما بعد الـ NMS، مما يضمن استنتاجاً بزمن انتقال منخفض للغاية للروبوتات الحتمية في الوقت الفعلي.
  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال إزالة وحدة خسارة التوزيع البؤري (DFL) بشكل استراتيجي، يعمل YOLO26 على تسريع التنفيذ بشكل كبير على أجهزة حوسبة الحافة غير المزودة بـ GPU، مما يجعله قوة دفع لأجهزة IoT.
  • محسن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة الحديثة، يدمج YOLO26 مزيجاً من SGD وMuon، مما يعمل على استقرار مسارات التدريب وضمان تقارب أسرع.
  • ProgLoss + STAL: تحقق وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، مما يتغلب على نقطة ضعف تاريخية في أجيال YOLO القديمة.
  • تعدد استخدامات لا مثيل له: يتميز YOLO26 بتحسينات أصلية خاصة بالمهام مثل تقدير احتمالية السجل المتبقي (RLE) لتتبع الوضع وخسائر الزاوية المتخصصة لاكتشاف OBB الدقيق في الصور الجوية.

بالنسبة للمهندسين الذين يبحثون عن التوازن النهائي بين السرعة والدقة وبساطة النشر، فإن الانتقال من النماذج القديمة إلى YOLO26 يوفر ميزة تنافسية فورية وقابلة للقياس.

المساهمون

التعليقات