Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 مقابل YOLOX#

شهد تطور رؤية الحاسوب في الوقت الفعلي العديد من المحطات الهامة، مع قيام معماريات مختلفة بدفع حدود السرعة والدقة. نموذجان مؤثران للغاية في هذا المجال هما YOLOv5 و YOLOX. وعلى الرغم من شهرة كليهما بأدائهما العالي في كشف الأجسام، إلا أنهما يتبعان نهجين معماريين مختلفين تماماً.

يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهذين النموذجين، حيث يقارن بين معمارياتهما، ومقاييس الأداء، ومنهجيات التدريب، وسيناريوهات النشر المثالية لمساعدة المطورين والباحثين على اختيار الأداة المناسبة لمشاريع رؤية الذكاء الاصطناعي الخاصة بهم.

Link to this sectionنظرة عامة على النماذج والاختلافات المعمارية#

Link to this sectionUltralytics YOLOv5#

أطلقت Ultralytics نموذج YOLOv5، الذي سرعان ما أصبح معياراً صناعياً نظراً لتوازنه الاستثنائي بين الأداء وسهولة الاستخدام وكفاءة الذاكرة. تم بناء YOLOv5 محلياً على إطار العمل PyTorch، ويستخدم معمارية تعتمد على المرساة (anchor-based). يعتمد النموذج على أشكال صناديق إحاطة محددة مسبقاً للتنبؤ بمواقع الأجسام، مما يجعله فعالاً للغاية في مهام كشف الأجسام القياسية.

إحدى أكبر نقاط قوة YOLOv5 هي نظامه البيئي الذي يحظى بصيانة جيدة. فهو يتميز بتوثيق شامل، وواجهة برمجة تطبيقات Python بسيطة للغاية، وتكامل أصلي مع منصة Ultralytics. وهذا يتيح للمطورين الانتقال بسلاسة من وضع تسميات البيانات إلى التدريب والتصدير إلى تنسيقات مثل ONNX و TensorRT.

اعرف المزيد عن YOLOv5

ميزة النظام البيئي

تتطلب نماذج YOLO من Ultralytics عادةً ذاكرة GPU أقل بكثير أثناء التدريب مقارنة بالبدائل المعقدة القائمة على Transformer. تجعل هذه البصمة الذاكرية المنخفضة من YOLOv5 خياراً متاحاً للغاية للباحثين الذين يعملون باستخدام أجهزة بمواصفات تجارية.

Link to this sectionMegvii YOLOX#

طوّر باحثون في Megvii نموذج YOLOX، حيث سلكوا مساراً مختلفاً من خلال تقديم تصميم خالٍ من المرساة (anchor-free) إلى عائلة YOLO. ومن خلال التخلص من صناديق المرساة، يبسط YOLOX رأس الكشف ويقلل بشكل كبير من عدد المعلمات التجريبية التي تحتاج إلى ضبط يدوي أثناء التدريب.

يدمج YOLOX أيضاً رأساً منفصلاً (decoupled head) — حيث يفصل مهام التصنيف والانحدار إلى فروع شبكية مختلفة — ويستخدم استراتيجية تعيين التسميات SimOTA. هذه الابتكارات تسد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية، مما يجعل YOLOX فعالاً بشكل خاص في البيئات ذات المقاييس المتنوعة جداً للأجسام.

تعرف على المزيد حول YOLOX

Link to this sectionالأداء والمقاييس#

عند تقييم نماذج رؤية الحاسوب، يعد المقايضة بين متوسط دقة الكشف (mAP) وسرعة الاستدلال أمراً بالغ الأهمية. يوفر كلا النموذجين مجموعة من الأحجام (من النانو إلى الكبير جداً) لتناسب قيود الأجهزة المختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

بينما يحقق YOLOXx دقة قصوى أعلى قليلاً (51.1 mAP)، يوفر YOLOv5 خط أنابيب نشر أكثر قوة واختباراً بشكل شامل عبر أجهزة CPU و GPU. تسلط سرعات TensorRT الخاصة بـ YOLOv5 الضوء على تحسينه العميق لأجهزة الحوسبة الطرفية (edge computing)، مما يجعله خياراً موثوقاً للغاية لتحليلات الفيديو في الوقت الفعلي.

Link to this sectionمنهجيات التدريب وسهولة الاستخدام#

تختلف تجربة المطورين بشكل كبير بين هاتين المعماريين.

Link to this sectionنهج YOLOX#

يتطلب تدريب YOLOX عادةً استنساخ المستودع الأصلي، وإدارة تبعيات محددة، وتنفيذ نصوص برمجية معقدة عبر سطر الأوامر. وعلى الرغم من أنه يدعم ميزات متقدمة مثل التدريب بالدقة المختلطة (mixed-precision) وإعدادات العقد المتعددة عبر MegEngine، إلا أن منحنى التعلم يمكن أن يكون حاداً للمطورين الذين يحتاجون إلى نماذج أولية سريعة.

Link to this sectionميزة Ultralytics#

في المقابل، تعطي Ultralytics الأولوية لتجربة مستخدم مبسطة بشكل استثنائي. فمع حزمة ultralytics بلغة Python، يمكن للمطورين تحميل وتدريب والتحقق من صحة نموذج بأقل قدر من الكود المكرر. تتولى Ultralytics تلقائياً عمليات زيادة البيانات المعقدة، وتطوير المعلمات الفائقة، وجدولة معدل التعلم.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

علاوة على ذلك، تمتد مرونة YOLOv5 إلى ما هو أبعد من كشف الأجسام القياسي، حيث توفر دعماً قوياً لـ تصنيف الصور و تجزئة المثيلات ضمن نفس واجهة برمجة التطبيقات المتماسكة.

نشر مبسط

عند اكتمال التدريب، يكون تصدير نموذج YOLOv5 إلى CoreML أو TFLite أو OpenVINO بسيطاً مثل تشغيل model.export(format="onnx"). هذا يلغي الحاجة إلى نصوص تحويل تابعة لجهات خارجية والتي غالباً ما تتطلبها المستودعات التي تركز على البحث.

Link to this sectionتطبيقات العالم الحقيقي#

يعتمد الاختيار بين هذه النماذج على بيئة النشر والمتطلبات التقنية الخاصة بك:

  • التجزئة وإدارة المخزون: للتطبيقات التي تتطلب التعرف على المنتجات في الوقت الفعلي على الأجهزة الطرفية مثل NVIDIA Jetson، يعد YOLOv5 مناسباً بشكل استثنائي. بفضل بصمته الذاكرية الصغيرة وسرعات استدلال TensorRT السريعة، فإنه يتيح تتبع الكاميرات المتعددة دون إسقاط إطارات الفيديو.
  • البحث الأكاديمي والمعماريات المخصصة: يحظى YOLOX بتقدير كبير في مجتمع البحث. بفضل رأسه المنفصل وطبيعته الخالية من المرساة، يعد أساساً ممتازاً للمهندسين الذين يتطلعون إلى تجربة استراتيجيات جديدة لتعيين التسميات أو أولئك الذين يعملون على مجموعات بيانات حيث تفشل صناديق المرساة التقليدية في التعميم.
  • الذكاء الاصطناعي الزراعي: لمهام الزراعة الدقيقة مثل كشف الثمار أو تحديد الأعشاب الضارة عبر الطائرات بدون طيار، تتيح سهولة تدريب ونشر نماذج YOLOv5 باستخدام منصة Ultralytics لخبراء المجال تنفيذ حلول الذكاء الاصطناعي دون الحاجة إلى خلفيات عميقة في هندسة تعلم الآلة.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv5 و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv5#

يعد YOLOv5 خيارًا قويًا لـ:

  • أنظمة الإنتاج المثبتة: عمليات النشر الحالية حيث يتم تقدير سجل YOLOv5 الطويل من الاستقرار، والوثائق الشاملة، ودعم المجتمع الضخم.
  • التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خط أنابيب التدريب الفعال لـ YOLOv5 ومتطلبات الذاكرة الأقل ميزة.
  • دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.

Link to this sectionمتى تختار YOLOX#

يوصى باستخدام YOLOX لـ:

  • أبحاث الكشف بدون نقاط ارتكاز: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من نقاط الارتكاز كخط أساس لتجربة رؤوس كشف جديدة أو دوال خسارة مبتكرة.
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الجوال القديمة حيث يكون البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91 مليون معلمة) أمراً بالغ الأهمية.
  • دراسات تخصيص التصنيفات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تخصيص التصنيفات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionمستقبل رؤية الذكاء الاصطناعي: أدخل YOLO26#

في حين أن كلاً من YOLOv5 و YOLOX قد رسخا مكانتهما في تاريخ رؤية الحاسوب، إلا أن المجال يتقدم بسرعة. للمطورين الذين يبدأون مشاريع جديدة اليوم، توصي Ultralytics بشدة باستكشاف أحدث نماذجها الرائدة، YOLO26.

تم إطلاق YOLO26 في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام في كل من الأداء وسهولة الاستخدام. يقدم تصميماً ثورياً شاملاً لا يعتمد على NMS، حيث يلغي تماماً المعالجة اللاحقة لقمع غير الأقصى (Non-Maximum Suppression). هذا يقلل بشكل كبير من تباين زمن الوصول ويبسط منطق النشر على الأجهزة منخفضة الطاقة.

علاوة على ذلك، يستخدم YOLO26 مُحسِّن MuSGD المبتكر — وهو مزيج من SGD و Muon مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة — لتحقيق تقارب مستقر وسريع بشكل لا يصدق. ومع إزالة DFL (تمت إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع الأجهزة الطرفية/منخفضة الطاقة)، يحقق YOLO26 سرعة استدلال على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%، مما يعزز مكانته كنموذج نهائي للحوسبة الطرفية الحديثة، والروبوتات، وتطبيقات IoT. بالإضافة إلى ذلك، تقدم ProgLoss + STAL دوال خسارة محسنة مع تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـ IoT، والروبوتات، والتصوير الجوي. يمكن للمستخدمين المهتمين بالأجيال السابقة أيضاً إلقاء نظرة على YOLO11، على الرغم من أن YOLO26 هو الخيار الأحدث بلا منازع.

Link to this sectionالخلاصة#

يوفر كل من YOLOv5 و YOLOX قدرات مذهلة في كشف الأجسام. لقد دفع YOLOX الحدود المعمارية من خلال إثبات أن التصاميم الخالية من المرساة يمكن أن تنافس وتتجاوز الطرق التقليدية في عام 2021. ومع ذلك، لا يزال YOLOv5 قوة مهيمنة بسبب سهولة استخدامه التي لا تضاهى، ونظامه البيئي الواسع، ومتطلبات الذاكرة الأقل أثناء التدريب.

بالنسبة للغالبية العظمى من التطبيقات التجارية، يوفر نظام Ultralytics البيئي أسرع مسار من مجموعة بيانات خام إلى نموذج إنتاج منشور. سواء كنت تستخدم YOLOv5 المجرب والموثوق أو الترقية إلى YOLO26 المتطور، يستفيد المطورون من إطار عمل مصمم لجعل رؤية الذكاء الاصطناعي سهلة الوصول وفعالة وعالية الأداء.

التعليقات