YOLOX مقابل YOLOv7: مقارنة تقنية شاملة
لقد تطور مجال اكتشاف الكائنات في الوقت الفعلي بفضل الاختراقات المعمارية المستمرة. وتعد كل من YOLOX و YOLOv7 محطتين بارزتين في هذه المسيرة. فمنذ صدورهما بفارق عام واحد، قدم كلا النموذجين نهجاً مبتكراً في نموذج اكتشاف الكائنات القياسي، مما أدى إلى تحسين المقايضة بين السرعة والدقة بشكل كبير.
تقدم هذه الصفحة تحليلاً تقنياً متعمقاً لـ YOLOX و YOLOv7، حيث تقارن بين بنيتهما، ومقاييس الأداء، وحالات الاستخدام المثالية لمساعدة المطورين في اختيار الأداة المناسبة لنشر تطبيقات الرؤية الحاسوبية الخاصة بهم.
YOLOX: ريادة الاكتشاف بدون نقاط ارتكاز (Anchor-Free)
قدم باحثون في شركة Megvii نموذج YOLOX في يوليو 2021، ممثلاً تحولاً كبيراً بالابتعاد عن التصاميم التقليدية المعتمدة على نقاط الارتكاز (Anchor-based). ومن خلال جسر الفجوة بين البحث الأكاديمي والتطبيق الصناعي، عمل YOLOX على تبسيط رأس الاكتشاف (Detection Head) وتحسين الأداء العام.
تفاصيل النموذج الأساسية:
- المؤلفون: Zheng Ge، Songtao Liu، Feng Wang، Zeming Li، و Jian Sun
- المؤسسة: Megvii
- التاريخ: 2021-07-18
- ورقة بحثية: arXiv:2107.08430
- الكود المصدري: Megvii YOLOX GitHub
- التوثيق: وثائق YOLOX على ReadTheDocs
الابتكارات المعمارية
قدم YOLOX نهجاً خالياً من نقاط الارتكاز، مما قلل بشكل جذري من عدد معلمات التصميم والضبط التجريبي المطلوب لمجموعات البيانات المخصصة. كما نفذ رأساً مفصولاً (Decoupled Head)، مما يفصل بين مهام التصنيف والانحدار، وهو ما أدى إلى تحسين سرعة التقارب والدقة. بالإضافة إلى ذلك، استخدم YOLOX استراتيجيات متقدمة لـ تعزيز البيانات مثل MixUp و Mosaic لتعزيز متانة النموذج.
من خلال القضاء على صناديق الارتكاز، يقلل YOLOX من العبء الحسابي لحساب التقاطع فوق الاتحاد (IoU) بين التنبؤات والحقائق الأرضية أثناء التدريب، مما يؤدي إلى متطلبات أقل لـ ذاكرة CUDA وأوقات تدريب أسرع.
YOLOv7: حقيبة المجانيات القابلة للتدريب (Trainable Bag-of-Freebies)
أصدر باحثون في معهد علوم المعلومات التابع لأكاديمية سينيكا في تايوان نموذج YOLOv7 في يوليو 2022، مما دفع حدود اكتشاف الكائنات في الوقت الفعلي إلى مستويات أبعد. وقد قدم مفهوم "حقيبة الميزات القابلة للتدريب" (Trainable bag-of-freebies)، واضعاً معايير جديدة هي الأفضل في فئتها على مجموعة بيانات MS COCO عند صدوره.
تفاصيل النموذج الأساسية:
- المؤلفون: Chien-Yao Wang وAlexey Bochkovskiy وHong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- ورقة بحثية: arXiv:2207.02696
- الكود المصدري: WongKinYiu YOLOv7 GitHub
- التوثيق: Ultralytics YOLOv7 Docs
الابتكارات المعمارية
بُنيت بنية YOLOv7 حول شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، والتي تتيح للنموذج تعلم ميزات أكثر تنوعاً باستمرار دون تدهور مسار التدرج. علاوة على ذلك، استخدم YOLOv7 تقنيات إعادة تحديد معلمات النموذج، مما مكن من تبسيط شبكات التدريب المعقدة متعددة الفروع إلى شبكات أحادية المسار أسرع أثناء الاستدلال.
مقارنة الأداء
عند تقييم هذه النماذج للتطبيقات الواقعية، من الضروري فهم أدائها عبر المقاييس المختلفة. يقارن الجدول أدناه المقاييس القياسية لأحجام مختلفة من YOLOX و YOLOv7.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
التحليل
- الدقة: يحقق YOLOv7 عموماً mAP أعلى مقارنة بنماذج YOLOX المكافئة. على سبيل المثال، يحقق YOLOv7x دقة 53.1 mAP مقارنة بـ 51.1 لنموذج YOLOXx.
- السرعة: في حين أن كلا النموذجين محسنان للغاية لتنفيذ GPU باستخدام TensorRT، توفر بنية E-ELAN في YOLOv7 إنتاجية أفضل قليلاً للتطبيقات المتطورة، على الرغم من أن YOLOX يحافظ على زمن استجابة ممتاز على أجهزة الحافة الصغيرة.
- تعدد الاستخدامات: وسع YOLOv7 ذخيرته إلى ما هو أبعد من الصناديق المحيطة من خلال توفير أوزان بشكل أصلي لـ تجزئة المثيلات و تقدير الوضعية، مما يجعله أكثر تنوعاً من مستودع YOLOX الأساسي.
تطبيقات العالم الحقيقي
يعتمد الاختيار بين هذه النماذج غالباً على بيئة النشر الخاصة بك.
الحوسبة الطرفية وإنترنت الأشياء
بالنسبة لأجهزة الحافة المحدودة مثل Raspberry Pi أو معالجات الهاتف المحمول القديمة، تعد YOLOX-Nano و YOLOX-Tiny جذابة للغاية. فعدد معالماتها الأدنى وطبيعتها الخالية من نقاط الارتكاز تجعل من الأسهل نشرها في بيئات منخفضة الطاقة لمهام مثل تتبع الحركة الأساسي أو تطبيقات جرس الباب الذكي.
تحليلات الفيديو عالية الدقة
لمعالجة التغذيات عالية الدقة في كشف العيوب الصناعية أو مراقبة حركة المرور الكثيفة، يعد YOLOv7 متفوقاً. حيث يسمح تجميع الميزات القوي الخاص به بالحفاظ على دقة عالية حتى عندما تكون الكائنات محجوبة جزئياً أو متفاوتة جداً في الحجم.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOX و YOLOv7 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOX
يعد YOLOX خياراً قوياً لـ:
- أبحاث الاكتشاف الخالي من المراسي: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من المراسي كقاعدة لتجربة رؤوس اكتشاف جديدة أو دوال خسارة (loss functions).
- أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الهاتف المحمول القديمة حيث يعد البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91M معامل) أمراً بالغ الأهمية.
- دراسات تعيين التسميات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.
متى تختار YOLOv7
يوصى بـ YOLOv7 في الحالات التالية:
- قياس الأداء الأكاديمي: إعادة إنتاج نتائج متطورة من حقبة 2022 أو دراسة تأثيرات تقنيات E-ELAN والحقيبة القابلة للتدريب من الميزات المجانية.
- أبحاث إعادة المعاملة: التحقيق في الالتفافات المخطط لها والمُعاد معاملتها واستراتيجيات تحجيم النماذج المركبة.
- خطوط الأنابيب المخصصة الحالية: المشاريع ذات خطوط الأنابيب المخصصة بشكل كبير والمبنية حول معمارية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.
متى تختار Ultralytics (YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
ميزة Ultralytics
بينما يعد كل من YOLOX و YOLOv7 تنفيذين بحثيين قويين، فإن الانتقال من مستودع بحثي إلى بيئة إنتاج قابلة للتوسع قد يكون أمراً شاقاً. وهنا تتألق منصة Ultralytics.
توفر نماذج Ultralytics واجهة برمجة تطبيقات Python موحدة، تتعامل مع تدريب النموذج، والتحقق منه، ونشره كمهام مبسطة وموحدة. أنت تتجنب عناء إدارة تبعيات الطرف الثالث المعقدة أو عوامل C++ المخصصة الشائعة في البنى القديمة.
علاوة على ذلك، تتطلب نماذج Ultralytics YOLO ذاكرة CUDA أقل بشكل ملحوظ أثناء التدريب مقارنة بالكواشف القائمة على المحولات (Transformer) مثل RT-DETR. وهذا يسمح للممارسين باستخدام أحجام دفعات أكبر، مما يعمل على استقرار التدريب وتسريع التقارب على مجموعات البيانات المخصصة.
تدعم Ultralytics بشكل أصلي تصدير النماذج إلى تنسيقات معيارية صناعية مثل ONNX، و OpenVINO، و CoreML باستخدام علامة منطقية بسيطة، مما يبسط إلى حد كبير عملية نشر النموذج.
مثال على الكود: التدريب باستخدام Ultralytics
يسمح لك نظام Ultralytics البيئي بتحميل وتدريب وتشغيل الاستدلال بسهولة باستخدام YOLOv7 أو بنيات أحدث ببضعة أسطر فقط من الكود.
from ultralytics import YOLO
# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")
# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()المستقبل: Ultralytics YOLO26
بينما تمثل YOLOv7 و YOLOX خطوات تاريخية مهمة، فإن أحدث التقنيات تتحرك بسرعة. صدر Ultralytics YOLO26 في يناير 2026، مقدماً نماذج ثورية تتفوق على النماذج السابقة.
- End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This drastically reduces latency bottlenecks and guarantees deterministic execution times across varied hardware setups.
- استدلال أسرع على CPU بنسبة تصل إلى 43%: من خلال إزالة Distribution Focal Loss (DFL) وتحسين عمق الشبكة، تم تصميم YOLO26 بشكل كبير ليتناسب مع أجهزة الحافة التي تفتقر إلى أجهزة GPU مخصصة.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب LLM المتقدمة، يوفر مُحسِّن MuSGD (هجين بين SGD و Muon) استقراراً استثنائياً في التدريب وتقارباً أسرع.
- تحسين اكتشاف الكائنات الصغيرة: يوفر دمج وظائف خسارة ProgLoss + STAL تحسينات كبيرة في التعرف على الكائنات الصغيرة والبعيدة - وهو أمر بالغ الأهمية لـ رسم خرائط الطائرات بدون طيار والمراقبة الأمنية.
- دعم المهام الأصلي: يدعم YOLO26 بشكل شامل الصناديق المحيطة الموجهة (OBB)، وتجزئة المثيلات، وتقدير الوضعية محلياً ضمن نفس واجهة برمجة التطبيقات المبسطة.
بالنسبة لأي مطور عصري يبدأ مشروع رؤية حاسوبية جديداً اليوم، فإن تقييم Ultralytics YOLO26 على المنصة هو المسار الموصى به لتحقيق أفضل توازن مطلق بين السرعة والدقة وبساطة النشر. بالنسبة لأولئك الذين يقومون بالترقية من أجيال سابقة مثل YOLO11 أو YOLOv8، يتطلب الانتقال تغيير سلسلة النموذج فقط، مما يفتح قدرات فائقة على الفور.