Link to this sectionYOLOv7 مقابل YOLOX#
لقد تميز تطور رؤية الحاسوب بتطورات سريعة في اكتشاف الأجسام في الوقت الفعلي. تعد كل من YOLOv7 و YOLOX علامتين فارقتين في هذه الرحلة. وفي حين أن كلا النموذجين قد دفعا حدود السرعة والدقة، فقد تبنيا فلسفات معمارية مختلفة لتحقيق نتائجهما. يقدم هذا الدليل مقارنة تقنية شاملة بين هذين النموذجين القويين، مما يساعدك على اختيار البنية المناسبة لمشاريع رؤية الحاسوب الخاصة بك.
Link to this sectionمقدمة عن النماذج#
يعد فهم الأصول وخيارات التصميم الأساسية لهذه النماذج أمراً بالغ الأهمية لنشرها بفعالية في عمليات تعلم الآلة الحديثة.
Link to this sectionتفاصيل YOLOv7#
طُوِّرت YOLOv7 بواسطة الباحثين الذين حافظوا على بنى CSPNet و Scaled-YOLOv4، وقدمت نهج "حقيبة الهدايا القابلة للتدريب" (trainable bag-of-freebies) لتعظيم الدقة دون زيادة تكلفة الاستنتاج.
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- المستندات: مستندات Ultralytics YOLOv7
Link to this sectionتفاصيل YOLOX#
اتخذت YOLOX مساراً مختلفاً من خلال إعادة النموذج إلى الاكتشاف الخالي من المراسي (anchor-free)، مما أدى إلى تبسيط بنية الرأس بشكل كبير مع الحفاظ على أداء قوي.
- المؤلفون: Zheng Ge، وSongtao Liu، وFeng Wang، وZeming Li، وJian Sun
- المؤسسة: Megvii
- التاريخ: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- المستندات: المستندات الرسمية لـ YOLOX
Link to this sectionالاختلافات المعمارية والابتكارات#
تكمن الاختلافات الجوهرية بين YOLOv7 و YOLOX في نهجهما لاستخراج الميزات، وتوقع المربعات المحيطة (bounding box)، وتعيين التسميات.
Link to this sectionYOLOX: الرائد في تقنية خلو المراسي (Anchor-Free)#
أحدثت YOLOX ثورة في عائلة YOLO من خلال الانتقال إلى تصميم خالٍ من المراسي (anchor-free). تتطلب كاشفات الأجسام التقليدية القائمة على المراسي (anchor-based) ضبطاً إرشادياً معقداً لتجميع صناديق المراسي، وهو ما قد يعتمد بشكل كبير على مجموعة البيانات. من خلال التخلص من صناديق المراسي، قللت YOLOX بشكل كبير من عدد معلمات التصميم. علاوة على ذلك، تستخدم YOLOX رأساً مفككاً (decoupled head)، حيث تفصل مهام التصنيف والتوطين إلى فروع شبكية متميزة. يحل هذا التعارض الكامن بين تصنيف الجسم وتحديد إحداثياته المكانية. كما تدمج YOLOX استراتيجيات متقدمة لتعيين التسميات مثل SimOTA، التي تخصص عينات إيجابية ديناميكياً أثناء التدريب.
Link to this sectionYOLOv7: تجميع الطبقات الفعال والممتد (Extended Efficient Layer Aggregation)#
عادت YOLOv7 إلى المنهجيات القائمة على المراسي ولكنها قدمت شبكة تجميع الطبقات الفعالة والممتدة (E-ELAN). تعمل E-ELAN على تحسين طول مسار التدرج، مما يضمن تعلم الشبكة بفعالية عبر أعماق مختلفة. تعتمد البنية بشكل كبير على تقنيات إعادة التقييم، حيث يتم دمج الطبقات التلافيفية أثناء الاستنتاج لتعزيز السرعة دون التضحية بالدقة. تتضمن استراتيجية "حقيبة الهدايا" في YOLOv7 ابتكارات مثل التلافيف المخطط لها والمعاد تقييمها وتعيين التسميات الموجه من الخشن إلى الدقيق، والتي تدفع دقة متوسط متوسط الدقة (mAP) للنموذج إلى مستويات ملحوظة.
بينما بسطت YOLOX خطوط أنابيب النشر بإعدادها الخالي من المراسي، قامت بنى Ultralytics الحديثة منذ ذلك الحين بإتقان هذا النهج، مما أدى إلى إزالة الحاجة تماماً إلى صناديق محددة مسبقاً في الأجيال الأحدث.
Link to this sectionمقارنة الأداء#
عند تقييم هذه النماذج للإنتاج، يعد موازنة الدقة مع الكفاءة الحسابية أمراً ضرورياً. يوضح الجدول أدناه المقايضات، مع تسليط الضوء على أفضل المقاييس أداءً بالخط العريض.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
كما هو موضح أعلاه، تحقق YOLOv7x أعلى mAP، مما يجعلها دقيقة بشكل استثنائي لمجموعات البيانات المعقدة. في المقابل، تم تحسين YOLOX-Nano بشكل كبير لقيود الموارد القصوى. ومع ذلك، يظهر كلا النموذجين استخداماً عالياً نسبياً للذاكرة أثناء التدريب مقارنة بالبنى الحديثة.
Link to this sectionمنهجيات التدريب والنظام البيئي#
من العوامل الحاسمة للباحثين والمطورين سهولة التنفيذ. تاريخياً، تطلبت إصدارات YOLO الأقدم نصوصاً برمجية معقدة بلغة C++ أو إدارة معقدة للتبعيات.
Link to this sectionميزة نظام Ultralytics البيئي#
اليوم، الطريقة الأكثر فعالية لاستخدام هذه البنى هي من خلال نظام Ultralytics البيئي الذي يتم صيانته جيداً. توفر Ultralytics واجهة برمجة تطبيقات Python موحدة وبديهية للغاية تعمل على تبسيط التدريب والتحقق والنشر بشكل كبير.
- سهولة الاستخدام: ببضعة أسطر من التعليمات البرمجية، يمكنك بدء حلقة تدريب، مما يخفف من منحنى التعلم الحاد المرتبط بتنفيذات PyTorch الخام.
- كفاءة التدريب: تستخدم نماذج Ultralytics YOLO بشكل جوهري ذاكرة أقل أثناء التدريب مقارنة بنماذج المحولات الثقيلة مثل RT-DETR. وهذا يسمح للمطورين بزيادة أحجام الدفعات (batch sizes) على أجهزة المستهلك.
- تعدد الاستخدامات: بعيداً عن المربعات المحيطة البسيطة، يمتد النظام البيئي بسهولة إلى مهام مثل تجزئة المثيلات و تقدير الوضعية.
فيما يلي مثال قابل للتشغيل بنسبة 100% يوضح كيفية تدريب نموذج باستخدام واجهة برمجة تطبيقات Ultralytics:
from ultralytics import YOLO
# Load a pre-trained model
model = YOLO("yolov8n.pt") # Readily available weights for rapid transfer learning
# Train the model efficiently on your custom data
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=16,
device="0", # Utilizes optimal CUDA memory management
)
# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")من خلال توحيد خط أنابيب التصدير، يمكن للمطورين نقل أوزانهم بسهولة إلى تنسيقات مثل TensorRT أو ONNX، مما يضمن استنتاجاً عالي السرعة على الأجهزة المستهدفة.
Link to this sectionحالات الاستخدام المثالية والتطبيقات الواقعية#
يعتمد الاختيار بين YOLOX و YOLOv7 إلى حد كبير على أهداف النشر:
- YOLOX للذكاء الاصطناعي على الحافة (Edge AI): تعد متغيرات YOLOX-Nano و YOLOX-Tiny مناسبة للغاية للنشر على الأجهزة منخفضة الطاقة. إذا كنت تبني كاميرا أمنية ذكية على Raspberry Pi، فإن التلافيف البسيطة الخالية من المراسي لـ YOLOX تترجم بسهولة إلى مسرعات الحافة.
- YOLOv7 للتحليلات عالية الدقة: إذا كنت تعالج صور أقمار صناعية عالية الدقة أو تنفذ مراقبة جودة التصنيع المعقدة، فإن دقة mAP العالية لـ YOLOv7x، المدعومة بمعالجات رسومات NVIDIA المتطورة، تضمن اكتشاف حتى أصغر الحالات الشاذة.
Link to this sectionالمستقبل: الترقية إلى Ultralytics YOLO26#
بينما كانت YOLOv7 و YOLOX رائدتين عند بدايتهما، تقدم مشهد رؤية الحاسوب بشكل كبير. بالنسبة لعمليات النشر الجديدة، يجب على المطورين التطلع إلى Ultralytics YOLO26، الذي تم إصداره في يناير 2026. يدمج هذا النموذج المتطور أفضل النظريات المعمارية في نظام نهائي جاهز للإنتاج.
إليك سبب التوصية بشدة بالترقية:
- تصميم من طرف إلى طرف خالٍ من NMS: تلغي YOLO26 أصلاً كبت غير الحد الأقصى (NMS) أثناء المعالجة اللاحقة. تم ريادة هذا في البداية في YOLOv10، مما يضمن زمن وصول منخفض باستمرار، ويبسط النشر على الأجهزة التي تفتقر إلى دعم أجهزة NMS.
- إزالة DFL: من خلال إزالة توزيع فقدان التركيز (Distribution Focal Loss)، تحقق YOLO26 توافقاً أفضل بكثير مع أجهزة الحافة منخفضة الطاقة وتصديرات ONNX المباشرة.
- محسن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM)، تستفيد YOLO26 من محسن MuSGD الهجين، مما يضمن تقارباً أسرع وديناميكيات تدريب مستقرة بشكل لا يصدق.
- استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): تم تحسين YOLO26 بشكل كبير للأجهزة الواقعية، وتعمل بشكل ممتاز على وحدات المعالجة المركزية القياسية دون الحاجة إلى بنية تحتية مكلفة لوحدة معالجة الرسومات (GPU).
- ProgLoss + STAL: تعمل دوال الفقد المتقدمة هذه على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهي ميزة حاسمة لـ عمليات فحص الطائرات بدون طيار وشبكات إنترنت الأشياء المتطورة.
بالنسبة للمطورين الذين يسعون للحصول على أفضل توازن في الأداء عبر اكتشاف الأجسام، والتجزئة، وما بعدها، فإن نشر النماذج عبر منصة Ultralytics يوفر تجربة لا مثيل لها وخالية من الاحتكاك.
Link to this sectionالخلاصة#
قدمت كل من YOLOX و YOLOv7 تقنيات محورية شكلت مسار الذكاء الاصطناعي للرؤية مفتوح المصدر. أثبتت YOLOX جدوى الرؤوس المفككة الخالية من المراسي، بينما أثبتت YOLOv7 القوة الهائلة لإعادة تقييم مسار التدرج. اليوم، يضمن الاستفادة من نظام Ultralytics البيئي أنه يمكنك استخراج أقصى إمكانات من هذه البنى التاريخية، أو الانتقال بسلاسة إلى YOLO26 الأحدث لضمان مستقبل تطبيق رؤية الحاسوب القادم الخاص بك.