YOLOv6.0 مقابل YOLOv5: مقارنة تقنية شاملة
شهد تطور الكشف عن الكائنات في الوقت الفعلي العديد من البنى المُحسّنة لسيناريوهات النشر المختلفة. في هذا التحليل المتعمق، نقارن بين نموذجين بارزين: YOLOv6 المُركّز على الصناعة و Ultralytics الأساسي والمتعدد الاستخدامات. Ultralytics YOLOv5المتعدد الاستخدامات. سيساعدك فهم الخيارات المعمارية ومقاييس الأداء ودعم النظام البيئي لكل منهما على اختيار إطار عمل الرؤية الحاسوبية الأمثل لتطبيقاتك في العالم الواقعي.
YOLOv6.0: الإنتاجية الصناعية وتحسين الأجهزة
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وهو مصمم خصيصًا للبيئات الصناعية عالية الإنتاجية. ويركز على تعظيم معدلات الإطارات على مسرعات الأجهزة مثل NVIDIA المخصصة.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: ميتوان
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
- الوثائق:وثائق YOLOv6
نقاط القوة المعمارية
يقدم YOLOv6.YOLOv6 العديد من التحسينات الهيكلية المصممة لزيادة السرعة. يستخدم النموذج هيكل EfficientRep، الذي تم تصميمه خصيصًا ليكون متوافقًا مع الأجهزة أثناء GPU . وهذا يجعل البنية قوية بشكل خاص لمهام المعالجة المجمعة دون اتصال بالإنترنت.
خلال مرحلة التدريب، يدمج النموذج استراتيجية التدريب بمساعدة المرساة (AAT). يحاول هذا النهج الجمع بين استقرار التدريب القائم على المرساة وسرعة الاستدلال بدون مرساة. بالإضافة إلى ذلك، تستخدم بنية العنق الخاصة به وحدة تسلسل ثنائية الاتجاه (BiC) لتحسين دمج الميزات عبر مستويات مختلفة. على الرغم من أنه مُحسّن للغاية لخوادم GPU المتطورة باستخدام TensorRT، إلا أن هذا التخصص قد يؤدي في بعض الأحيان إلى زيادة زمن الاستجابة على CPU أو الأجهزة الطرفية منخفضة الطاقة.
Ultralytics YOLOv5: رائد الذكاء الاصطناعي البصري المتاح للجميع
أصدرت شركة Ultralytics YOLOv5 معيارًا جديدًا لسهولة الاستخدام وكفاءة التدريب وقوة النشر. وقد ساهم هذا البرنامج في تعميم استخدام تقنية الكشف عن الأجسام عالية الأداء من خلال التكامل العميق مع سير عمل التعلم العميق الحديث.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:ultralytics/yolov5
- المنصة:منصة Ultralytics
النظام البيئي والتنوع
السمة المميزة لـ YOLOv5 سهولة استخدامه. تم بناؤه أصلاً على PyTorch ، ويوفر المستودع Python موحدة تعمل على تبسيط دورة حياة التعلم الآلي بشكل كبير. من تكوين مجموعة البيانات إلى النشر النهائي، يضمن النظام البيئي المتكامل أن يقضي المطورون وقتًا أقل في تصحيح أخطاء البيئات ووقتًا أطول في إنشاء التطبيقات.
لا YOLOv5 على اكتشاف الكائنات فحسب. فهو يتميز بتنوع استثنائي، حيث يدعم بشكل أساسي تصنيف الصور وتقسيم الحالات. علاوة على ذلك، يوفر كفاءة تدريب لا مثيل لها، حيث يتميز بالتخزين المؤقت الذكي، ومحملات البيانات الآلية، والدعم المدمجGPU الموزعGPU .
كفاءة الذاكرة في Ultralytics
عند مقارنة بنى النماذج، يعد استهلاك الذاكرة عاملاً حاسماً. تحافظYOLO Ultralytics YOLO على متطلبات VRAM أقل بكثير أثناء التدريب والاستدلال مقارنة بنماذج المحولات الثقيلة، مما يجعلها سهلة الوصول للمطورين الذين يستخدمون أجهزة من فئة المستهلكين أو أجهزة الكمبيوتر المحمولة السحابية مثل Google .
مقارنة الأداء والهندسة المعمارية
يوضح الجدول أدناه مقاييس الأداء لكلتا البنيتين عند تقييمهما على COCO القياسية. لاحظ كيف توازن النماذج بين الدقة المتوسطة وسرعة الاستدلال في بيئات مختلفة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
تحليل
يحقق YOLOv6.YOLOv6 mAP مذهلة وهو مُحسّن بشكل كبير TensorRT على وحدات معالجة الرسومات T4. ومع ذلك، YOLOv5 نظامًا بيئيًا مُحافظًا عليه بشكل لا يصدق يدعم التصدير الفوري إلى تنسيقات متعددة، بما في ذلك ONNXو CoreML و TFLite. يضمن توازن الأداء هذا أن YOLOv5 بشكل موثوق ليس فقط على الخوادم المخصصة، ولكن أيضًا على الأجهزة المحمولة وبيئات الحوسبة المتطورة مثل Raspberry Pi.
مثال برمجي: تدريب سلس باستخدام Ultralytics
تتمثل إحدى أكبر مزايا Ultralytics في تجربة المستخدم المبسطة. لا يتطلب تدريب النموذج وتقييمه وتصديره سوى بضع أسطر من Python.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format for flexible deployment
model.export(format="onnx")
حالات الاستخدام المثالية وسيناريوهات النشر
غالبًا ما يعتمد الاختيار بين هذه المعماريات على قيود البنية التحتية المحددة لديك:
- متى يتم نشر YOLOv6-3.0: مثالي لخطوط التصنيع الآلية وتحليلات الخوادم عالية الإنتاجية حيث تتوفر NVIDIA GPUs مخصصة ويجب أن يكون زمن الاستجابة ضئيلًا. تزدهر بنيته في البيئات التي يمكن فيها الاستفادة الكاملة من تحسينات TensorRT.
- متى يتم نشر YOLOv5: الخيار الأمثل للنماذج الأولية السريعة، والنشر عبر الأنظمة الأساسية، والفرق التي تبحث عن مسار عمل موحد. تجعل قدراته التصديرية المتنوعة مثاليًا لتحليلات التجزئة على الأجهزة الطرفية، ومراقبة الطائرات الزراعية بدون طيار، وتقدير الوضعية في تطبيقات اللياقة البدنية.
مستقبل اكتشاف الأجسام: دخول YOLO26
في حين YOLOv6 YOLOv5 YOLOv6 إنجازات مهمة، فإن مجال الرؤية الحاسوبية يتقدم بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة أو يبحثون عن أحدث ما توصلت إليه التكنولوجيا، نوصي بشدة بالترقية إلى Ultralytics (الذي تم إصداره في يناير 2026).
يعيد YOLO26 تعريف الرؤية الاصطناعية الذكية التي تركز على الحافة من خلال تقديم تصميم مبتكر من طرف إلى طرف NMS. من خلال التخلص من الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression، فإنه يبسط منطق النشر ويقلل بشكل كبير من تباين زمن الاستجابة.
تشمل الابتكارات الرئيسية في YOLO26 ما يلي:
- مُحسِّن MuSGD: هجين من SGD و Muon، يجلب استقرار تدريب نماذج اللغة الكبيرة (LLM) المتقدم إلى الرؤية الحاسوبية لتقارب أسرع وأكثر موثوقية.
- سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: تم تحسينه بشكل كبير للبيئات التي لا تحتوي على مسرعات مخصصة.
- إزالة DFL: تبسط إزالة Distribution Focal Loss عملية التصدير وتعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة.
- ProgLoss + STAL: دوال خسارة متقدمة تعزز بشكل كبير التعرف على الأجسام الصغيرة، وهو أمر حاسم للصور الجوية ومستشعرات إنترنت الأشياء للمدن الذكية.
للمهام العامة، YOLO11 خيارًا ممتازًا ومدعومًا بالكامل ضمن Ultralytics .
الخلاصة
لقد لعب كل من YOLOv6-3.0 وYOLOv5 أدوارًا محورية في تطوير الكشف في الوقت الفعلي. يقدم YOLOv6-3.0 بنية متخصصة للغاية للإنتاجية المعززة بواسطة GPU، بينما يوفر YOLOv5 تجربة مطور لا مثيل لها من خلال وثائقه الشاملة وسهولة استخدامه وقدراته متعددة المهام.
بالنسبة للتطبيقات الحديثة، يضمن الاستفادة من Ultralytics المتكامل Ultralytics سير عمل مستقبليًا. من خلال اعتماد أحدث البنى مثل YOLO26، تضمن أن تستفيد خطوط الإنتاج الخاصة بك من أحدث الإنجازات في السرعة والدقة وبساطة الخوارزميات.