YOLOv6.0 مقابل YOLOv7: استكشاف بنى الكشف عن الكائنات في الوقت الفعلي
تطور الرؤية الحاسوبية في الوقت الحقيقي تميز بالتقدم السريع في كفاءة الهندسة المعمارية ومنهجيات التدريب. وهناك نموذجان بارزان أثروا بشكل كبير على المشهد هما YOLOv6.YOLOv6 و YOLOv7. وقد أدخل كلا الإطارين تقنيات جديدة لتحقيق التوازن بين سرعة الاستدلال ودقة الكشف، مستهدفين عمليات النشر التي تتراوح من وحدات معالجة الرسومات (GPU) للخوادم المتطورة إلى الأجهزة الطرفية.
تستكشف هذه المقارنة التقنية الشاملة هياكلها ومقاييس أدائها وحالات الاستخدام المثالية، مع تسليط الضوء على كيفية استفادة Ultralytics الحديثة وأحدث نموذج YOLO26 من هذه المفاهيم الأساسية لتقديم تجارب مطورين لا مثيل لها.
YOLOv6.0: تحسين الإنتاجية الصناعية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وقد تم تصميمه خصيصًا للتطبيقات الصناعية عالية الإنتاجية. ويركز بشكل كبير على تعظيم الأداء على مسرعات الأجهزة، مما يجعله خيارًا قويًا للبيئات التي يمكن فيها تنفيذ المعالجة المجمعة على وحدات معالجة الرسومات المخصصة.
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، مينغ تشينغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: YOLOv6
الابتكارات المعمارية
يعتمد YOLOv6 على هيكل EfficientRep، وهو بنية سهلة الاستخدام للأجهزة مصممة لتحسين تكاليف الوصول إلى الذاكرة على وحدات معالجة الرسومات. لتعزيز دمج الميزات عبر مستويات مختلفة، يقدم النموذج وحدة تسلسل ثنائي الاتجاه (BiC) في عنقه. وهذا يسمح للشبكة بالتقاط التسلسلات الهرمية المكانية المعقدة بشكل أكثر فعالية من الإصدارات السابقة.
علاوة على ذلك، يطبق YOLOv6 استراتيجية التدريب بمساعدة المراسي (AAT). تجمع هذه الطريقة بين إشارات التدرج الغنية للتدريب القائم على المراسي ومزايا النشر المبسطة للاستدلال بدون مراسي، مما يساعد النموذج على التلاقي بشكل أكثر استقرارًا دون التضحية بسرعة المعالجة اللاحقة.
اعتبارات متعلقة بالأجهزة
بينما يتفوق YOLOv6. YOLOv6 على وحدات معالجة الرسومات (GPU) من فئة الخوادم (مثل NVIDIA )، فإن اعتماده الكبير على إعادة تحديد المعلمات الهيكلية المحددة قد يؤدي في بعض الأحيان إلى زمن انتقال أقل من الأمثل على الأجهزة الطرفية CPU بشكل صارم CPU مقارنة بالبنى الأحدث.
YOLOv7: رائد حقيبة الهدايا المجانية
أطلق باحثون في أكاديمية سينيكا YOLOv7 نهجًا مختلفًا من خلال التركيز بشكل كبير على تحليل مسار التدرج وتحسينات وقت التدريب التي لا تزيد من تكلفة الاستدلال — وهو مفهوم يشير إليه المؤلفون باسم "حقيبة الهدايا القابلة للتدريب".
- المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
الابتكارات المعمارية
جوهر YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تعمل E-ELAN على تحسين مسار التدرج من خلال السماح للطبقات المختلفة بتعلم ميزات أكثر تنوعًا دون تعطيل طوبولوجيا الشبكة الأصلية. وينتج عن ذلك نموذج عالي التعبير قادر على تحقيق دقة متوسطة من الدرجة الأولى (mAP).
يستخدم YOLOv7 إعادة معايرة النموذج بشكل مكثف، حيث يدمج الطبقات التلافيفية مع تطبيع الدُفعات أثناء الاستدلال. وهذا يقلل من عدد المعلمات ويسرع عملية التمرير الأمامي عند النشر باستخدام أطر عمل مثل NVIDIA TensorRT أو ONNX.
مقارنة الأداء
عند تقييم هذه النماذج على مجموعة بيانات MS COCO نلاحظ وجود تناقض واضح بين المتغيرات فائقة الخفة لـ YOLOv6 YOLOv7 شديدة المعلمات والتي تركز على الدقة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
تكشف البيانات أن YOLOv6. YOLOv6 يوفر سرعة استدلال استثنائية، مما يجعله مناسبًا لتحليلات الفيديو عالية التردد. على العكس من ذلك، يحقق YOLOv7x أعلى mAP ويهيمن على المهام التي تكون فيها دقة الكشف أكثر أهمية من معدلات الإطارات الأولية.
حالات الاستخدام والتوصيات
YOLOv7 الاختيار بين YOLOv6 YOLOv7 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLOv6
YOLOv6 خيار قوي لـ:
- النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
- الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
- تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.
متى تختار YOLOv7
YOLOv7 في الحالات التالية:
- المقارنة الأكاديمية: إعادة إنتاج أحدث النتائج لعام 2022 أو دراسة آثار E-ELAN وتقنيات bag-of-freebies القابلة للتدريب.
- أبحاث إعادة تحديد المعلمات: دراسة التلافيف المخطط لها المعاد تحديد معلماتها واستراتيجيات قياس النماذج المركبة.
- خطوط الأنابيب المخصصة الحالية: مشاريع ذات خطوط أنابيب مخصصة بشكل كبير ومبنية حول بنية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
Ultralytics : خطوة نحو المستقبل
في حين YOLOv7 YOLOv6. YOLOv6 و YOLOv7 معالم بارزة، فإن دمج مستودعات متباينة في خطوط الإنتاج غالبًا ما يمثل تحديات في نشر النماذج وضبط المعلمات الفائقة. يعمل Ultralytics على حل هذه المشكلات من خلال توفير واجهة مبسطة وموحدة.
لماذا تختار Ultralytics؟
- سهولة الاستخدام: تتيحPython Ultralytics Python للمطورين تحميل النماذج وتدريبها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية. ولا يتطلب التبديل من نموذج قديم إلى أحدث بنية سوى تغيير سلسلة واحدة فقط.
- نظام بيئي جيد الصيانة: Ultralytics تحديثات متكررة ودعمًا نشطًا للمجتمع ووثائق قوية.
- تعدد الاستخدامات: على عكس النماذج السابقة التي ركزت بشكل أساسي على المربعات المحددة، تدعم Ultralytics بشكل أساسي التعلم متعدد المهام، بما في ذلك تقسيم الحالات وتقدير الوضع والمربعات المحددة الموجهة (OBB).
- متطلبات الذاكرة: تحافظYOLO Ultralytics YOLO على استخدام أقل للذاكرة أثناء التدريب مقارنة بالبنى القائمة على المحولات مثل RT-DETR، مما يتيح للباحثين التدريب بفعالية على أجهزة من فئة المستهلكين.
الترقية إلى YOLO26
بالنسبة للمطورين الذين يسعون إلى تحقيق أعلى مستويات الأداء، فإن YOLO26 (الذي تم إصداره في يناير 2026) يغير بشكل جذري نموذج الكشف عن الكائنات. فهو يقدم تصميمًا شاملاً NMS، مما يلغي منطق المعالجة اللاحقة المعقد ويقلل بشكل كبير من تباين زمن الاستجابة على الأجهزة الطرفية.
تشمل الابتكارات الرئيسية في YOLO26 ما يلي:
- MuSGD Optimizer: مزيج متطور من SGD Muon يضمن ديناميكيات تدريب مستقرة بشكل لا يصدق وتقارب أسرع.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يبسط YOLO26 توافق التصدير ويعزز الأداء على الأجهزة منخفضة الطاقة.
- ProgLoss + STAL: وظائف خسارة متقدمة تحقق تحسينات ملحوظة في التعرف على الأجسام الصغيرة.
- سرعة لا مثيل لها: يحقق CPU أسرع CPU تصل إلى 43٪ مقارنة بالأجيال السابقة، مما يجعله مثاليًا للأنظمة المدمجة مثل Raspberry Pi أو Apple CoreML.
ومن بين النماذج الأخرى عالية الأداء ضمن النظام البيئي ما يلي YOLO11 و YOLOv8، وكلاهما يوفر توازنًا ممتازًا في الأداء لتكامل الأجهزة القديمة.
تأمين خط أنابيبك للمستقبل
من خلال بناء تطبيقات الرؤية الحاسوبية الخاصة بك على Ultralytics تضمن الوصول الفوري إلى أحدث النماذج المستقبلية دون الحاجة إلى إعادة كتابة برامج تحميل مجموعات البيانات أو نصوص النشر.
مثال على الكود: تدريب مبسط
يوضح المقتطف التالي مدى سهولة تدريب نموذج YOLO26 المتطور باستخدام Ultralytics . ينطبق سير العمل هذا بالضبط على YOLO11 YOLOv8 مع استبعاد الكود النمطي الذي تتطلبه عادةً المستودعات القديمة.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="cuda:0", # Automatically utilizes PyTorch GPU acceleration
)
# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for cross-platform deployment
model.export(format="onnx")
الخلاصة
YOLOv7 YOLOv6.YOLOv6 و YOLOv7 معالجة جوانب مختلفة من تحدي الكشف في الوقت الفعلي. YOLOv6. YOLOv6 هي قوة دافعة GPU الصناعية المتخصصة، بينما YOLOv7 دقة عالية من خلال تحسين مسار التدرج الصارم.
ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب تنوعًا لا مثيل له، وأقل قدر من الاحتكاك في النشر، وأداءً متطورًا، فإن Ultralytics هو الخيار الأمثل. تضمن بنيته NMS ومحسن MuSGD المتقدم، والتكامل العميق مع Ultralytics للمطورين إمكانية نشر حلول AI قوية وقابلة للتطوير أسرع من أي وقت مضى.