YOLOv6.0 مقابل YOLOv7: استكشاف بنى الكشف عن الكائنات في الوقت الفعلي
تطور الرؤية الحاسوبية في الوقت الحقيقي تميز بالتقدم السريع في كفاءة الهندسة المعمارية ومنهجيات التدريب. وهناك نموذجان بارزان أثروا بشكل كبير على المشهد هما YOLOv6.YOLOv6 و YOLOv7. وقد أدخل كلا الإطارين تقنيات جديدة لتحقيق التوازن بين سرعة الاستدلال ودقة الكشف، مستهدفين عمليات النشر التي تتراوح من وحدات معالجة الرسومات (GPU) للخوادم المتطورة إلى الأجهزة الطرفية.
تستكشف هذه المقارنة التقنية الشاملة هياكلها ومقاييس أدائها وحالات الاستخدام المثالية، مع تسليط الضوء على كيفية استفادة Ultralytics الحديثة وأحدث نموذج YOLO26 من هذه المفاهيم الأساسية لتقديم تجارب مطورين لا مثيل لها.
YOLOv6.0: تحسين الإنتاجية الصناعية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وقد تم تصميمه خصيصًا للتطبيقات الصناعية عالية الإنتاجية. ويركز بشكل كبير على تعظيم الأداء على مسرعات الأجهزة، مما يجعله خيارًا قويًا للبيئات التي يمكن فيها تنفيذ المعالجة المجمعة على وحدات معالجة الرسومات المخصصة.
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: YOLOv6
الابتكارات المعمارية
يعتمد YOLOv6 على هيكل EfficientRep، وهو بنية سهلة الاستخدام للأجهزة مصممة لتحسين تكاليف الوصول إلى الذاكرة على وحدات معالجة الرسومات. لتعزيز دمج الميزات عبر مستويات مختلفة، يقدم النموذج وحدة تسلسل ثنائي الاتجاه (BiC) في عنقه. وهذا يسمح للشبكة بالتقاط التسلسلات الهرمية المكانية المعقدة بشكل أكثر فعالية من الإصدارات السابقة.
علاوة على ذلك، يطبق YOLOv6 استراتيجية التدريب بمساعدة المراسي (AAT). تجمع هذه الطريقة بين إشارات التدرج الغنية للتدريب القائم على المراسي ومزايا النشر المبسطة للاستدلال بدون مراسي، مما يساعد النموذج على التلاقي بشكل أكثر استقرارًا دون التضحية بسرعة المعالجة اللاحقة.
اعتبارات متعلقة بالأجهزة
بينما يتفوق YOLOv6. YOLOv6 على وحدات معالجة الرسومات (GPU) من فئة الخوادم (مثل NVIDIA )، فإن اعتماده الكبير على إعادة تحديد المعلمات الهيكلية المحددة قد يؤدي في بعض الأحيان إلى زمن انتقال أقل من الأمثل على الأجهزة الطرفية CPU بشكل صارم CPU مقارنة بالبنى الأحدث.
YOLOv7: رائد حقيبة الهدايا المجانية
أطلق باحثون في أكاديمية سينيكا YOLOv7 نهجًا مختلفًا من خلال التركيز بشكل كبير على تحليل مسار التدرج وتحسينات وقت التدريب التي لا تزيد من تكلفة الاستدلال — وهو مفهوم يشير إليه المؤلفون باسم "حقيبة الهدايا القابلة للتدريب".
- المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
الابتكارات المعمارية
جوهر YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تعمل E-ELAN على تحسين مسار التدرج من خلال السماح للطبقات المختلفة بتعلم ميزات أكثر تنوعًا دون تعطيل طوبولوجيا الشبكة الأصلية. وينتج عن ذلك نموذج عالي التعبير قادر على تحقيق دقة متوسطة من الدرجة الأولى (mAP).
يستخدم YOLOv7 إعادة معايرة النموذج بشكل مكثف، حيث يدمج الطبقات التلافيفية مع تطبيع الدُفعات أثناء الاستدلال. وهذا يقلل من عدد المعلمات ويسرع عملية التمرير الأمامي عند النشر باستخدام أطر عمل مثل NVIDIA TensorRT أو ONNX.
مقارنة الأداء
عند تقييم هذه النماذج على مجموعة بيانات MS COCO نلاحظ وجود تناقض واضح بين المتغيرات فائقة الخفة لـ YOLOv6 YOLOv7 شديدة المعلمات والتي تركز على الدقة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
تكشف البيانات أن YOLOv6. YOLOv6 يوفر سرعة استدلال استثنائية، مما يجعله مناسبًا لتحليلات الفيديو عالية التردد. على العكس من ذلك، يحقق YOLOv7x أعلى mAP ويهيمن على المهام التي تكون فيها دقة الكشف أكثر أهمية من معدلات الإطارات الأولية.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv6 و YOLOv7 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOv6
YOLOv6 خيار قوي لـ:
- النشر الصناعي المدرك للأجهزة: سيناريوهات حيث يوفر تصميم النموذج المدرك للأجهزة وإعادة التكوين الفعالة أداءً محسنًا على أجهزة مستهدفة محددة.
- detect سريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس تقنية Meituan والبنية التحتية للنشر.
متى تختار YOLOv7
YOLOv7 في الحالات التالية:
- المقارنة المعيارية الأكاديمية: لإعادة إنتاج أحدث النتائج من حقبة 2022 أو دراسة تأثيرات E-ELAN وتقنيات "حقيبة المجانيات" القابلة للتدريب.
- أبحاث إعادة التوسيط (Reparameterization): التحقيق في الالتفافات المعاد توسيطها المخطط لها واستراتيجيات قياس النماذج المركبة.
- مسارات مخصصة موجودة: المشاريع ذات المسارات المخصصة بشكل كبير والمبنية حول بنية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
Ultralytics : خطوة نحو المستقبل
في حين YOLOv7 YOLOv6. YOLOv6 و YOLOv7 معالم بارزة، فإن دمج مستودعات متباينة في خطوط الإنتاج غالبًا ما يمثل تحديات في نشر النماذج وضبط المعلمات الفائقة. يعمل Ultralytics على حل هذه المشكلات من خلال توفير واجهة مبسطة وموحدة.
لماذا تختار Ultralytics؟
- سهولة الاستخدام: تتيح واجهة برمجة تطبيقات Ultralytics Python للمطورين تحميل وتدريب وتصدير النماذج ببضعة أسطر فقط من التعليمات البرمجية. يتطلب التبديل من نموذج أقدم إلى أحدث بنية تغيير سلسلة نصية واحدة فقط.
- نظام بيئي يتم صيانته جيدًا: توفر Ultralytics تحديثات متكررة، ودعمًا مجتمعيًا نشطًا، ووثائق قوية.
- تعدد الاستخدامات: على عكس النماذج السابقة التي ركزت بشكل أساسي على الصناديق المحيطة، تدعم نماذج Ultralytics بشكل أصلي التعلم متعدد المهام، بما في ذلك تجزئة الكائنات، وتقدير الوضعيات، والصناديق المحيطة الموجهة (OBB).
- متطلبات الذاكرة: تحافظ نماذج Ultralytics YOLO على استهلاك أقل للذاكرة أثناء التدريب مقارنة بالبنى المعمارية القائمة على المحولات (transformers) مثل RT-DETR، مما يسمح للباحثين بالتدريب بفعالية على الأجهزة الاستهلاكية.
الترقية إلى YOLO26
بالنسبة للمطورين الذين يسعون إلى تحقيق أعلى مستويات الأداء، فإن YOLO26 (الذي تم إصداره في يناير 2026) يغير بشكل جذري نموذج الكشف عن الكائنات. فهو يقدم تصميمًا شاملاً NMS، مما يلغي منطق المعالجة اللاحقة المعقد ويقلل بشكل كبير من تباين زمن الاستجابة على الأجهزة الطرفية.
تشمل الابتكارات الرئيسية في YOLO26 ما يلي:
- مُحسِّن MuSGD: هجين متطور يجمع بين SGD و Muon يضمن ديناميكيات تدريب مستقرة بشكل لا يصدق وتقاربًا أسرع.
- إزالة DFL: بإزالة خسارة التركيز التوزيعي، يبسط YOLO26 توافق التصدير ويعزز الأداء على الأجهزة منخفضة الطاقة.
- ProgLoss + STAL: دوال خسارة متقدمة تحقق تحسينات ملحوظة في التعرف على الأجسام الصغيرة.
- سرعة لا تضاهى: يحقق سرعة استدلال على CPU أسرع بنسبة تصل إلى 43% مقارنة بالأجيال السابقة، مما يجعله مثاليًا للأنظمة المدمجة مثل Raspberry Pi أو عمليات نشر Apple CoreML.
ومن بين النماذج الأخرى عالية الأداء ضمن النظام البيئي ما يلي YOLO11 و YOLOv8، وكلاهما يوفر توازنًا ممتازًا في الأداء لتكامل الأجهزة القديمة.
تأمين خط أنابيبك للمستقبل
من خلال بناء تطبيقات رؤية الكمبيوتر الخاصة بك على منصة Ultralytics، فإنك تضمن الوصول الفوري إلى نماذج مستقبلية متطورة دون إعادة كتابة محملات مجموعات البيانات أو نصوص النشر الخاصة بك.
مثال برمجي: تدريب مبسط
يوضح المقتطف التالي مدى سهولة تدريب نموذج YOLO26 المتطور باستخدام Ultralytics . ينطبق سير العمل هذا بالضبط على YOLO11 YOLOv8 مع استبعاد الكود النمطي الذي تتطلبه عادةً المستودعات القديمة.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="cuda:0", # Automatically utilizes PyTorch GPU acceleration
)
# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for cross-platform deployment
model.export(format="onnx")
الخلاصة
YOLOv7 YOLOv6.YOLOv6 و YOLOv7 معالجة جوانب مختلفة من تحدي الكشف في الوقت الفعلي. YOLOv6. YOLOv6 هي قوة دافعة GPU الصناعية المتخصصة، بينما YOLOv7 دقة عالية من خلال تحسين مسار التدرج الصارم.
ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب تنوعًا لا مثيل له، وأقل قدر من الاحتكاك في النشر، وأداءً متطورًا، فإن Ultralytics هو الخيار الأمثل. تضمن بنيته NMS ومحسن MuSGD المتقدم، والتكامل العميق مع Ultralytics للمطورين إمكانية نشر حلول AI قوية وقابلة للتطوير أسرع من أي وقت مضى.