YOLOv6.0 مقابل YOLO26: نظرة متعمقة على الكشف عن الكائنات في الوقت الفعلي
أدى تطور الكشف عن الكائنات في الوقت الفعلي إلى ظهور ابتكارات مذهلة، غالبًا ما تركز على GPU الصناعية GPU والبنى المتنوعة والمحسّنة للحافة. في هذه المقارنة الشاملة، نستكشف الفروق الدقيقة بين اثنين من العمالقة: YOLOv6.YOLOv6 الذي يركز على الصناعة و Ultralytics الذي تم إصداره مؤخرًا وهو نظام شامل أصلي.
سواء كنت تقوم بالنشر على وحدات معالجة الرسومات (GPU) للخوادم المتطورة أو الأجهزة الطرفية منخفضة الطاقة، فإن فهم نقاط القوة في البنية وحالات الاستخدام المثالية لهذه النماذج أمر بالغ الأهمية لتحسين خطوط أنابيب الرؤية الحاسوبية.
YOLOv6.0: الإنتاجية الصناعية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Meituan Vision AI، وقد صُمم ليكون "كاشف كائنات من الجيل التالي للتطبيقات الصناعية". ويركز بشكل كبير على تعظيم الإنتاجية على مسرعات الأجهزة مثل وحدات معالجة الرسومات المخصصة (GPU)، مما يجعله أداة رائعة لتحليلات الفيديو عالية السرعة دون اتصال بالإنترنت.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المؤسسة:Meituan
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
- الوثائق:وثائق YOLOv6
التركيز المعماري
يستخدم YOLOv6 وحدة تسلسل ثنائية الاتجاه (BiC) في عنقه لتحسين دمج الميزات، جنبًا إلى جنب مع استراتيجية التدريب بمساعدة المرساة (AAT). يعتمد هيكله الأساسي على EfficientRep، وهي طوبولوجيا مصممة لتكون متوافقة للغاية مع الأجهزة من أجل GPU . في حين أن هذا يجعله سريعًا للغاية عند الاستفادة من NVIDIA TensorRT، إلا أنه قد يؤدي إلى زيادة زمن الاستجابة على CPU أو الأجهزة الطرفية التي تفتقر إلى قدرات المعالجة المتوازية الضخمة.
تعرف على المزيد حول YOLOv6-3.0
YOLO26: المعيار الجديد للحافة والسحابة
صدر Ultralytics في يناير 2026، وهو يمثل تحولًا جذريًا. فهو يبتعد عن المعالجة اللاحقة المعقدة ويتبنى إطارًا موحدًا متعدد المهام أسرع وأصغر حجمًا وأسهل في النشر.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:ultralytics/ultralytics
- الوثائق:وثائق YOLO26
إنجازات معمارية رئيسية
يقدم YOLO26 العديد من التطورات الرائدة التي تميزه عن الأجيال السابقة:
- تصميم شامل NMS: بناءً على المفاهيم التي تم طرحها لأول مرة في YOLOv10، فإن YOLO26 هو تصميم شامل أصلاً. فهو يلغي تماماً المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) ، مما يؤدي إلى انخفاض كبير في تقلب زمن الاستجابة وتبسيط كبير في منطق النشر.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : تم تحسين YOLO26 بشكل صريح للحوسبة الطرفية، وهو يتفوق على الأجهزة التي لا تحتوي على وحدات معالجة رسومات، مما يجعله مثاليًا للهواتف المحمولة وأجهزة استشعار إنترنت الأشياء والروبوتات.
- إزالة DFL: تمت إزالة Distribution Focal Loss (فقدان بؤرة التوزيع)، مما أدى إلى تبسيط عملية تصدير النموذج وتحسين التوافق مع الأجهزة الطرفية منخفضة الطاقة.
- محسّن MuSGD: مستوحى من ابتكارات تدريب LLM مثل Kimi K2 من Moonshot AI، يوفر محسّن MuSGD الجديد (مزيج من Stochastic Gradient Descent و Muon) استقرارًا واسع النطاق لمهام الرؤية، مما يضمن تقاربًا أسرع.
- ProgLoss + STAL: تؤدي وظائف الخسارة المتقدمة إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو تحسين مهم للتطبيقات التي تتعامل مع الصور الجوية والمشاهد المزدحمة.
قدرات متعددة المهام
على عكس YOLOv6. YOLOv6، الذي يتعامل بشكل صارم مع المربعات المحددة، يتميز YOLO26 بتحسينات خاصة بالمهام على جميع الأصعدة. ويشمل ذلك فقدان التجزئة الدلالية والبروتو متعدد المقاييس لتجزئة المثال، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضع، وفقدان الزاوية المتخصص لحل مشكلات حدود المربع المحدد الموجه (OBB).
مقارنة مفصلة للأداء
عند تقييم النماذج، من الأهمية بمكان تحقيق التوازن بين السرعة والدقة وكفاءة المعلمات. يوضح الجدول أدناه أداء هذه النماذج على COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
كما يتضح من البيانات، يحقق YOLO26 باستمرار توازنًا فائقًا في الأداء. على سبيل المثال، يوفر YOLO26n زيادة بنسبة +3.4 في mAP YOLOv6. YOLOv6 بينما يتطلب حوالي نصف المعلمات و FLOPs.
ميزة Ultralytics
يتطلب اختيار النموذج تقييم النظام البيئي للبرمجيات المحيطة. وفي هذا الصدد، توفر Ultralytics مزايا حاسمة مقارنة بمستودعات الأبحاث الثابتة:
- سهولة الاستخدام: Ultralytics تجربة مطورين "من الصفر إلى القمة". تتيح Python الموحدة للمستخدمين التبديل بين المهام والنماذج ببساطة عن طريق تغيير معلمة سلسلة واحدة.
- نظام بيئي جيد الصيانة: من خلال Ultralytics ، يحصل المطورون على إمكانية الوصول إلى بيئة يتم تحديثها بشكل نشط تدعم الإدارة المستمرة لمجموعات البيانات والتدريب السحابي وتصدير النماذج بسلاسة إلى تنسيقات مثل ONNX و OpenVINO.
- متطلبات الذاكرة: يتميز YOLO26 بمنهجية تدريب عالية الكفاءة مع متطلبات ذاكرة أقل بكثير أثناء التدريب والاستدلال. وهذا يتناقض بشكل إيجابي مع البنى القائمة على المحولات، مثل RT-DETR، التي تتطلب تخصيصات هائلة CUDA .
- تعدد الاستخدامات: من خلال دعم التصنيف والكشف والتجزئة وتقدير الوضع بشكل أساسي، يعمل YOLO26 كمنصة شاملة لتطبيقات الرؤية المعقدة والمتعددة الوسائط.
استكشاف البدائل
إذا كنت تقوم ببناء خط أنابيب تعلم آلي عام وترغب في استكشاف خيارات أخرى قوية داخل النظام البيئي، Ultralytics YOLO11 هي أساس مستقر للغاية ومستخدم على نطاق واسع لنشره في المؤسسات.
مثال على الكود: التدريب أصبح سهلاً
يتطلب النشر والتدريب باستخدام Ultralytics الحد الأدنى من التعليمات البرمجية، مع استبعاد النصوص النمطية المعقدة التي تتطلبها الأطر القائمة مباشرة على PyTorch. يوضح المقتطف أدناه كيفية تحميل نموذج YOLO26 وتدريبه والتحقق من صحته.
from ultralytics import YOLO
# Load the highly efficient, end-to-end YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset with the advanced MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Utilizes GPU for accelerated training
)
# Validate the trained model's performance
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")
# Run NMS-free inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")
حالات الاستخدام المثالية
يتطلب اختيار البنية المناسبة ربط نقاط قوة النموذج بالقيود الواقعية:
- متى يتم نشر YOLOv6. YOLOv6: مثالي للنشر الثابت من جانب الخادم حيث تكون المعالجة المجمعة أمرًا بالغ الأهمية. ستستفيد بيئات مثل خطوط التصنيع عالية السرعة أو مراكز الفيديو المركزية للمدن الذكية المزودة بوحدات معالجة رسومات A100 أو T4 مخصصة من شبكة EfficientRep الأساسية.
- متى يتم استخدام YOLO26: الخيار الأمثل للتطبيقات الحديثة والقابلة للتطوير. بفضل CPU التي تزيد بنسبة 43٪ وبنيتها NMS فإنها تعتبر مثالية لتحليلات الطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء عن بُعد والروبوتات المتنقلة وأي سيناريو حوسبة متطور حيث يجب أن يتعايش زمن الاستجابة المنخفض والدقة العالية ضمن قيود صارمة على الطاقة.
الخلاصة
بينما يحتفظ YOLOv6. YOLOv6 بفائدته في خطوط إنتاج صناعية محددة ذات إنتاجية عالية تعمل TensorRT قديمة، Ultralytics يمثل مستقبل الرؤية الحاسوبية. من خلال توفير تحسينات التدريب المستوحاة من LLM (MuSGD) والقضاء على معوقات المعالجة اللاحقة، يوفر YOLO26 مرونة وسرعة ودقة لا مثيل لها. بالاقتران مع Ultralytics القوي وسهل الاستخدام، فإنه يمكّن المطورين من إنشاء ونشر تطبيقات رؤية متطورة بسهولة غير مسبوقة.