تخطي إلى المحتوى

YOLOv6.0 مقابل YOLO26: نظرة متعمقة على الكشف عن الكائنات في الوقت الفعلي

أدى تطور الكشف عن الكائنات في الوقت الفعلي إلى ظهور ابتكارات مذهلة، غالبًا ما تركز على GPU الصناعية GPU والبنى المتنوعة والمحسّنة للحافة. في هذه المقارنة الشاملة، نستكشف الفروق الدقيقة بين اثنين من العمالقة: YOLOv6.YOLOv6 الذي يركز على الصناعة و Ultralytics الذي تم إصداره مؤخرًا وهو نظام شامل أصلي.

سواء كنت تقوم بالنشر على وحدات معالجة الرسومات (GPU) للخوادم المتطورة أو الأجهزة الطرفية منخفضة الطاقة، فإن فهم نقاط القوة في البنية وحالات الاستخدام المثالية لهذه النماذج أمر بالغ الأهمية لتحسين خطوط أنابيب الرؤية الحاسوبية.

YOLOv6.0: الإنتاجية الصناعية

تم تطوير YOLOv6. YOLOv6 بواسطة قسم Meituan Vision AI، وقد صُمم ليكون "كاشف كائنات من الجيل التالي للتطبيقات الصناعية". ويركز بشكل كبير على تعظيم الإنتاجية على مسرعات الأجهزة مثل وحدات معالجة الرسومات المخصصة (GPU)، مما يجعله أداة رائعة لتحليلات الفيديو عالية السرعة دون اتصال بالإنترنت.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
  • المؤسسة:Meituan
  • التاريخ: 2023-01-13
  • أرخايف:2301.05586
  • GitHub:meituan/YOLOv6
  • الوثائق:وثائق YOLOv6

التركيز المعماري

يستخدم YOLOv6 وحدة تسلسل ثنائية الاتجاه (BiC) في عنقه لتحسين دمج الميزات، جنبًا إلى جنب مع استراتيجية التدريب بمساعدة المرساة (AAT). يعتمد هيكله الأساسي على EfficientRep، وهي طوبولوجيا مصممة لتكون متوافقة للغاية مع الأجهزة من أجل GPU . في حين أن هذا يجعله سريعًا للغاية عند الاستفادة من NVIDIA TensorRT، إلا أنه قد يؤدي إلى زيادة زمن الاستجابة على CPU أو الأجهزة الطرفية التي تفتقر إلى قدرات المعالجة المتوازية الضخمة.

تعرف على المزيد حول YOLOv6-3.0

YOLO26: المعيار الجديد للحافة والسحابة

صدر Ultralytics في يناير 2026، وهو يمثل تحولًا جذريًا. فهو يبتعد عن المعالجة اللاحقة المعقدة ويتبنى إطارًا موحدًا متعدد المهام أسرع وأصغر حجمًا وأسهل في النشر.

إنجازات معمارية رئيسية

يقدم YOLO26 العديد من التطورات الرائدة التي تميزه عن الأجيال السابقة:

  • تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم التي تم ابتكارها لأول مرة في YOLOv10، يتميز YOLO26 بتصميم شامل أصيل. فهو يلغي تمامًا معالجة ما بعد التثبيط غير الأقصى (NMS)، مما يؤدي إلى انخفاض كبير في تباين زمن الانتقال ومنطق نشر أبسط بشكل جذري.
  • استدلال أسرع على CPU بنسبة تصل إلى 43%: مُحسّن بشكل صريح للحوسبة الطرفية، يتفوق YOLO26 على الأجهزة التي لا تحتوي على وحدات GPU، مما يجعله مثاليًا للهواتف المحمولة ومستشعرات إنترنت الأشياء والروبوتات.
  • إزالة DFL: تمت إزالة Distribution Focal Loss، مما يبسط عملية تصدير النموذج ويعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة.
  • مُحسِّن MuSGD: مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يجلب مُحسِّن MuSGD الجديد (وهو هجين من الانحدار العشوائي المتدرج و Muon) استقرارًا واسع النطاق لمهام الرؤية، مما يضمن تقاربًا أسرع.
  • ProgLoss + STAL: دوال خسارة متقدمة تحقق تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو تحسين حاسم للتطبيقات التي تتعامل مع الصور الجوية والمشاهد المزدحمة.

تعرف على المزيد حول YOLO26

قدرات متعددة المهام

على عكس YOLOv6. YOLOv6، الذي يتعامل بشكل صارم مع المربعات المحددة، يتميز YOLO26 بتحسينات خاصة بالمهام على جميع الأصعدة. ويشمل ذلك فقدان التجزئة الدلالية والبروتو متعدد المقاييس لتجزئة المثال، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضع، وفقدان الزاوية المتخصص لحل مشكلات حدود المربع المحدد الموجه (OBB).

مقارنة مفصلة للأداء

عند تقييم النماذج، من الأهمية بمكان تحقيق التوازن بين السرعة والدقة وكفاءة المعلمات. يوضح الجدول أدناه أداء هذه النماذج على COCO .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما يتضح من البيانات، يحقق YOLO26 باستمرار توازن أداء متفوقًا. على سبيل المثال، يوفر YOLO26n زيادة قدرها +3.4 في mAP مقارنة بـ YOLOv6-3.0n بينما يتطلب ما يقرب من نصف المعلمات وعمليات FLOPs.

ميزة Ultralytics

يتضمن اختيار النموذج تقييم النظام البيئي للبرمجيات المحيط به. هنا، توفر مجموعة Ultralytics فوائد حاسمة تتفوق على مستودعات الأبحاث الثابتة:

  • سهولة الاستخدام: توفر Ultralytics تجربة مطور "من الصفر إلى الاحتراف". تتيح واجهة برمجة تطبيقات Python الموحدة الخاصة بها للمستخدمين التبديل بين المهام والنماذج ببساطة عن طريق تغيير معلمة سلسلة نصية واحدة.
  • نظام بيئي جيد الصيانة: من خلال منصة Ultralytics، يحصل المطورون على بيئة محدثة باستمرار تدعم إدارة مستمرة لمجموعات البيانات، والتدريب السحابي، وتصدير النماذج بسلاسة إلى تنسيقات مثل ONNX و OpenVINO.
  • متطلبات الذاكرة: يتميز YOLO26 بمنهجية تدريب عالية الكفاءة مع متطلبات ذاكرة أقل بكثير أثناء التدريب والاستدلال. وهذا يتناقض بشكل إيجابي مع البنى المعمارية القائمة على المحولات (transformers)، مثل RT-DETR، التي تتطلب تخصيصات هائلة لذاكرة CUDA.
  • تعدد الاستخدامات: من خلال الدعم الأصلي لـ التصنيف، والكشف، والتجزئة، وتقدير الوضعيات، يعمل YOLO26 كحل شامل لتطبيقات الرؤية المعقدة ومتعددة الأنماط.

استكشاف البدائل

إذا كنت تقوم ببناء خط أنابيب تعلم آلي عام وترغب في استكشاف خيارات أخرى قوية داخل النظام البيئي، Ultralytics YOLO11 هي أساس مستقر للغاية ومستخدم على نطاق واسع لنشره في المؤسسات.

مثال برمجي: تدريب مبسط

يتطلب النشر والتدريب باستخدام مكتبة Ultralytics الحد الأدنى من التعليمات البرمجية، مما يلغي الحاجة إلى التعليمات البرمجية المعقدة المتكررة التي تتطلبها الأطر المستندة مباشرة إلى PyTorch الخام. يوضح المقتطف أدناه كيفية تحميل وتدريب والتحقق من صحة نموذج YOLO26.

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset with the advanced MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Utilizes GPU for accelerated training
)

# Validate the trained model's performance
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

# Run NMS-free inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

حالات الاستخدام المثالية

يتطلب اختيار البنية الصحيحة مطابقة نقاط قوة النموذج مع القيود الواقعية:

  • متى يتم نشر YOLOv6-3.0: مثالي لعمليات النشر الثابتة من جانب الخادم حيث تكون معالجة الدفعات ذات أهمية قصوى. ستستفيد البيئات مثل خطوط التصنيع عالية السرعة أو مراكز الفيديو المركزية للمدن الذكية المزودة بـ A100 أو T4 GPUs المخصصة من بنية EfficientRep الأساسية الخاصة به.
  • متى يتم نشر YOLO26: الخيار بلا منازع للتطبيقات الحديثة والقابلة للتطوير. إن استدلال CPU الأسرع بنسبة 43% وبنيته الخالية من NMS تجعله مثاليًا لتحليلات الطائرات بدون طيار، وأجهزة استشعار إنترنت الأشياء عن بعد، والروبوتات المتنقلة، وأي سيناريو حوسبة طرفية حيث يجب أن يتعايش زمن الاستجابة المنخفض والدقة العالية ضمن قيود طاقة صارمة.

الخلاصة

بينما يحتفظ YOLOv6. YOLOv6 بفائدته في خطوط إنتاج صناعية محددة ذات إنتاجية عالية تعمل TensorRT قديمة، Ultralytics يمثل مستقبل الرؤية الحاسوبية. من خلال توفير تحسينات التدريب المستوحاة من LLM (MuSGD) والقضاء على معوقات المعالجة اللاحقة، يوفر YOLO26 مرونة وسرعة ودقة لا مثيل لها. بالاقتران مع Ultralytics القوي وسهل الاستخدام، فإنه يمكّن المطورين من إنشاء ونشر تطبيقات رؤية متطورة بسهولة غير مسبوقة.


تعليقات