YOLOv6-3.0 مقابل YOLO26: نظرة متعمقة على اكتشاف الكائنات في الوقت الفعلي

أدى تطور اكتشاف الكائنات في الوقت الفعلي إلى ابتكارات مذهلة، وغالبًا ما يركز الاهتمام على المفاضلة بين الإنتاجية الصناعية لوحدات معالجة الرسومات (GPU) والمعماريات المتنوعة والمُحسَّنة للحافة. في هذه المقارنة الشاملة، نستكشف الفروق الدقيقة بين عملاقين: نموذج YOLOv6-3.0 الموجه صناعياً ونموذج Ultralytics YOLO26 الجديد كلياً والقائم على مبدأ النهاية إلى النهاية (end-to-end) بشكل أصلي.

سواء كنت تقوم بالنشر على وحدات معالجة رسومات خادم عالية الأداء أو أجهزة حافة منخفضة الطاقة، فإن فهم نقاط القوة المعمارية وحالات الاستخدام المثالية لهذه النماذج أمر بالغ الأهمية لتحسين خطوط أنابيب رؤية الكمبيوتر لديك.

YOLOv6-3.0: الإنتاجية الصناعية

تم تطوير YOLOv6-3.0 بواسطة قسم رؤية الذكاء الاصطناعي في Meituan، وصُمم كـ "كاشف كائنات من الجيل التالي للتطبيقات الصناعية". يركز النموذج بشكل كبير على زيادة الإنتاجية إلى أقصى حد على مسرعات الأجهزة مثل وحدات معالجة الرسومات المخصصة، مما يجعله أداة قوية لتحليلات الفيديو عالية السرعة دون اتصال بالإنترنت.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6
  • الوثائق: وثائق YOLOv6

التركيز المعماري

يستخدم YOLOv6-3.0 وحدة ربط ثنائية الاتجاه (Bi-directional Concatenation - BiC) في عنقه (neck) لتحسين دمج الميزات، مقترنة باستراتيجية التدريب المدعوم بالمرساة (Anchor-Aided Training - AAT). يعتمد هيكله الأساسي (backbone) على EfficientRep، وهي طوبولوجيا مصممة لتكون ملائمة للغاية للأجهزة من أجل استنتاج وحدات معالجة الرسومات. في حين أن هذا يجعله سريعاً بشكل استثنائي عند الاستفادة من NVIDIA TensorRT، إلا أنه قد يؤدي إلى زمن انتقال أعلى على أجهزة وحدة المعالجة المركزية (CPU) فقط أو أجهزة الحافة التي تفتقر إلى قدرات المعالجة المتوازية الضخمة.

اعرف المزيد عن YOLOv6-3.0

YOLO26: المعيار الجديد للحافة والسحابة

يمثل Ultralytics YOLO26، الذي تم إصداره في يناير 2026، تحولاً جذرياً في النموذج. فهو يبتعد عن المعالجة اللاحقة المعقدة ويتبنى إطار عمل موحداً ومتعدد المهام، وهو أسرع وأصغر وأسهل في النشر.

إنجازات معمارية رئيسية

يقدم YOLO26 العديد من التطورات الرائدة التي تميزه عن الأجيال السابقة:

  • تصميم أصلي من النهاية إلى النهاية بدون NMS: بناءً على المفاهيم التي تم ريادتها لأول مرة في YOLOv10، يعمل YOLO26 بشكل أصلي من النهاية إلى النهاية. فهو يلغي تماماً المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يؤدي إلى انخفاض كبير في تباين زمن الانتقال ومنطق نشر أبسط بشكل كبير.
  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): تم تحسينه بشكل صريح لحوسبة الحافة، ويتفوق YOLO26 على الأجهزة التي لا تحتوي على وحدات معالجة رسومات، مما يجعله مثالياً للهواتف المحمولة وأجهزة استشعار إنترنت الأشياء والروبوتات.
  • إزالة DFL: تمت إزالة Distribution Focal Loss، مما يبسط عملية تصدير النموذج ويعزز التوافق مع أجهزة الحافة منخفضة الطاقة.
  • مُحسِّن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) مثل Kimi K2 من شركة Moonshot AI، يوفر مُحسِّن MuSGD الجديد (وهو مزيج من Stochastic Gradient Descent و Muon) استقراراً واسع النطاق لمهام الرؤية، مما يضمن تقارباً أسرع.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو تحسين بالغ الأهمية للتطبيقات التي تتعامل مع الصور الجوية والمشاهد المزدحمة.

اعرف المزيد عن YOLO26

قدرات المهام المتعددة

على عكس YOLOv6-3.0، الذي يتعامل فقط مع صناديق التحديد (bounding boxes)، يتميز YOLO26 بتحسينات خاصة بالمهام عبر المجالات كافة. يتضمن ذلك خسارة التجزئة الدلالية (semantic segmentation loss) و proto متعدد المقاييس لـ تجزئة المثيلات (instance segmentation)، وتقدير احتمالية اللوغاريتم المتبقي (RLE) لـ تقدير الوضع (pose estimation)، وخسارة زاوية متخصصة لحل مشكلات حدود صندوق التحديد الموجه (OBB).

مقارنة مفصلة للأداء

عند تقييم النماذج، يعد التوازن بين السرعة والدقة وكفاءة المعلمات أمراً بالغ الأهمية. يوضح الجدول أدناه كيفية أداء هذه النماذج على مجموعة بيانات COCO.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما يظهر في البيانات، يحقق YOLO26 باستمرار توازناً متفوقاً في الأداء. على سبيل المثال، يوفر YOLO26n زيادة قدرها +3.4 في mAP مقارنة بـ YOLOv6-3.0n مع تطلبه لحوالي نصف المعلمات و FLOPs.

ميزة Ultralytics

يتضمن اختيار النموذج تقييم النظام البيئي للبرمجيات المحيط به. وهنا، توفر مجموعة Ultralytics مزايا حاسمة مقارنة بمستودعات الأبحاث الثابتة:

  • سهولة الاستخدام: توفر Ultralytics تجربة مطور "من الصفر إلى الاحتراف". تسمح واجهة برمجة تطبيقات Python الموحدة الخاصة بها للمستخدمين بالتبديل بين المهام والنماذج ببساطة عن طريق تغيير معلمة نصية واحدة.
  • نظام بيئي مُصان جيداً: من خلال منصة Ultralytics، يحصل المطورون على إمكانية الوصول إلى بيئة يتم تحديثها بنشاط تدعم إدارة مجموعات البيانات المستمرة، والتدريب السحابي، وتصدير النماذج السلس إلى تنسيقات مثل ONNX و OpenVINO.
  • متطلبات الذاكرة: يتميز YOLO26 بمنهجية تدريب فعالة للغاية مع متطلبات ذاكرة أقل بكثير أثناء التدريب والاستنتاج. وهذا يتناقض بشكل إيجابي مع المعماريات القائمة على المحولات (transformer)، مثل RT-DETR، التي تتطلب تخصيصات ضخمة لذاكرة CUDA.
  • تعدد الاستخدامات: من خلال دعم التصنيف والاكتشاف والتجزئة وتقدير الوضع بشكل أصلي، يعمل YOLO26 كوجهة شاملة لتطبيقات الرؤية المعقدة ومتعددة الوسائط.
استكشاف البدائل

إذا كنت تبني خط أنابيب تعلم آلي عاماً وترغب في استكشاف خيارات قوية أخرى داخل النظام البيئي، يظل Ultralytics YOLO11 أساساً مستقراً للغاية ومعتمداً على نطاق واسع للنشر في المؤسسات.

مثال على الكود: جعل التدريب بسيطاً

يتطلب النشر والتدريب باستخدام مكتبة Ultralytics حداً أدنى من الكود، مما يختصر التعليمات البرمجية المعقدة المطلوبة بواسطة الأطر التي تعتمد مباشرة على PyTorch الخام. يوضح المقتطف أدناه كيفية تحميل وتدريب والتحقق من صحة نموذج YOLO26.

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset with the advanced MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Utilizes GPU for accelerated training
)

# Validate the trained model's performance
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

# Run NMS-free inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

حالات الاستخدام المثالية

يتطلب اختيار البنية الصحيحة مطابقة نقاط قوة النموذج مع قيود العالم الحقيقي:

  • متى يتم نشر YOLOv6-3.0: مثالي للنشر الثابت من جانب الخادم حيث تكون المعالجة بالدفعات (batch processing) ذات أهمية قصوى. ستستفيد بيئات مثل خطوط التصنيع عالية السرعة أو مراكز فيديو المدن الذكية المركزية المزودة بوحدات معالجة رسومات A100 أو T4 مخصصة من هيكل EfficientRep الخاص به.
  • متى يتم نشر YOLO26: الخيار الأكيد للتطبيقات الحديثة القابلة للتوسع. إن استنتاج وحدة المعالجة المركزية (CPU) الأسرع بنسبة 43% وهيكل العمل الخالي من NMS يجعله مثالياً لتحليلات الطائرات بدون طيار، وأجهزة استشعار إنترنت الأشياء عن بُعد، والروبوتات المتنقلة، وأي سيناريو لحوسبة الحافة حيث يجب أن تتعايش زمن الانتقال المنخفض والدقة العالية ضمن قيود طاقة صارمة.

خاتمة

بينما يحتفظ YOLOv6-3.0 بفائدته في خطوط أنابيب صناعية محددة ذات إنتاجية عالية تعمل بتكوينات TensorRT القديمة، يمثل Ultralytics YOLO26 مستقبل رؤية الكمبيوتر. من خلال جلب تحسينات التدريب المستوحاة من النماذج اللغوية الكبيرة (MuSGD) وإزالة اختناقات المعالجة اللاحقة، يوفر YOLO26 مرونة وسرعة ودقة لا مثيل لها. وبالاقتران مع نظام Ultralytics البيئي القوي وسهل الاستخدام، فإنه يمكّن المطورين من بناء ونشر تطبيقات رؤية متطورة بسهولة غير مسبوقة.

تعليقات