تخطي إلى المحتوى

YOLO26 مقابلYOLO: تطور الكشف عن الكائنات في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية بسرعة، حيث تعمل البنى الجديدة باستمرار على تخطي حدود السرعة والدقة. ومن بين المعالم البارزة في هذا المجال، نذكر YOLO طورته مجموعة Alibaba في أواخر عام 2022، و YOLO26، وهو النموذج المتطور الذي أطلقته Ultralytics عام 2026.

بينماYOLO مفاهيم مبتكرة مثل البحث عن البنية العصبية (NAS) إلى YOLO تمثل YOLO26 تحولًا جذريًا نحو المعالجة الأصلية من البداية إلى النهاية والتصميم الذي يركز على الحافة أولاً. تستكشف هذه المقارنة التفصيلية الاختلافات في البنية ومقاييس الأداء وواقع النشر لهذين النموذجين القويين لمساعدة المطورين على اختيار الأداة المناسبة لاحتياجاتهم في مجال اكتشاف الكائنات.

مقارنة مقاييس الأداء

يُقارن الجدول التالي أداء YOLO26 معYOLO. لاحظ التحسينات الكبيرة في سرعة الاستدلال، خاصة بالنسبة للعمليات CPU، والتي تعد سمة مميزة لهيكل YOLO26.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics : المعيار الجديد

صدر YOLO26 في يناير 2026 بواسطة Ultralytics، وهو يعتمد على إرث YOLO11 و YOLOv8، حيث أدخل تغييرات جذرية على مسار الكشف. تركز فلسفة تصميمه الأساسية على إزالة العقبات في النشر والتدريب، مما يجعله النموذج الأكثر كفاءة لكل من وحدات معالجة الرسومات المتطورة والأجهزة الطرفية المقيدة.

الابتكارات الرئيسية

  1. تصميم شامل NMS: على عكس الأجيال السابقة والمنافسين مثلYOLO فإن YOLO26 شامل بطبيعته. فهو يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل من تباين زمن الاستجابة ويبسط خطوط الإنتاج، وهو نهج ثوري تم ابتكاره لأول مرة في YOLOv10.
  2. مُحسّن MuSGD: مستوحى من التطورات الحديثة في تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مزيجًا من SGD Muon. يوفر هذا المُحسّن استقرارًا أكبر أثناء التدريب وتقاربًا أسرع، مما يقلل من تكلفة الحوسبة المطلوبة للوصول إلى الدقة المثلى.
  3. تحسين Edge-First: من خلال إزالة Distribution Focal Loss (DFL)، تم تبسيط بنية النموذج لتسهيل تصديره إلى تنسيقات مثل ONNX CoreML. ويساهم ذلك في زيادة سرعة CPU بنسبة 43٪ مقارنة بالإصدارات السابقة، مما يجعله مثاليًا لأجهزة مثل Raspberry Pi أو الهواتف المحمولة.
  4. تحسين اكتشاف الأجسام الصغيرة: أدى دمج ProgLoss و STAL (Scale-Aware Training Adaptive Loss) إلى تحسين الأداء بشكل ملحوظ في اكتشاف الأجسام الصغيرة، مما عالج نقطة ضعف شائعة في أجهزة الكشف أحادية المرحلة.

نشر مبسط

نظرًا لأن YOLO26 يلغي NMS فإن النماذج المصدرة هي شبكات عصبية خالصة بدون رموز معالجة لاحقة معقدة. وهذا يجعل التكامل في بيئات C++ أو الأجهزة المحمولة أسهل بكثير وأقل عرضة للأخطاء المنطقية.

مثال على التعليمات البرمجية

تظل تجربة المستخدم مع YOLO26 متسقة مع حزمة Ultralytics Python المبسطة.

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

تعرف على المزيد حول YOLO26

YOLO: المنافس المدعوم من NAS

أحدثت YOLO، التي طورتها أكاديمية DAMO التابعة لشركة Alibaba، ضجة كبيرة في عام 2022 من خلال الاستفادة من البحث في الهندسة العصبية (NAS) لتصميم هيكلها الأساسي. بدلاً من صياغة بنية الشبكة يدويًا، استخدم المؤلفون MAE-NAS (طريقة الحواف المساعدة) لاكتشاف الهندسات الفعالة تلقائيًا في ظل قيود زمنية محددة.

الميزات الرئيسية

  • البنية الأساسية MAE-NAS: تم تحسين بنية الشبكة رياضياً لتعظيم تدفق المعلومات مع تقليل التكلفة الحسابية إلى أدنى حد.
  • RepGFPN: شبكة هرمية فعالة للميزات تستخدم إعادة المعلمات لتحسين دمج الميزات عبر مستويات مختلفة.
  • ZeroHead: تصميم رأس كشف خفيف الوزن يهدف إلى تقليل عدد المعلمات في نهاية الشبكة.
  • AlignedOTA: استراتيجية تخصيص التسميات التي تساعد النموذج على فهم أفضل للمربعات المرجعية التي تتوافق مع الكائنات الحقيقية أثناء التدريب.

على الرغم من أنYOLO أداءً ممتازًا في ذلك الوقت، إلا أن اعتماده على خط أنابيب تدريب تقطير معقد — حيث يوجه نموذج المعلم الأكبر حجمًا نموذج الطالب الأصغر حجمًا — يجعل التدريب المخصص أكثر استهلاكًا للموارد مقارنة بقدرات "التدريب من الصفر" Ultralytics .

مقارنة تفصيلية

الهندسة المعمارية واستقرار التدريب

يكمن الاختلاف الأكثر وضوحًا في نهج التحسين.YOLO على NAS للعثور على أفضل بنية، والتي يمكن أن تنتج FLOPs نظرية عالية الكفاءة، ولكنها غالبًا ما تؤدي إلى بنى يصعب تعديلها أو تصحيحها.

على العكس من ذلك، يستخدم YOLO26 تحسينات معمارية مصنوعة يدويًا ومدفوعة بالحدس (مثل إزالة DFL والرأس NMS) معززة بواسطة MuSGD Optimizer. يوفر هذا المحسن الاستقرار الذي غالبًا ما يشاهد في LLMs للرؤية الحاسوبية. بالنسبة للمطورين، هذا يعني أن YOLO26 أقل حساسية لتعديل المعلمات الفائقة ويتقارب بشكل موثوق مع مجموعات البيانات المخصصة.

سرعة الاستدلال وكفاءة الموارد

بينماYOLO GPU باستخدام TensorRT يتبع YOLO26 نهجًا أوسع نطاقًا. NMS إزالة DFL و NMS YOLO26 التفوق على وحدات المعالجة المركزية (CPU)، محققًا سرعات أسرع بنسبة تصل إلى 43٪ من سابقاتها. وهذا أمر بالغ الأهمية للتطبيقات في تحليلات البيع بالتجزئة أو المدن الذكية حيث قد لا تحتوي الأجهزة الطرفية على وحدات معالجة رسومات مخصصة.

علاوة على ذلك، فإن متطلبات ذاكرة YOLO26 أثناء التدريب أقل بشكل عام. في حين أنYOLO يتطلب تدريب نموذج معلم ثقيل للتقطير لتحقيق أفضل النتائج، فإن YOLO26 يحقق نتائج SOTA مباشرة، مما يوفر GPU وكهرباء كبيرة.

تعدد الاستخدامات والنظام البيئي

تتمثل إحدى المزايا الرئيسية Ultralytics في تنوعه.YOLO في الأساس جهاز كشف للأجسام. في المقابل، تدعم بنية YOLO26 بشكل أساسي مجموعة واسعة من مهام الرؤية الحاسوبية، بما في ذلك:

وهذا يسمح لفريق تطوير واحد باستخدام واجهة برمجة تطبيقات واحدة وإطار عمل واحد لمشاكل متعددة ومتميزة، مما يقلل بشكل كبير من الديون التقنية.

جدول المقارنة: الميزات

ميزةYOLO26DAMO-YOLO
تاريخ الإصداريناير 2026نوفمبر 2022
البنيةمن طرف إلى طرف، NMSقائم على NAS، بدون مرساة
المعالجة اللاحقةلا شيء (ناتج النموذج = النهائي)تثبيط غير الأقصى (NMS)
المحسّنMuSGD (SGD ميون)SGD AdamW
خط أنابيب التدريبمرحلة واحدة، تدريب من الصفرالتقطير المعقد (المعلم-الطالب)
المهام المدعومةDetect, Segment, تقدير الوضعية, OBB, Classifyاكتشاف
تحسين الأجهزة الطرفيةعالي (بدون DFL، مُحسّن CPU)معتدل (TensorRT )

الخلاصة

تمثل كلتا البنيتين نقاطًا بارزة في تاريخ اكتشاف الكائنات.YOLO قوة البحث الآلي عن البنية وإعادة تحديد المعلمات. ومع ذلك، تمثل YOLO26 مستقبل النشر العملي للذكاء الاصطناعي.

من خلال القضاء على NMS وإدخال مُحسّنات من فئة LLM مثل MuSGD، وتوفير حل موحد للتجزئة والوضع والكشف، يوفر Ultralytics توازنًا فائقًا بين الأداء وسهولة الاستخدام. بالنسبة للمطورين الذين يبنون تطبيقات في العالم الحقيقي — من الأتمتة الصناعية إلى تطبيقات الهاتف المحمول — فإن النظام البيئي القوي والوثائق الشاملة Ultralytics تجعل YOLO26 التوصية الواضحة.

للمهتمين بمقارنات أخرى، يمكنكم استكشاف YOLO11 YOLO أو البحث عن بدائل قائمة على المحولات مثل RT-DETR.

المؤلف والمراجع

YOLO26

DAMO-YOLO

  • المؤلفون: شيانزه شو، ييكي جيانغ، ويهوا تشين، ييلون هوانغ، يوان تشانغ، شيويو سون
  • المنظمة: مجموعة علي بابا
  • التاريخ: 2022-11-23
  • الورقة:arXiv:2211.15444

تعليقات