YOLO26 مقابلYOLO: تطور الكشف عن الكائنات في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية بسرعة، حيث تعمل البنى الجديدة باستمرار على تخطي حدود السرعة والدقة. ومن بين المعالم البارزة في هذا المجال، نذكر YOLO طورته مجموعة Alibaba في أواخر عام 2022، و YOLO26، وهو النموذج المتطور الذي أطلقته Ultralytics عام 2026.

بينماYOLO مفاهيم مبتكرة مثل البحث عن البنية العصبية (NAS) إلى YOLO تمثل YOLO26 تحولًا جذريًا نحو المعالجة الأصلية من البداية إلى النهاية والتصميم الذي يركز على الحافة أولاً. تستكشف هذه المقارنة التفصيلية الاختلافات في البنية ومقاييس الأداء وواقع النشر لهذين النموذجين القويين لمساعدة المطورين على اختيار الأداة المناسبة لاحتياجاتهم في مجال اكتشاف الكائنات.

مقارنة مقاييس الأداء

يُقارن الجدول التالي أداء YOLO26 معYOLO. لاحظ التحسينات الكبيرة في سرعة الاستدلال، خاصة بالنسبة للعمليات CPU، والتي تعد سمة مميزة لهيكل YOLO26.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

Ultralytics : المعيار الجديد

صدر YOLO26 في يناير 2026 بواسطة Ultralytics، وهو يعتمد على إرث YOLO11 و YOLOv8، حيث أدخل تغييرات جذرية على مسار الكشف. تركز فلسفة تصميمه الأساسية على إزالة العقبات في النشر والتدريب، مما يجعله النموذج الأكثر كفاءة لكل من وحدات معالجة الرسومات المتطورة والأجهزة الطرفية المقيدة.

الابتكارات الرئيسية

تصميم شامل NMS: على عكس الأجيال السابقة والمنافسين مثلYOLO فإن YOLO26 شامل بطبيعته. فهو يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل من تباين زمن الاستجابة ويبسط خطوط الإنتاج، وهو نهج ثوري تم ابتكاره لأول مرة في YOLOv10.
مُحسّن MuSGD: مستوحى من التطورات الحديثة في تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مزيجًا من SGD Muon. يوفر هذا المُحسّن استقرارًا أكبر أثناء التدريب وتقاربًا أسرع، مما يقلل من تكلفة الحوسبة المطلوبة للوصول إلى الدقة المثلى.
تحسين Edge-First: من خلال إزالة Distribution Focal Loss (DFL)، تم تبسيط بنية النموذج لتسهيل تصديره إلى تنسيقات مثل ONNX CoreML. ويساهم ذلك في زيادة سرعة CPU بنسبة 43٪ مقارنة بالإصدارات السابقة، مما يجعله مثاليًا لأجهزة مثل Raspberry Pi أو الهواتف المحمولة.
تحسين اكتشاف الأجسام الصغيرة: أدى دمج ProgLoss و STAL (Scale-Aware Training Adaptive Loss) إلى تحسين الأداء بشكل ملحوظ في اكتشاف الأجسام الصغيرة، مما عالج نقطة ضعف شائعة في أجهزة الكشف أحادية المرحلة.

نشر مبسط

نظرًا لأن YOLO26 يلغي NMS فإن النماذج المصدرة هي شبكات عصبية خالصة بدون رموز معالجة لاحقة معقدة. وهذا يجعل التكامل في بيئات C++ أو الأجهزة المحمولة أسهل بكثير وأقل عرضة للأخطاء المنطقية.

مثال على التعليمات البرمجية

تظل تجربة المستخدم مع YOLO26 متسقة مع حزمة Ultralytics Python المبسطة.

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

تعرف على المزيد حول YOLO26

YOLO: المنافس المدعوم من NAS

أحدثت YOLO، التي طورتها أكاديمية DAMO التابعة لشركة Alibaba، ضجة كبيرة في عام 2022 من خلال الاستفادة من البحث في الهندسة العصبية (NAS) لتصميم هيكلها الأساسي. بدلاً من صياغة بنية الشبكة يدويًا، استخدم المؤلفون MAE-NAS (طريقة الحواف المساعدة) لاكتشاف الهندسات الفعالة تلقائيًا في ظل قيود زمنية محددة.

الميزات الرئيسية

البنية الأساسية MAE-NAS: تم تحسين بنية الشبكة رياضياً لتعظيم تدفق المعلومات مع تقليل التكلفة الحسابية إلى أدنى حد.
RepGFPN: شبكة هرمية فعالة للميزات تستخدم إعادة المعلمات لتحسين دمج الميزات عبر مستويات مختلفة.
ZeroHead: تصميم رأس كشف خفيف الوزن يهدف إلى تقليل عدد المعلمات في نهاية الشبكة.
AlignedOTA: استراتيجية تخصيص التسميات التي تساعد النموذج على فهم أفضل للمربعات المرجعية التي تتوافق مع الكائنات الحقيقية أثناء التدريب.

على الرغم من أنYOLO أداءً ممتازًا في ذلك الوقت، إلا أن اعتماده على خط أنابيب تدريب تقطير معقد — حيث يوجه نموذج المعلم الأكبر حجمًا نموذج الطالب الأصغر حجمًا — يجعل التدريب المخصص أكثر استهلاكًا للموارد مقارنة بقدرات "التدريب من الصفر" Ultralytics .

مقارنة تفصيلية

الهندسة المعمارية واستقرار التدريب

يكمن الاختلاف الأكثر وضوحًا في نهج التحسين.YOLO على NAS للعثور على أفضل بنية، والتي يمكن أن تنتج FLOPs نظرية عالية الكفاءة، ولكنها غالبًا ما تؤدي إلى بنى يصعب تعديلها أو تصحيحها.

على العكس من ذلك، يستخدم YOLO26 تحسينات معمارية مصنوعة يدويًا ومدفوعة بالحدس (مثل إزالة DFL والرأس NMS) معززة بواسطة MuSGD Optimizer. يوفر هذا المحسن الاستقرار الذي غالبًا ما يشاهد في LLMs للرؤية الحاسوبية. بالنسبة للمطورين، هذا يعني أن YOLO26 أقل حساسية لتعديل المعلمات الفائقة ويتقارب بشكل موثوق مع مجموعات البيانات المخصصة.

سرعة الاستدلال وكفاءة الموارد

بينماYOLO GPU باستخدام TensorRT يتبع YOLO26 نهجًا أوسع نطاقًا. NMS إزالة DFL و NMS YOLO26 التفوق على وحدات المعالجة المركزية (CPU)، محققًا سرعات أسرع بنسبة تصل إلى 43٪ من سابقاتها. وهذا أمر بالغ الأهمية للتطبيقات في تحليلات البيع بالتجزئة أو المدن الذكية حيث قد لا تحتوي الأجهزة الطرفية على وحدات معالجة رسومات مخصصة.

علاوة على ذلك، فإن متطلبات ذاكرة YOLO26 أثناء التدريب أقل بشكل عام. في حين أنYOLO يتطلب تدريب نموذج معلم ثقيل للتقطير لتحقيق أفضل النتائج، فإن YOLO26 يحقق نتائج SOTA مباشرة، مما يوفر GPU وكهرباء كبيرة.

تعدد الاستخدامات والنظام البيئي

تتمثل إحدى المزايا الرئيسية Ultralytics في تنوعه.YOLO في الأساس جهاز كشف للأجسام. في المقابل، تدعم بنية YOLO26 بشكل أساسي مجموعة واسعة من مهام الرؤية الحاسوبية، بما في ذلك:

تجزئة الحالات (مع خسائر دلالية متخصصة)
تقدير الوضع (باستخدام RLE لتحقيق دقة أفضل)
صندوق الإحاطة الموجه (OBB) (حاسم للصور الجوية)
تصنيف الصور

وهذا يسمح لفريق تطوير واحد باستخدام واجهة برمجة تطبيقات واحدة وإطار عمل واحد لمشاكل متعددة ومتميزة، مما يقلل بشكل كبير من الديون التقنية.

جدول المقارنة: الميزات

ميزة	YOLO26	DAMO-YOLO
تاريخ الإصدار	يناير 2026	نوفمبر 2022
البنية	من طرف إلى طرف، NMS	قائم على NAS، بدون مرساة
المعالجة اللاحقة	لا شيء (ناتج النموذج = النهائي)	تثبيط غير الأقصى (NMS)
المحسّن	MuSGD (SGD ميون)	SGD AdamW
خط أنابيب التدريب	مرحلة واحدة، تدريب من الصفر	التقطير المعقد (المعلم-الطالب)
المهام المدعومة	Detect, Segment, تقدير الوضعية, OBB, Classify	اكتشاف
تحسين الأجهزة الطرفية	عالي (بدون DFL، مُحسّن CPU)	معتدل (TensorRT )

الخلاصة

تمثل كلتا البنيتين نقاطًا بارزة في تاريخ اكتشاف الكائنات.YOLO قوة البحث الآلي عن البنية وإعادة تحديد المعلمات. ومع ذلك، تمثل YOLO26 مستقبل النشر العملي للذكاء الاصطناعي.

من خلال القضاء على NMS وإدخال مُحسّنات من فئة LLM مثل MuSGD، وتوفير حل موحد للتجزئة والوضع والكشف، يوفر Ultralytics توازنًا فائقًا بين الأداء وسهولة الاستخدام. بالنسبة للمطورين الذين يبنون تطبيقات في العالم الحقيقي — من الأتمتة الصناعية إلى تطبيقات الهاتف المحمول — فإن النظام البيئي القوي والوثائق الشاملة Ultralytics تجعل YOLO26 التوصية الواضحة.

للمهتمين بمقارنات أخرى، يمكنكم استكشاف YOLO11 YOLO أو البحث عن بدائل قائمة على المحولات مثل RT-DETR.

المؤلف والمراجع

YOLO26

المؤلفون: Glenn Jocher و Jing Qiu
المؤسسة:Ultralytics
التاريخ: 2026-01-14
الوثائق:وثائق YOLO26

DAMO-YOLO

المؤلفون: شيانزه شو، ييكي جيانغ، ويهوا تشين، ييلون هوانغ، يوان تشانغ، شيويو سون
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
الورقة:arXiv:2211.15444