تخطي إلى المحتوى

YOLO26 مقابل YOLOX: عصر جديد من الكشف عن الكائنات بدون مرساة

تطور الرؤية الحاسوبية تميز بخطوات كبيرة في الهندسة المعمارية. في عام 2021، قدمت YOLOX نموذجًا مؤثرًا للغاية بدون مرساة سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي. وبالانتقال سريعًا إلى عام 2026، تم إعادة تعريف المشهد بواسطة Ultralytics YOLO، وتحديدًا مع إصدار YOLO26. تستكشف هذه المقارنة الشاملة كيفية استفادة YOLO26 من الابتكارات التاريخية لتقديم أداء لا مثيل له وتعدد الاستخدامات وسهولة الاستخدام.

نظرات عامة على النموذج

إن فهم أصول هذه النماذج وفلسفاتها الأساسية أمر ضروري لاتخاذ قرارات مستنيرة بشأن نشرها.

تفاصيل YOLO26

تعرف على المزيد حول YOLO26

يمثل YOLO26 قمة الهندسة الحديثة في مجال الذكاء الاصطناعي، حيث يقدم تصميمًا شاملاً يزيل معوقات المعالجة اللاحقة المعقدة. وقد تم تحسينه بشكل كبير ليتناسب مع كل من عمليات النشر السحابية والحافة، ويتميز بنظام بيئي يدعم المهام المتنوعة بسلاسة.

تفاصيل YOLOX

تعرف على المزيد حول YOLOX

كان YOLOX خطوة كبيرة إلى الأمام، حيث قدم رأسًا منفصلًا وبنية خالية من المراسي إلى جانب استراتيجية تخصيص علامة SimOTA. وقد وفر توازنًا ممتازًا بين السرعة والدقة في وقت إصداره، مما جعله خيارًا شائعًا للعديد من الأنظمة القديمة.

الابتكارات المعمارية

تسلط الاختلافات بين YOLO26 و YOLOX الضوء على خمس سنوات من الابتكار الدؤوب في تصميم التعلم العميق.

بينما دافعت YOLOX عن النهج الخالي من المراسي، إلا أنها لا تزال تعتمد بشكل كبير على تقنية Non-Maximum Suppression (NMS) التقليدية لتصفية المربعات المحددة الزائدة. تقدم YOLO26 تصميمًا NMS من البداية إلى النهاية. هذا الاختراق، الذي تم ابتكاره لأول مرة في YOLOv10، يلغي تمامًا NMS مما ينتج عنه خطوط إنتاج أسرع وأبسط مع تباين أقل بكثير في زمن الاستجابة.

علاوة على ذلك، يتميز YOLO26 بإزالة DFL. من خلال إزالة Distribution Focal Loss، يتم تبسيط عملية تصدير النموذج بشكل كبير، مما يضمن توافقًا استثنائيًا مع الأجهزة المتطورة والأجهزة منخفضة الطاقة. عند دمجه مع تحسينات بنية النموذج، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بسابقيه، مما يجعله قوة دافعة للبيئات التي تفتقر إلى وحدات معالجة رسومات مخصصة.

استقرار التدريب هو عامل تمييز آخر مهم. يستخدم YOLO26 مُحسّن MuSGD الجديد، وهو مزيج من SGD Muon مستوحى من ابتكارات تدريب LLM من Moonshot AI. يوفر هذا المُحسّن استقرارًا كبيرًا في تدريب نماذج اللغة للرؤية الحاسوبية، مما يسهل التوافق بشكل أسرع.

وظائف الخسارة المتقدمة

يستخدم YOLO26 ProgLoss + STAL، وهي وظائف خسارة متخصصة تحقق تحسينات ملحوظة في التعرف على الأجسام الصغيرة. وهذا أمر بالغ الأهمية للمهام المعقدة مثل معالجة الصور الجوية وتحليل البيئات الكثيفة.

الأداء والمعايير

عند مقارنة هذه النماذج وجهاً لوجه على COCO يتضح تفوق YOLO26 من حيث الدقة والكفاءة. توفر Ultralytics باستمرار متطلبات ذاكرة أقل أثناء التدريب وسرعات استدلال أسرع.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

ملاحظة: يحقق نموذج YOLO26x معدل دقة متوسط مثير للإعجاب يبلغ 57.5 mAP احتياجه إلى معلمات أقل بكثير (55.7 مليون) مقارنة بنموذج YOLOXx (99.1 مليون)، مما يسلط الضوء على الكفاءة المذهلة لمعلمات Ultralytics .

النظام البيئي وسهولة الاستخدام

واحدة من أهم مزايا اختيار YOLO26 هي النظام البيئي الجيد الصيانة الذي توفره Ultralytics. في حين يتطلب YOLOX التنقل بين قواعد بيانات بحثية معقدة وإعدادات بيئية يدوية، Ultralytics تجربة مطور مبسطة "من الصفر إلى القمة".

باستخدام Python الموحدة Python ، يمكن للمطورين التبديل بسهولة بين مهام مثل اكتشاف الكائنات وتقسيم المثيلات وتصنيف الصور وتقدير الوضع. على العكس من ذلك، يقتصر YOLOX بشكل صارم على اكتشاف المربعات المحيطة.

مثال تدريبي

Ultralytics تدريب النموذج على مجموعة بيانات مخصصة باستخدام Ultralytics فعالًا للغاية. تقلل خطوة التدريب من استخدام CUDA مما يسمح بأحجام دفعات أكبر حتى على الأجهزة الاستهلاكية، وهو ما يمثل تباينًا صارخًا مع البنى القديمة أو نماذج المحولات الثقيلة.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

تعزز Ultralytics سير العمل هذا بشكل أكبر، حيث توفر تدريبًا على السحابة، وتعليقات تلقائية على مجموعات البيانات، وخيارات نشر بنقرة واحدة. وهي أداة لا غنى عنها للفرق التي تهدف إلى الانتقال بسرعة من مرحلة النماذج الأولية إلى مرحلة الإنتاج.

حالات الاستخدام المثالية والتطبيقات الواقعية

اختيار النموذج المناسب يحدد نجاح تطبيقك في العالم الواقعي.

الذكاء الاصطناعي الحافة وإنترنت الأشياء

بالنسبة للتطبيقات التي تتطلب معالجة محلية على أجهزة محدودة، مثل أنظمة الإنذار الأمنية الذكية أو أجهزة استشعار البيئة عن بُعد، فإن YOLO26 هو الخيار الأمثل. بفضل هندسته NMS CPU التي تزيد بنسبة 43٪، فإنه يعمل بسلاسة على أجهزة مثل Raspberry Pi دون الحاجة إلى حلول بديلة معقدة للتكمية.

الروبوتات المستقلة

تتطلب الروبوتات دقة عالية وزمن استجابة منخفض. تتيح قدرات تقدير الوضع في YOLO26، المدعومة بتقدير الاحتمالية اللوغاريتمية المتبقية (RLE)، للروبوتات فهم حركيات الإنسان في الوقت الفعلي. عدم وجود خاصية الكشف عن النقاط الرئيسية في YOLOX يجعلها غير مناسبة لمهام التفاعل المتقدمة بين الإنسان والروبوت.

التفتيش من ارتفاعات عالية وجوية

عند فحص البنية التحتية باستخدام الطائرات بدون طيار، فإن اكتشاف العيوب الدقيقة أمر بالغ الأهمية. تعمل وظائف ProgLoss و STAL في YOLO26 على تحسين استرجاع الأجسام الصغيرة بشكل كبير. بالإضافة إلى ذلك، يدعم YOLO26 بشكل أساسي Oriented Bounding Boxes (OBB)، مع زاوية خسارة متخصصة لحل مشكلات الحدود، مما يجعله مثاليًا للصور الفضائية والجوية حيث يتم تدوير الأجسام بشكل عشوائي.

عمليات النشر القديمة

قد لا يزال YOLOX قابلاً للاستخدام في البيئات القديمة حيث تم إنشاء خطوط أنابيب نشر C++ الحالية بشكل صريح حول مخرجات الرأس المنفصلة المحددة في عام 2021. ومع ذلك، بالنسبة لأي مشروع جديد، يوصى بشدة بالانتقال إلى Ultralytics للاستفادة من مكاسب الأداء الحديثة والدعم المستمر من المجتمع.

استكشاف نماذج أخرى

بينما يمثل YOLO26 أحدث ما توصلت إليه التكنولوجيا في الوقت الحالي، يوفر Ultralytics مجموعة متنوعة من النماذج المصممة خصيصًا لتلبية احتياجات محددة. بالنسبة للمطورين المهتمين بالبنى القائمة على المحولات، RT-DETR نهجًا بديلاً للكشف الشامل. بالإضافة إلى ذلك، YOLO11 خيارًا قويًا ومُختبرًا بشكل مكثف لبيئات الإنتاج التي تتطلب مقارنات تاريخية شاملة.

باختصار، يوضح الانتقال من YOLOX إلى YOLO26 التقدم السريع في هذا المجال. من خلال الجمع بين واجهة برمجة تطبيقات بديهية ومجموعة ميزات متنوعة وكفاءة لا مثيل لها، يعتبر YOLO26 الخيار الأول للباحثين والمطورين في جميع أنحاء العالم.


تعليقات