Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX مقابل YOLOv9#

لقد تشكل مشهد الرؤية الحاسوبية من خلال اختراقات معمارية مستمرة توازن بين الكفاءة الحسابية والدقة العالية. عند تقييم نماذج اكتشاف الكائنات في الوقت الفعلي، تسلط المقارنة بين نموذج YOLOX الخاص بـ Megvii ونموذج YOLOv9 الخاص بـ Academia Sinica الضوء على فلسفتين متميزتين في تطوير التعلم العميق. بينما راد نموذج YOLOX نموذجاً مبسطاً خالياً من الصناديق المرجعية (anchor-free)، قدم نموذج YOLOv9 تقنيات متقدمة لتوجيه التدرج لتعظيم الاحتفاظ بالمعلومات.

يستكشف هذا الدليل الفني الفروق المعمارية الدقيقة ومعايير الأداء وحالات الاستخدام المثالية لهما، مع توضيح كيفية توفير حلول حديثة مثل Ultralytics Platform ونموذج YOLO26 الذي تم إصداره حديثاً بدائل فائقة للنشر الجاهز للإنتاج.

Link to this sectionYOLOX: ريادة النموذج الخالي من الصناديق المرجعية (Anchor-Free)#

تم إصدار YOLOX في منتصف عام 2021، وكان خطوة كبيرة إلى الأمام في سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي. من خلال إزالة الحاجة إلى صناديق مرجعية محددة مسبقاً، قام بتبسيط الضبط الاستدلالي المطلوب لمجموعات البيانات المخصصة بشكل كبير.

Link to this sectionالابتكارات المعمارية#

قدم YOLOX العديد من التغييرات الرئيسية على خط أنابيب الاكتشاف القياسي. فقد طبق رأساً مفصولاً (decoupled head)، مما أدى إلى فصل مهام التصنيف والانحدار، وهو ما قلل بشكل كبير من التعارض بين تحديد كائن ما وتحديد حدوده. علاوة على ذلك، تبنى YOLOX استراتيجية SimOTA، وهي استراتيجية متقدمة لتخصيص التسميات قامت بتخصيص العينات الإيجابية ديناميكياً أثناء التدريب، مما أدى إلى تقارب أسرع وأداء عام أفضل على مجموعات بيانات قياسية.

Link to this sectionنقاط القوة والقيود#

تكمن القوة الأساسية لـ YOLOX في تصميمه المبسط. تعني الآلية الخالية من الصناديق المرجعية أن المطورين يقضون وقتاً أقل في تشغيل خوارزميات التجميع للعثور على أحجام الصناديق المثالية لبياناتهم المحددة. ومع ذلك، كبنية معمارية أقدم بُنيت أصلاً دون التطورات الأخيرة في آلية الانتباه الذاتي (self-attention) أو مسار التدرج، فإنه يواجه صعوبة في مطابقة كفاءة المعلمات للشبكات الأحدث. كما أنه يفتقر إلى دعم أصلي للمهام المتقدمة مثل تجزئة الكائنات وتقدير الوضعية ضمن واجهة برمجة تطبيقات موحدة.

تعرف على المزيد حول YOLOX

Link to this sectionYOLOv9: تعظيم معلومات التدرج#

بالانتقال إلى عام 2024، قدم YOLOv9 نهجاً نظرياً للغاية لحل مشكلة عنق زجاجة المعلومات المتأصلة في الشبكات العصبية التلافيفية العميقة.

Link to this sectionالابتكارات المعمارية#

تتمثل الميزة المميزة لـ YOLOv9 في معلومات التدرج القابلة للبرمجة (PGI)، والتي تضمن عدم ضياع البيانات الدلالية الحاسمة أثناء مرورها عبر طبقات متعددة من الشبكة. وبالاقتران مع شبكة تجميع الطبقات الفعالة المعممة (GELAN)، يحقق YOLOv9 نسبة استثنائية بين المعلمات والدقة. وهذا يسمح للنموذج بالاحتفاظ بتدرجات دقيقة لتحديث الأوزان، مما يجعله فعالاً للغاية حتى في متغيراته خفيفة الوزن.

Link to this sectionنقاط القوة والقيود#

يتفوق YOLOv9 في دفع الحدود النظرية لـ دقة النموذج. إنه يحقق نتائج mAP رائعة على COCO، مما يجعله مفضلاً للباحثين. ومع ذلك، على الرغم من كفاءته، لا يزال YOLOv9 يعتمد على خوارزمية كبت غير الحد الأقصى (NMS) التقليدية للمعالجة اللاحقة، مما يؤدي إلى زيادة زمن الاستجابة أثناء الاستدلال. بالنسبة للمهندسين الذين يركزون على نشر الذكاء الاصطناعي على أجهزة الحافة، فإن إدارة منطق NMS تضيف تعقيداً غير ضروري إلى خط أنابيب النشر.

اعرف المزيد عن YOLOv9

عنق زجاجة المعالجة اللاحقة

تتطلب النماذج التقليدية مثل YOLOX وYOLOv9 خوارزمية كبت غير الحد الأقصى (NMS) لتصفية الصناديق المحيطة المكررة. هذه الخطوة متسلسلة بطبيعتها وغالباً ما تخلق عنق زجاجة على وحدات المعالجة المركزية (CPUs)، مما يسلط الضوء على الحاجة إلى البنى الأصلية من البداية إلى النهاية الموجودة في أحدث نماذج Ultralytics.

Link to this sectionمقارنة الأداء#

عند مقارنة المقاييس الحسابية الخام لهذه البنى، من الواضح أن YOLOv9 يقدم أساساً أكثر حداثة، بينما يظل YOLOX خياراً خفيف الوزن للإعدادات القديمة. فيما يلي تفصيل دقيق لنماذجهم القياسية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

بينما يظهر YOLOv9 دقة فائقة عبر أعداد معلمات مماثلة، يجب على المطورين الذين يبحثون عن التوازن النهائي بين السرعة والدقة وسهولة الاستخدام النظر في أحدث التطورات من Ultralytics.

Link to this sectionميزة Ultralytics: تعرف على YOLO26#

بينما يوفر تقييم النماذج التاريخية مثل YOLOX وYOLOv9 سياقاً قيماً، فإن الحالة الراهنة للفن يتم تحديدها بواسطة Ultralytics YOLO26. تم إصدار YOLO26 في أوائل عام 2026، وهو يعيد بناء خط أنابيب الاكتشاف جذرياً لبيئات المؤسسات الحديثة.

Link to this sectionابتكارات معمارية لا مثيل لها#

يحل YOLO26 تماماً اختناقات المعالجة اللاحقة لأسلافه من خلال تصميم أصلي من البداية إلى النهاية بدون NMS، مما يضمن نشراً أبسط عبر جميع الأجهزة. علاوة على ذلك، من خلال إزالة خسارة التوزيع البؤري (DFL) ودمج مُحسِّن MuSGD الجديد — وهو هجين من نزول التدرج العشوائي وMuon — يحقق YOLO26 استقراراً غير مسبوق في التدريب.

بالنسبة للمطورين الذين ينشرون في بيئات مقيدة مثل Raspberry Pi، يوفر YOLO26 استدلالاً أسرع لوحدة المعالجة المركزية بنسبة تصل إلى 43%. كما يقدم دوال خسارة ProgLoss + STAL، مما يؤدي إلى تحسينات كبيرة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لـ الصور الجوية وتحليلات الطائرات بدون طيار.

Link to this sectionنظام بيئي للتطوير مبسط#

على عكس مستودعات الأبحاث المستقلة، يوفر نظام Ultralytics البيئي تجربة مطور لا مثيل لها. باستخدام Ultralytics Python API، يمكن للمهندسين تقليل الكود المكتبي (boilerplate code) بشكل كبير. علاوة على ذلك، يتم الحفاظ على متطلبات الذاكرة محسنة للغاية، مما يعني أنه يمكنك تدريب نماذج قوية باستخدام ذاكرة VRAM أقل لوحدة معالجة الرسومات مقارنة بالبنى الثقيلة المعتمدة على الانتباه.

from ultralytics import YOLO

# Load the highly optimized, NMS-free YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Easily export to optimized deployment formats
model.export(format="engine", quantize=16)  # Exports to TensorRT

بعيداً عن الاكتشاف، يدعم YOLO26 بسلاسة العديد من المهام ضمن نفس الإطار تماماً. سواء كنت بحاجة إلى صناديق محيطة موجهة (OBB) دقيقة للتصوير عبر الأقمار الصناعية أو أقنعة بكسل دقيقة لـ تطبيقات التصوير الطبي، يظل سير العمل متطابقاً. بالنسبة للفرق المستثمرة في سير عمل الجيل السابق، يتوفر أيضاً Ultralytics YOLO11 ومدعوم بالكامل.

Link to this sectionحالات الاستخدام المثالية واستراتيجيات النشر#

يعتمد اختيار البنية الصحيحة تماماً على بيئة النشر المستهدفة ومتطلبات المشروع.

Link to this sectionحوسبة الحافة والروبوتات#

بالنسبة للأجهزة منخفضة الطاقة، يمكن أن يؤدي الاعتماد على النماذج التي تتطلب معالجة لاحقة ثقيلة إلى شل الأداء. بينما يعتبر YOLOX-Nano صغيراً بشكل لا يصدق، إلا أن دقته غالباً ما تكون غير كافية للمهام الحرجة للسلامة. YOLO26 هو الخيار النهائي هنا؛ حيث يسمح غياب DFL وNMS له بالتشغيل بسلاسة على خيوط المعالجة الخام لوحدة المعالجة المركزية، مما يجعله مثالياً للروبوتات المستقلة أو إدارة مواقف السيارات الذكية.

Link to this sectionالمقارنة المرجعية الأكاديمية#

إذا كان الهدف الوحيد هو تحليل تدفق التدرج ودراسة اختناقات الشبكة العميقة، يظل YOLOv9 موضوعاً ممتازاً للدراسة. يوفر إطار عمل PGI الخاص به رؤى رائعة حول كيفية الحفاظ على الميزات عبر طبقات الشبكة العصبية العميقة، مما يجعله أداة قيمة للباحثين الجامعيين الذين يستكشفون نظرية التلافيف.

Link to this sectionتحليلات الفيديو للمؤسسات#

بالنسبة لمهام معالجة الفيديو واسعة النطاق مثل أنظمة إنذار الأمن أو مراقبة حركة المرور، فإن السرعة وقدرات التصدير المتنوعة أمر بالغ الأهمية. تسمح أدوات التصدير الأصلية التي يوفرها إطار عمل Ultralytics للفرق بتجميع YOLO26 مباشرة إلى TensorRT أو OpenVINO في أمر واحد، مما يقلل بشكل كبير من وقت الوصول إلى السوق.

من خلال الاستفادة من الميزات الشاملة لنظام Ultralytics البيئي، يمكن لفرق التعلم الآلي تجاوز تعقيدات قواعد بيانات الأبحاث الخام والتركيز مباشرة على بناء تطبيقات ذكاء اصطناعي قابلة للتوسع في العالم الحقيقي.

المساهمون

التعليقات