Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX مقابل DAMO-YOLO#

شهد تطور الكشف عن الأجسام في الوقت الفعلي تحولات عديدة في النماذج، من البنى القائمة على المرساة (anchor-based) إلى البنى الخالية من المرساة (anchor-free)، ومن الهياكل الأساسية المصممة يدوياً إلى البحث الآلي في بنية الشبكات العصبية (NAS). في هذه المقارنة التقنية الشاملة، سنقوم بتحليل معلمين بارزين في هذه الرحلة: YOLOX وDAMO-YOLO. سوف نستكشف ابتكاراتهما المعمارية، ومنهجيات التدريب، والمقايضات في الأداء، مع تسليط الضوء أيضاً على كيفية توفير Ultralytics YOLO26 بديلاً لا يضاهى للمطورين المعاصرين.

Link to this sectionYOLOX: ريادة النموذج الخالي من الصناديق المرجعية (Anchor-Free)#

تم إصدار YOLOX في 18 يوليو 2021 بواسطة Zheng Ge وSongtao Liu وFeng Wang وZeming Li وJian Sun في Megvii، وقد مثّل نقطة تحول حاسمة من خلال دمج التصميم الخالي من المرساة بنجاح في عائلة YOLO. وكما ورد في تقريرهم التقني المفصل على ArXiv، كان YOLOX يهدف إلى سد الفجوة بين البحث الأكاديمي والنشر الصناعي.

Link to this sectionالابتكارات المعمارية الرئيسية#

قدم YOLOX العديد من التحولات الهيكلية الأساسية التي أدت إلى تحسينات جذرية مقارنة بأسلافه:

  • آلية خالية من المرساة (Anchor-Free): من خلال التنبؤ بمركز الجسم وأبعاد صندوق الإحاطة (bounding box) مباشرة، قلل YOLOX من عدد الاستدلالات التصميمية وبسّط عمليات تجميع المرساة المعقدة. وهذا يجعله قابلاً للتكيف بدرجة كبيرة مع سيناريوهات الرؤية الحاسوبية المتنوعة.
  • رأس مفكك (Decoupled Head): استخدمت نماذج YOLO التقليدية رأساً مقترناً واحداً لكل من التصنيف والانحدار. نفذ YOLOX رأساً مفككاً يعالج التصنيف وتحديد الموقع بشكل منفصل، مما أدى إلى التقارب بشكل أسرع وتحسين الدقة.
  • تعيين الملصقات SimOTA: تم استخدام نسخة مبسطة من النقل الأمثل للتعيين (OTA) لتعيين العينات الإيجابية ديناميكياً، مما يقلل من أوقات التدريب ويتغلب على غموض تعيينات النقاط المركزية.
إرث YOLOX

أثر تصميم الرأس المفكك في YOLOX بشكل كبير على الأجيال اللاحقة من كاشفات الأجسام، ليصبح ميزة قياسية في العديد من النماذج الحديثة.

اعرف المزيد عن YOLOX

Link to this sectionDAMO-YOLO: البحث الآلي عن البنية على نطاق واسع#

تم تطوير DAMO-YOLO بواسطة Xianzhe Xu وفريق من الباحثين في Alibaba Group، وتم تقديمه في 23 نوفمبر 2022. وكما هو مفصل في منشور ArXiv، استفاد النموذج بشكل كبير من البحث في بنية الشبكات العصبية (NAS) لدفع حدود Pareto للسرعة والدقة.

Link to this sectionالابتكارات المعمارية الرئيسية#

ارتكزت استراتيجية DAMO-YOLO على أتمتة تصميم الهياكل الفعالة:

  • هياكل MAE-NAS: باستخدام خوارزمية تطورية متعددة الأهداف، اكتشف DAMO-YOLO هياكل أساسية عالية الكفاءة مخصصة لميزانيات زمن انتقال محددة، خاصة عند تصديرها إلى أطر عمل مثل TensorRT.
  • RepGFPN الفعال: تصميم عنق ثقيل يعزز بشكل كبير دمج الميزات عبر دقات مكانية مختلفة، وهو مفيد للغاية لـ تحليل الصور الجوية واكتشاف الأجسام بمقاييس متفاوتة.
  • ZeroHead: رأس تنبؤ مبسط يقلل من التكرار الحسابي دون التضحية بمتوسط الدقة (mAP) العام للنموذج.
  • AlignedOTA والتقطير (Distillation): يدمج تعيين ملصقات متطوراً وتقطير المعرفة من المعلم إلى الطالب لاستخلاص أقصى أداء من نماذج الطلاب الأصغر.

تعرف على المزيد حول DAMO-YOLO

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذين النموذجين، يجب أن ننظر إلى عدد المعلمات، وعدد العمليات الحسابية المطلوبة (FLOPs)، وملفات تعريف زمن الانتقال. فيما يلي بيانات المعايير التي تقارن بين YOLOX وDAMO-YOLO عبر مقاييس متعددة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

بينما يحقق كلا النموذجين نتائج مبهرة، فإنهما يأتيان مع بعض المحاذير. يتطلب YOLOX ضبطاً دقيقاً لرأسه المفكك، في حين أن اعتماد DAMO-YOLO الكبير على التقطير يجعل إعادة التدريب على مجموعات بيانات مخصصة كثيفة الموارد للغاية، مما يتطلب كميات هائلة من ذاكرة GPU.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOX وDAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOX#

يعد YOLOX خياراً قوياً لـ:

  • أبحاث الكشف بدون نقاط ارتكاز: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من نقاط الارتكاز كخط أساس لتجربة رؤوس كشف جديدة أو دوال خسارة مبتكرة.
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الجوال القديمة حيث يكون البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91 مليون معلمة) أمراً بالغ الأهمية.
  • دراسات تخصيص التصنيفات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تخصيص التصنيفات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

Link to this sectionمتى تختار DAMO-YOLO#

يوصى باستخدام DAMO-YOLO من أجل:

  • تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: تقديم YOLO26#

في حين أن YOLOX وDAMO-YOLO يمثلان معالم تاريخية مهمة، يحتاج المطورون المعاصرون إلى حل يجمع بين أحدث ما توصلت إليه الدقة وسهولة الاستخدام التي لا تضاهى. وهنا يأتي دور Ultralytics YOLO26 ليغير المشهد. تم إصدار YOLO26 في يناير 2026، وهو يبني على إرث النماذج الخالية من NMS لتقديم التوازن النهائي بين السرعة والدقة وتجربة المطور.

Link to this sectionلماذا تختار YOLO26؟#

يتفوق نظام Ultralytics البيئي المتكامل على المستودعات الأكاديمية المجزأة من خلال تقديم:

  • تصميم كامل من البداية للنهاية بدون NMS: يلغي YOLO26 بشكل أصلي خوارزمية كبت غير الأقصى (NMS) أثناء الاستدلال. وهذا يؤدي إلى زمن انتقال سريع للغاية ومتوقع، وهو أمر بالغ الأهمية للنشر على الحافة والمركبات ذاتية القيادة.
  • إزالة DFL: من خلال إزالة توزيع خسارة البؤرة (Distribution Focal Loss)، يبسط YOLO26 عمليات التصدير إلى أجهزة الحافة، مما يقلل بشكل كبير من متطلبات الذاكرة للتطبيقات خفيفة الوزن.
  • مُحسِّن MuSGD: يستعير YOLO26 ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) مع مُحسِّنه الهجين SGD وMuon، مما يضمن استقراراً قوياً في التدريب وتقارباً فائق السرعة.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): بفضل التحسينات الهيكلية العميقة، يعمل YOLO26 بسرعة مذهلة على وحدات المعالجة المركزية دون الحاجة إلى أجهزة GPU باهظة الثمن.
  • وظائف خسارة متقدمة: يوفر دمج ProgLoss + STAL تحسينات هائلة في التعرف على الأجسام الصغيرة، مما يجعله مثالياً لمهام مثل عمليات فحص الطائرات بدون طيار ومراقبة إنترنت الأشياء.
  • تعدد الاستخدامات: على عكس DAMO-YOLO، الذي يعد كاشفاً فقط، يدعم YOLO26 بشكل أصلي مهام تجزئة المثيلات، وتقدير الوضعية، وتصنيف الصور، وصندوق الإحاطة الموجه (OBB) في إطار عمل واحد موحد.
ابدأ البناء فوراً

مع واجهة برمجة تطبيقات Python من Ultralytics، لست بحاجة إلى تهيئة خطوط أنابيب تقطير معقدة يدوياً أو كتابة مئات الأسطر من كود C++ لنشر نموذجك.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")

تعرف على المزيد حول YOLO26

Link to this sectionنماذج أخرى يجب مراعاتها#

نظام الرؤية الحاسوبية واسع النطاق. بناءً على قيودك المحددة، قد ترغب أيضاً في استكشاف بنى أخرى مدعومة بالكامل من نظام Ultralytics البيئي:

  • YOLO11: السلف عالي القدرة لـ YOLO26، المعروف بقوته في تحليلات التجزئة ومراقبة جودة التصنيع.
  • YOLOv8: نموذج أسطوري ومستقر للغاية وخالٍ من المرساة، والذي عمم النشر الواسع على الحافة.
  • RT-DETR: محول كشف في الوقت الفعلي تم تطويره بواسطة Baidu، ويقدم بديلاً ممتازاً للمهام التي تستفيد بشكل كبير من آليات الانتباه العالمي، وإن كان ذلك على حساب متطلبات ذاكرة تدريب أعلى.

Link to this sectionالخلاصة#

ساهم كل من YOLOX وDAMO-YOLO بمفاهيم حيوية في تطور التعلم العميق—حيث أكد YOLOX النهج المفكك والخالي من المرساة، وأثبت DAMO-YOLO قوة البحث الآلي في بنية الشبكات. ومع ذلك، بالنسبة للإنتاج في العالم الحقيقي، يمكن لتعقيدات قواعد أكواد أبحاثهم الأصلية أن تبطئ الفرق الرشيقة.

من خلال الاستفادة من منصة Ultralytics الشاملة، يمكن للمطورين تجاوز هذه العقبات. مع تصميم YOLO26 المتكامل، وسرعات CPU الفائقة، والتوثيق المكثف، أصبح تحقيق أحدث تقنيات الرؤية بالذكاء الاصطناعي متاحاً أكثر من أي وقت مضى. سواء كنت تبني بنية تحتية للمدينة الذكية، أو تشخيصات الرعاية الصحية، أو الروبوتات المتقدمة، توفر Ultralytics المسار الأكثر كفاءة من البيانات الخام إلى النشر القوي في العالم الحقيقي.

التعليقات