Ultralytics YOLO26

نظرة عامة

Ultralytics YOLO26 هو أحدث تطور في سلسلة YOLO للكشف عن الأشياء في الوقت الفعلي، وقد تم تصميمه من الأساس لأجهزة الحافة والأجهزة منخفضة الطاقة. يقدم تصميماً انسيابياً يزيل التعقيدات غير الضرورية مع دمج ابتكارات مستهدفة لتقديم نشر أسرع وأخف وزناً وأكثر سهولة.

مخططات مقارنة Ultralytics YOLO26

جربه على منصة Ultralytics

استكشف نماذج YOLO26 وقم بتشغيلها مباشرة على منصة Ultralytics.

تسترشد بنية YOLO26 بثلاثة مبادئ أساسية:

  • البساطة: YOLO26 هو نموذج أصلي شامل (End-to-End)، ينتج تنبؤات مباشرة دون الحاجة إلى كبح غير الحد الأقصى (NMS). من خلال القضاء على خطوة المعالجة اللاحقة هذه، يصبح الاستنتاج أسرع وأخف وأسهل في النشر في الأنظمة الواقعية. تم ريادة هذا النهج المبتكر لأول مرة في YOLOv10 بواسطة Ao Wang في جامعة تسينغهوا وتم تطويره بشكل أكبر في YOLO26.
  • كفاءة النشر: يلغي التصميم الشامل مرحلة كاملة من خط المعالجة، مما يبسط التكامل بشكل كبير، ويقلل من زمن الاستجابة، ويجعل النشر أكثر قوة عبر بيئات متنوعة.
  • ابتكار التدريب: يقدم YOLO26 مُحسِّن MuSGD، وهو مزيج من SGD و Muon — مستوحى من اختراقات Kimi K2 الخاصة بشركة Moonshot AI في تدريب النماذج اللغوية الكبيرة (LLM). يوفر هذا المُحسِّن استقراراً محسناً وتقارباً أسرع، مما ينقل تقدم التحسين من النماذج اللغوية إلى رؤية الكمبيوتر.
  • التحسينات الخاصة بالمهمة: يقدم YOLO26 تحسينات مستهدفة لمهام متخصصة، بما في ذلك فقدان التجزئة الدلالي ووحدات أولية متعددة المقاييس للتجزئة (Segmentation)، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية (Pose) عالي الدقة، وفك تشفير مُحسَّن مع فقدان الزاوية لحل مشكلات الحدود في OBB.

تُقدم هذه الابتكارات معاً عائلة نماذج تحقق دقة أعلى في الأجسام الصغيرة، وتوفر نشراً سلساً، وتعمل بسرعة أكبر بنسبة تصل إلى 43% على وحدات المعالجة المركزية (CPUs) — مما يجعل YOLO26 واحداً من أكثر نماذج YOLO عملية وقابلية للنشر حتى الآن للبيئات ذات الموارد المحدودة.

الميزات الرئيسية

  • إزالة DFL
    وحدة فقدان التبئير التوزيعي (DFL)، رغم فعاليتها، كانت غالباً ما تعقد عملية التصدير وتحد من توافق الأجهزة. يزيل YOLO26 تقنية DFL تماماً، مما يبسط الاستنتاج ويوسع نطاق الدعم لأجهزة الحافة والأجهزة منخفضة الطاقة.

  • استنتاج شامل (End-to-End) بدون NMS
    على عكس الكاشفات التقليدية التي تعتمد على NMS كخطوة معالجة لاحقة منفصلة، فإن YOLO26 شامل أصلياً. يتم إنشاء التنبؤات مباشرة، مما يقلل من زمن الاستجابة ويجعل التكامل في أنظمة الإنتاج أسرع وأخف وأكثر موثوقية.

  • ProgLoss + STAL
    تعمل دوال الفقد المحسنة على زيادة دقة الكشف، مع تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو مطلب حيوي لإنترنت الأشياء (IoT)، والروبوتات، والصور الجوية، وتطبيقات الحافة الأخرى.

  • مُحسِّن MuSGD
    مُحسِّن هجين جديد يجمع بين SGD و Muon. مستوحى من Kimi K2 من شركة Moonshot AI، يقدم MuSGD أساليب تحسين متقدمة من تدريب LLM إلى رؤية الكمبيوتر، مما يتيح تدريباً أكثر استقراراً وتقارباً أسرع.

  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU)
    مُحسَّن خصيصاً لحوسبة الحافة، يوفر YOLO26 استنتاجاً أسرع بشكل ملحوظ على وحدة المعالجة المركزية، مما يضمن أداءً في الوقت الفعلي على الأجهزة التي لا تحتوي على وحدات معالجة رسومية (GPUs).

  • تحسينات تجزئة المثيلات (Instance Segmentation)
    يقدم فقدان التجزئة الدلالي لتحسين تقارب النموذج ووحدة أولية مطورة تستفيد من المعلومات متعددة المقاييس للحصول على جودة قناع فائقة.

  • تقدير الوضعية الدقيق (Precision Pose Estimation)
    يدمج تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتحديد نقاط رئيسية أكثر دقة ويُحسِّن عملية فك التشفير لزيادة سرعة الاستنتاج.

  • فك تشفير OBB مُنقح
    يقدم فقدان زاوية متخصصاً لتحسين دقة الكشف للأجسام المربعة الشكل ويُحسِّن فك تشفير OBB لحل مشكلات عدم استمرارية الحدود.

مخططات مقارنة Ultralytics YOLO26 الشاملة


المهام والأنماط المدعومة

يعتمد YOLO26 على مجموعة النماذج المتنوعة التي أسستها إصدارات Ultralytics YOLO السابقة، مما يوفر دعماً محسناً عبر مهام رؤية الكمبيوتر المختلفة:

النموذجأسماء الملفاتالمهمةالاستدلالالتحققالتدريبتصدير
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.ptالكشف
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptتجزئة المثيلات
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.ptالوضعية/النقاط الرئيسية
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.ptالكشف الموجه
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.ptالتصنيف

يضمن هذا الإطار الموحد أن YOLO26 قابل للتطبيق عبر الكشف في الوقت الفعلي، والتجزئة، والتصنيف، وتقدير الوضعية، والكشف الموجه عن الأجسام — كل ذلك مع دعم التدريب والتحقق والاستنتاج والتصدير.

متغيرات البنية فقط

تضيف yolo26-p2.yaml و yolo26-p6.yaml رأس كشف P2 (للأجسام الصغيرة) أو P6 (للمدخلات الكبيرة) ويتم شحنها كبنى YAML فقط. لم يتم إصدار أوزان yolo26*-p2.pt أو yolo26*-p6.pt خاصة بالمقياس. قم بإنشاء تكوين مخصص للمقياس من YAML (على سبيل المثال، YOLO("yolo26n-p6.yaml")) وقم بتدريبه أو ضبطه حسب الحاجة.


مقاييس الأداء

الأداء

راجع مستندات الكشف للحصول على أمثلة للاستخدام مع هذه النماذج المدربة على COCO، والتي تتضمن 80 فئة مدربة مسبقاً.

النموذجالحجم
(بكسل)
mAPval
50-95
mAPval
50-95(e2e)
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

قيم المعلمات (Params) و FLOPs خاصة بالنموذج المدمج بعد تنفيذ model.fuse()، الذي يدمج طبقات Conv و BatchNorm ويزيل رأس الكشف الإضافي من نوع واحد إلى متعدد. تحتفظ نقاط التفتيش المدربة مسبقاً ببنية التدريب الكاملة وقد تظهر عدداً أكبر.


أمثلة الاستخدام

This section provides simple YOLO26 training and inference examples. For full documentation on these and other modes, see the Predict, Train, Val, and Export docs pages.

لاحظ أن المثال أدناه خاص بنماذج YOLO26 للكشف للكشف عن الأشياء. للمزيد من المهام المدعومة، راجع توثيق Segment، و Classify، و OBB، و Pose.

مثال

يمكن تمرير نماذج PyTorch المدربة مسبقاً من نوع *.pt بالإضافة إلى ملفات الإعداد *.yaml إلى فئة YOLO() لإنشاء مثيل للنموذج في Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
بنية الرأس المزدوج

تتميز YOLO26 ببنية رأس مزدوج (dual-head architecture) توفر مرونة لسيناريوهات النشر المختلفة:

  • رأس من واحد إلى واحد (افتراضي): ينتج تنبؤات من البداية إلى النهاية بدون NMS، ويُخرج (N, 300, 6) بحد أقصى 300 اكتشاف لكل صورة. تم تحسين هذا الرأس من أجل استدلال سريع ونشر مبسط.
  • رأس من واحد إلى متعدد: يولد مخرجات YOLO التقليدية التي تتطلب معالجة لاحقة بواسطة NMS، ويُخرج (N, nc + 4, 8400) حيث nc هو عدد الفئات. يحقق هذا الرأس عادةً دقة أعلى قليلاً على حساب معالجة إضافية.

يمكنك التبديل بين الرؤوس أثناء التصدير أو التنبؤ أو التحقق:

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

يعتمد الاختيار على متطلبات النشر الخاصة بك: استخدم الرأس من واحد إلى واحد لتحقيق أقصى سرعة وبساطة، أو الرأس من واحد إلى متعدد عندما تكون الدقة هي الأولوية القصوى.

YOLOE-26: تجزئة المثيلات ذات المفردات المفتوحة

تدمج YOLOE-26 بنية YOLO26 عالية الأداء مع إمكانيات المفردات المفتوحة لسلسلة YOLOE. إنها تتيح الكشف والتجزئة في الوقت الفعلي لأي فئة كائن باستخدام موجهات نصية أو موجهات بصرية أو نمط بدون موجهات للاستدلال بدون تدريب مسبق (zero-shot)، مما يزيل فعلياً قيود التدريب على فئات ثابتة.

من خلال الاستفادة من تصميم YOLOE-26 بدون NMS ومن البداية إلى النهاية، توفر YOLOE-26 استدلالاً سريعاً في العالم المفتوح. مما يجعلها حلاً قوياً لتطبيقات الحافة في البيئات الديناميكية حيث تمثل الكائنات محل الاهتمام مفردات واسعة ومتطورة.

الأداء

راجع توثيق YOLOE للحصول على أمثلة استخدام لهذه النماذج المدربة على مجموعات البيانات Objects365v1 و GQA و Flickr30k.

النموذجالحجم
(بكسل)
نوع الموجهmAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfالمعلمات
(مليون)
FLOPs
(مليار)
YOLOE-26n-seg640نصي/بصري23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640نصي/بصري29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640نصي/بصري35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640نصي/بصري36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640نصي/بصري39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

مثال على الاستخدام

يدعم YOLOE-26 التوجيه النصي والمرئي على حد سواء. استخدام التوجيهات أمر مباشر—ما عليك سوى تمريرها عبر طريقة predict كما هو موضح أدناه:

مثال

تتيح لك التوجيهات النصية تحديد الفئات التي ترغب في اكتشافها من خلال الأوصاف النصية. يوضح الكود التالي كيفية استخدام YOLOE-26 لاكتشاف الأشخاص والحافلات في صورة ما:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

للاطلاع على تعمق في تقنيات التوجيه، والتدريب من الصفر، وأمثلة الاستخدام الكاملة، تفضل بزيارة وثائق YOLOE.

الاقتباسات والشكر

منشور Ultralytics YOLO26

لم تقم Ultralytics بنشر ورقة بحثية رسمية لـ YOLO26 نظراً للطبيعة المتطورة والسريعة للنماذج. بدلاً من ذلك، نركز على تقديم نماذج متطورة وتسهيل استخدامها. للحصول على أحدث التحديثات حول ميزات YOLO، والهندسات المعمارية، والاستخدام، تفضل بزيارة مستودع GitHub الخاص بنا والوثائق.

إذا كنت تستخدم YOLO26 أو غيره من برامج Ultralytics في عملك، فيرجى الاستشهاد به كالتالي:

اقتباس
@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

معرف الكائن الرقمي (DOI) معلق. يتوفر YOLO26 بموجب ترخيص AGPL-3.0 وتراخيص المؤسسات (Enterprise).


الأسئلة الشائعة

ما هي التحسينات الرئيسية في YOLO26 مقارنة بـ YOLO11؟

  • إزالة DFL: تبسط عملية التصدير وتوسع توافقية الحافة (edge)
  • استنتاج طرفي إلى طرف (End-to-End) بدون NMS: يلغي الحاجة إلى NMS لنشر أسرع وأبسط
  • ProgLoss + STAL: يعزز الدقة، خاصة بالنسبة للكائنات الصغيرة
  • محسن MuSGD: يجمع بين SGD و Muon (مستوحى من Kimi K2 الخاص بـ Moonshot) لتدريب أكثر استقراراً وكفاءة
  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مكاسب كبيرة في الأداء للأجهزة التي تعتمد على CPU فقط

ما هي المهام التي يدعمها YOLO26؟

YOLO26 عبارة عن عائلة نماذج موحدة، توفر دعماً كاملاً من البداية للنهاية (end-to-end) لمهام رؤية الحاسوب المتعددة:

يدعم كل متغير حجم (n, s, m, l, x) جميع المهام، بالإضافة إلى إصدارات المفردات المفتوحة عبر YOLOE-26.

لماذا تم تحسين YOLO26 لنشر الحافة (edge)؟

يوفر YOLO26 أداء حافة (edge) فائق من خلال:

  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU)
  • حجم نموذج مخفض وبصمة ذاكرة أقل
  • هندسة معمارية مبسطة للتوافقية (بدون DFL، بدون NMS)
  • تنسيقات تصدير مرنة تشمل TensorRT و ONNX و CoreML و TFLite و OpenVINO

كيف أبدأ مع YOLO26؟

تم إصدار نماذج YOLO26 في 14 يناير 2026، وهي متاحة للتنزيل. قم بتثبيت أو تحديث حزمة ultralytics وقم بتحميل نموذج:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

راجع قسم أمثلة الاستخدام للحصول على تعليمات التدريب، والتحقق، والتصدير.

التعليقات