Meet YOLO26: next-gen vision AI.

وصفة تدريب YOLO26

مقدمة

This guide documents the exact training recipe used to produce the official YOLO26 pretrained checkpoints on COCO. Every hyperparameter shown here is already embedded in the released .pt weights and can be inspected programmatically.

يساعدك فهم كيفية تدريب النماذج الأساسية على اتخاذ قرارات أفضل عند الضبط الدقيق: ما هي تعزيزات البيانات التي يجب الاحتفاظ بها، وأوزان دالة الخسارة التي يجب تعديلها، وإعدادات المحسن التي تعمل بشكل أفضل لحجم مجموعة البيانات الخاصة بك.

لمن هذا الدليل؟

هذا الدليل مخصص للممارسين الذين يرغبون في فهم ما تم تضمينه في نقاط فحص YOLO26 الرسمية - ليس فقط البنية، ولكن جداول معدل التعلم، وخطوط أنابيب التعزيز، وأوزان الخسارة التي شكلت أداءها. استخدم هذه المعلومات لاتخاذ خيارات مستنيرة عند الضبط الدقيق على بياناتك الخاصة.

فحص وسائط التدريب

تخزن كل نقطة فحص من Ultralytics تكوين التدريب الكامل المستخدم لإنتاجها. يمكنك فحص هذه الإعدادات في أي وقت:

فحص وسائط تدريب نقطة الفحص
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
print(model.ckpt["train_args"])

يعمل هذا مع أي نقطة فحص .pt - سواء الإصدارات الرسمية أو نماذجك التي قمت بضبطها بدقة. للحصول على القائمة الكاملة لوسائط التدريب القابلة للتكوين، راجع مرجع تكوين التدريب.

نظرة عامة على التدريب

تم تدريب جميع نماذج YOLO26 الأساسية على COCO بدقة 640x640 باستخدام محسن MuSGD مع حجم الدفعة 128. تمت تهيئة النماذج من أوزان مدربة مسبقاً وسيطة وتم تحسينها باستخدام معاملات تشعبية تم العثور عليها عبر البحث التطوري. سجلات التدريب الكاملة والمقاييس لكل حجم نموذج متاحة على Ultralytics Platform:

خيارات التصميم الرئيسية عبر جميع الأحجام:

  • تدريب شامل (end-to-end) (end2end=True) مع رأس واحد لواحد خالٍ من NMS
  • محسن MuSGD يجمع بين SGD وتحديثات متعامدة بنمط Muon لأوزان الالتفاف
  • تعزيز فسيفساء مكثف (احتمالية ~0.9-1.0) يتم تعطيله في آخر 10 عصور (close_mosaic=10)
  • تعزيز مقياس قوي (0.56-0.95) للتعامل مع الكائنات بأحجام مختلفة
  • حد أدنى من الدوران/القص لمعظم الأحجام، للحفاظ على انخفاض التشوه الهندسي

المعاملات التشعبية لكل حجم نموذج

المحسن ومعدل التعلم

الإعدادNSMLX
optimizerMuSGDMuSGDMuSGDMuSGDMuSGD
lr00.00540.000380.000380.000380.00038
lrf0.04950.8820.8820.8820.882
momentum0.9470.9480.9480.9480.948
weight_decay0.000640.000270.000270.000270.00027
warmup_epochs0.980.990.990.990.99
epochs24570806040
batch128128128128128
imgsz640640640640640
استراتيجية معدل التعلم

استخدم نموذج N معدل تعلم أولياً أعلى مع اضمحلال حاد (lrf=0.0495)، بينما استخدمت نماذج S/M/L/X معدل تعلم أولياً أقل بكثير مع جدول أكثر لطفاً (lrf=0.882). يعكس هذا ديناميكيات التقارب المختلفة للنماذج الأصغر مقابل الأكبر - تحتاج النماذج الأصغر إلى تحديثات أكثر قوة للتعلم بفعالية.

أوزان الخسارة

الإعدادNSMLX
box5.639.839.839.839.83
cls0.560.650.650.650.65
dfl9.040.960.960.960.96

يعطي نموذج N الأولوية لخسارة DFL، بينما تحول نماذج S/M/L/X التركيز إلى انحدار مربع الإحاطة. تظل خسارة التصنيف متسقة نسبياً عبر جميع الأحجام.

خط أنابيب التعزيز

للحصول على شرح مفصل لكل تقنية، راجع دليل تعزيز بيانات YOLO.

الإعدادNSMLX
mosaic0.9090.9920.9920.9920.992
mixup0.0120.050.4270.4270.427
copy_paste0.0750.4040.3040.4040.404
scale0.5620.90.950.950.95
fliplr0.6060.3040.3040.3040.304
degrees1.11~0~0~0~0
shear1.46~0~0~0~0
translate0.0710.2750.2750.2750.275
hsv_h0.0140.0130.0130.0130.013
hsv_s0.6450.3530.3530.3530.353
hsv_v0.5660.1940.1940.1940.194
bgr0.1060.00.00.00.0

تستخدم النماذج الأكبر تعزيزاً أكثر قوة بشكل عام (معدل أعلى لـ mixup، وcopy-paste، وscale)، لأن لديها سعة أكبر وتستفيد من تنظيم أقوى. نموذج N هو الحجم الوحيد الذي يحتوي على تعزيز دوران، وقص، وBGR ذو معنى.

وسائط التدريب الداخلية

متقدم: وسائط خط الأنابيب الداخلية

تحتوي نقاط الفحص أيضاً على وسائط تم استخدامها في خط أنابيب التدريب الداخلي ولكنها ليست مكشوفة كإعدادات قابلة للتكوين من قبل المستخدم في default.yaml:

الإعدادالوصفNSMLX
muon_wوزن تحديث Muon في MuSGD0.5280.4360.4360.4360.436
sgd_wوزن تحديث SGD في MuSGD0.6740.4790.4790.4790.479
cls_wوزن التصنيف الداخلي2.743.483.483.483.48
o2mوزن خسارة الرأس من واحد إلى متعدد1.00.7050.7050.7050.705
topkتعيين التسمية لأفضل-k85555

يتم تسجيل هذه المعايير لضمان التكرار ولكن لا يلزم ضبطها عند إجراء الضبط الدقيق. راجع الأسئلة الشائعة لمزيد من التفاصيل.

إرشادات الضبط الدقيق

عند إجراء الضبط الدقيق لنموذج YOLO26 على مجموعة البيانات الخاصة بك، لا تحتاج إلى تكرار وصفة التدريب المسبق بالكامل. فالأوزان المدربة مسبقًا تشفر بالفعل المعرفة المتعلقة بالتعزيز والتحسين من تدريب COCO. لمزيد من الممارسات العامة الفضلى للتدريب، راجع نصائح لتدريب النموذج.

ابدأ ببساطة

الضبط الدقيق باستخدام الإعدادات الافتراضية
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)

يعد الضبط الدقيق باستخدام الإعدادات الافتراضية أساساً قوياً. لا تقم بتعديل المعايير الفائقة إلا إذا كان لديك سبب محدد لذلك.

متى يجب عليك التعديل

مجموعات البيانات الصغيرة (< 1,000 صورة):

  • تقليل قوة التعزيز: mosaic=0.5, mixup=0.0, copy_paste=0.0
  • خفض معدل التعلم: lr0=0.001
  • استخدم عدداً أقل من الدورات التدريبية (epochs) مع الصبر: epochs=50, patience=20
  • فكر في تجميد طبقات الهيكل الأساسي (backbone): freeze=10

مجموعات البيانات الكبيرة (> 50,000 صورة):

  • طابق وصفة التدريب المسبق بشكل أدق
  • فكر في استخدام optimizer=MuSGD للتشغيل لفترات أطول
  • زيادة التعزيز: mosaic=1.0, mixup=0.3, scale=0.9

الصور الخاصة بالمجال (جوية، طبية، تحت الماء):

  • زد قيمة flipud=0.5 إذا كان التوجه الرأسي متغيراً
  • زد قيمة degrees إذا كانت الكائنات تظهر بزوايا دوران عشوائية
  • اضبط hsv_s و hsv_v إذا كانت ظروف الإضاءة تختلف بشكل كبير عن COCO

لتحسين المعايير الفائقة بشكل آلي، راجع دليل ضبط المعايير الفائقة.

اختيار حجم النموذج

النموذجالأفضل لـإرشادات حجم الدفعة (Batch Size)
YOLO26nأجهزة الحافة (Edge devices)، الهواتف المحمولة، المعالجة اللحظية على CPUدفعات كبيرة (64-128) على وحدات معالجة الرسوميات للمستهلكين
YOLO26sتوازن بين السرعة والدقةدفعات متوسطة (32-64)
YOLO26mدقة أعلى مع موارد حوسبة معتدلةدفعات أصغر (16-32)
YOLO26lدقة عالية عند توفر GPUدفعات صغيرة (8-16) أو استخدام عدة وحدات GPU
YOLO26xأقصى دقة، نشر على الخادمدفعات صغيرة (4-8) أو استخدام عدة وحدات GPU

لخيارات التصدير والنشر، راجع دليل التصدير و خيارات نشر النموذج.

الأسئلة الشائعة

كيف يمكنني معرفة المعايير الفائقة المستخدمة بالضبط لأي نقطة تفتيش (checkpoint)؟

قم بتحميل نقطة التفتيش باستخدام torch.load() وقم بالوصول إلى مفتاح train_args، أو استخدم model.ckpt["train_args"] مع واجهة برمجة تطبيقات Ultralytics. راجع فحص وسائط التدريب للحصول على أمثلة كاملة.

لماذا تختلف أعداد الدورات التدريبية (epochs) لكل حجم نموذج؟

النماذج الأكبر تتقارب بشكل أسرع على COCO لأنها تمتلك سعة أكبر. احتاج نموذج N إلى 245 دورة بينما احتاج نموذج X إلى 40 دورة فقط. عند الضبط الدقيق على مجموعة بياناتك الخاصة، يعتمد العدد الأمثل للدورات على حجم وتعقيد مجموعة بياناتك، وليس على حجم النموذج. استخدم التوقف المبكر (patience) للعثور على نقطة التوقف الصحيحة آلياً.

هل يجب أن أستخدم MuSGD للضبط الدقيق؟

عندما يكون optimizer=auto (الإعداد الافتراضي)، يختار Ultralytics تلقائياً MuSGD لعمليات التدريب الأطول (>10,000 تكرار) و AdamW للعمليات الأقصر. يمكنك تعيين optimizer=MuSGD بشكل صريح إذا كنت تفضل ذلك. لمزيد من المعلومات حول اختيار المُحسن (optimizer)، راجع وثائق التدريب.

ما هي muon_w و sgd_w و cls_w و o2m و topk في نقطة التفتيش؟

هذه هي معايير داخلية من خط تدريب البيانات الذي أنتج نقاط التفتيش الأساسية. يتم تخزينها لضمان التكرار ولكنها ليست إعدادات قابلة للتكوين من قبل المستخدم في default.yaml. لا تحتاج إلى ضبطها عند إجراء الضبط الدقيق. راجع معايير التدريب الداخلية للحصول على التفاصيل.

هل يمكنني تكرار التدريب المسبق بالكامل من الصفر؟

تم إنتاج نقاط التفتيش باستخدام فرع تدريب داخلي مع ميزات إضافية غير موجودة في قاعدة الكود العامة (مثل أوزان o2m و cls_w القابلة للتكوين). يمكنك الحصول على نتائج قريبة جداً باستخدام المعايير الفائقة الموثقة في هذه الصفحة مع حزمة Ultralytics العامة، ولكن النسخ الدقيق يتطلب الفرع الداخلي.

التعليقات