انتقل إلى المحتوى

تكوين

YOLO تلعب الإعدادات والمعلمات الفائقة دورا مهما في أداء النموذج وسرعته ودقته. يمكن أن تؤثر هذه الإعدادات والمعلمات الفائقة على سلوك النموذج في مراحل مختلفة من عملية تطوير النموذج، بما في ذلك التدريب والتحقق من الصحة والتنبؤ.



شاهد: اتقان Ultralytics YOLOv8:تكوين

Ultralytics تستخدم الأوامر بناء الجملة التالي:

مثل

yolo TASK MODE ARGS
from ultralytics import YOLO

# Load a YOLOv8 model from a pre-trained weights file
model = YOLO('yolov8n.pt')

# Run MODE mode using the custom arguments ARGS (guess TASK)
model.MODE(ARGS)

أين:

افتراضي ARG يتم تعريف القيم في هذه الصفحة من cfg/defaults.yaml ملف.

المهام

YOLO يمكن استخدام النماذج لمجموعة متنوعة من المهام ، بما في ذلك الكشف والتجزئة والتصنيف والوضع. تختلف هذه المهام في نوع المخرجات التي تنتجها والمشكلة المحددة التي تم تصميمها لحلها.

  • كشف: لتحديد وتوطين الكائنات أو المناطق ذات الأهمية في صورة أو مقطع فيديو.
  • الجزء: لتقسيم صورة أو مقطع فيديو إلى مناطق أو وحدات بكسل تتوافق مع كائنات أو فئات مختلفة.
  • تصنيف: للتنبؤ بتسمية الفئة لصورة الإدخال.
  • الوضعية: لتحديد الأشياء وتقدير نقاطها الرئيسية في صورة أو مقطع فيديو.
مفتاح قيمة وصف
task 'detect' YOLO المهمة ، أي الكشف ، التقسيم ، التصنيف ، الوضع

دليل المهام

وسائط

YOLO يمكن استخدام النماذج في أوضاع مختلفة اعتمادا على المشكلة المحددة التي تحاول حلها. تتضمن هذه الأوضاع:

  • التدريب: لتدريب أ YOLOv8 نموذج على مجموعة بيانات مخصصة.
  • Val: للتحقق من صحة YOLOv8 نموذج بعد تدريبه.
  • التنبؤ: لعمل تنبؤات باستخدام مدرب YOLOv8 نموذج على الصور أو مقاطع الفيديو الجديدة.
  • تصدير: لتصدير YOLOv8 نموذج لتنسيق يمكن استخدامه للنشر.
  • المسار: لتتبع الكائنات في الوقت الفعلي باستخدام ملف YOLOv8 نموذج.
  • المعيار: لقياس الأداء YOLOv8 الصادرات (ONNX, TensorRT، إلخ.) السرعة والدقة.
مفتاح قيمة وصف
mode 'train' YOLO الوضع ، أي القطار ، فال ، التنبؤ ، التصدير ، المسار ، المعيار

دليل الأوضاع

قطار

إعدادات التدريب ل YOLO تشمل النماذج العديد من المعلمات والتكوينات الفائقة المستخدمة أثناء عملية التدريب. تؤثر هذه الإعدادات على أداء النموذج وسرعته ودقته. تتضمن إعدادات التدريب الرئيسية حجم الدفعة ومعدل التعلم والزخم واضمحلال الوزن. بالإضافة إلى ذلك، يمكن أن يؤثر اختيار المحسن ووظيفة الخسارة وتكوين مجموعة بيانات التدريب على عملية التدريب. يعد الضبط الدقيق والتجريب مع هذه الإعدادات أمرا بالغ الأهمية لتحسين الأداء.

مفتاح افتراضي وصف
model None يحدد ملف النموذج للتدريب. يقبل مسارا إلى أي منهما .pt نموذج تم تدريبه مسبقا أو أ .yaml ملف التكوين. ضروري لتحديد هيكل النموذج أو تهيئة الأوزان.
data None المسار إلى ملف تكوين مجموعة البيانات (على سبيل المثال، coco128.yaml). يحتوي هذا الملف على معلمات خاصة بمجموعة البيانات، بما في ذلك المسارات إلى بيانات التدريب والتحقق من الصحة، وأسماء الفئات، وعدد الفئات.
epochs 100 إجمالي عدد فترات التدريب. تمثل كل حقبة تمريرة كاملة على مجموعة البيانات بأكملها. يمكن أن يؤثر ضبط هذه القيمة على مدة التدريب وأداء النموذج.
time None الحد الأقصى لوقت التدريب بالساعات. إذا تم تعيينه، فإن هذا يتجاوز epochs وسيطة ، مما يسمح للتدريب بالتوقف تلقائيا بعد المدة المحددة. مفيد لسيناريوهات التدريب المقيدة بالوقت.
patience 100 عدد الفترات التي يجب انتظارها دون تحسين في مقاييس التحقق من الصحة قبل إيقاف التدريب مبكرا. يساعد على منع الإفراط في التجهيز عن طريق إيقاف التدريب عندما يستقر الأداء.
batch 16 حجم الدفعة للتدريب، مع الإشارة إلى عدد الصور التي تتم معالجتها قبل تحديث المعلمات الداخلية للنموذج. أوتوباتش (batch=-1) يضبط حجم الدفعة ديناميكيا بناء على توفر ذاكرة وحدة معالجة الرسومات.
imgsz 640 حجم الصورة المستهدفة للتدريب. يتم تغيير حجم جميع الصور إلى هذا البعد قبل إدخالها في النموذج. يؤثر على دقة النموذج والتعقيد الحسابي.
save True يتيح توفير نقاط تفتيش التدريب وأوزان النموذج النهائي. مفيد لاستئناف التدريب أو نشر النموذج.
save_period -1 تواتر نقاط التفتيش النموذجية المحفوظة ، المحددة في العصور. تؤدي القيمة -1 إلى تعطيل هذه الميزة. مفيد لحفظ النماذج المؤقتة أثناء جلسات التدريب الطويلة.
cache False تمكين التخزين المؤقت لصور مجموعة البيانات في الذاكرة (True/ram)، على القرص (disk)، أو تعطيله (False). يحسن سرعة التدريب عن طريق تقليل إدخال/إخراج القرص على حساب زيادة استخدام الذاكرة.
device None يحدد الجهاز (الأجهزة) الحسابية للتدريب: وحدة معالجة رسومات واحدة (device=0) ، ووحدات معالجة رسومات متعددة (device=0,1) ، وحدة المعالجة المركزية (device=cpu)، أو MPS لسيليكون Apple (device=mps).
workers 8 عدد مؤشرات الترابط العاملة لتحميل البيانات (لكل RANK إذا كان التدريب متعدد GPU). يؤثر على سرعة المعالجة المسبقة للبيانات والتغذية في النموذج ، وهو مفيد بشكل خاص في إعدادات وحدات معالجة الرسومات المتعددة.
project None اسم دليل المشروع حيث يتم حفظ مخرجات التدريب. يسمح بالتخزين المنظم للتجارب المختلفة.
name None اسم تشغيل التدريب. يستخدم لإنشاء دليل فرعي داخل مجلد المشروع ، حيث يتم تخزين سجلات التدريب والمخرجات.
exist_ok False إذا كان صحيحا ، يسمح بالكتابة فوق دليل مشروع / اسم موجود. مفيد للتجربة التكرارية دون الحاجة إلى مسح المخرجات السابقة يدويا.
pretrained True يحدد ما إذا كان سيبدأ التدريب من نموذج تم تدريبه مسبقا. يمكن أن تكون قيمة منطقية أو مسار سلسلة إلى نموذج معين يتم من خلاله تحميل الأوزان. يعزز كفاءة التدريب وأداء النموذج.
optimizer 'auto' اختيار محسن للتدريب. تشمل الخيارات SGD, Adam, AdamW, NAdam, RAdam, RMSProp إلخ، أو auto للاختيار التلقائي بناء على تكوين النموذج. يؤثر على سرعة التقارب والاستقرار.
verbose False تمكين الإخراج المطول أثناء التدريب ، وتوفير سجلات مفصلة وتحديثات التقدم. مفيد لتصحيح الأخطاء ومراقبة عملية التدريب عن كثب.
seed 0 يحدد البذور العشوائية للتدريب ، مما يضمن إمكانية تكرار النتائج عبر عمليات التشغيل بنفس التكوينات.
deterministic True يفرض استخدام الخوارزمية الحتمية ، مما يضمن قابلية التكرار ولكنه قد يؤثر على الأداء والسرعة بسبب القيود المفروضة على الخوارزميات غير الحتمية.
single_cls False يعامل جميع الفئات في مجموعات البيانات متعددة الفئات كفئة واحدة أثناء التدريب. مفيد لمهام التصنيف الثنائي أو عند التركيز على وجود الكائن بدلا من التصنيف.
rect False يتيح التدريب المستطيل ، وتحسين تكوين الدفعات للحد الأدنى من الحشو. يمكن أن يحسن الكفاءة والسرعة ولكنه قد يؤثر على دقة النموذج.
cos_lr False يستخدم جدولة معدل تعلم جيب التمام، ويضبط معدل التعلم باتباع منحنى جيب التمام على مر العصور. يساعد في إدارة معدل التعلم من أجل تقارب أفضل.
close_mosaic 10 يعطل زيادة بيانات الفسيفساء في آخر عصور N لتثبيت التدريب قبل الانتهاء. يؤدي الإعداد إلى 0 إلى تعطيل هذه الميزة.
resume False يستأنف التدريب من آخر نقطة تفتيش محفوظة. يقوم تلقائيا بتحميل أوزان النموذج وحالة المحسن وعدد العصور، مع مواصلة التدريب بسلاسة.
amp True يتيح التدريب التلقائي على الدقة المختلطة (AMP) ، مما يقلل من استخدام الذاكرة وربما يسرع التدريب بأقل تأثير على الدقة.
fraction 1.0 يحدد جزء مجموعة البيانات المراد استخدامه للتدريب. يسمح بالتدريب على مجموعة فرعية من مجموعة البيانات الكاملة ، وهو مفيد للتجارب أو عندما تكون الموارد محدودة.
profile False تمكين التنميط من ONNX و TensorRT سرعات أثناء التدريب ، مفيدة لتحسين نشر النموذج.
freeze None يجمد الطبقات N الأولى من النموذج أو الطبقات المحددة حسب الفهرس، مما يقلل من عدد المعلمات القابلة للتدريب. مفيد لضبط أو نقل التعلم.
lr0 0.01 معدل التعلم الأولي (أي SGD=1E-2, Adam=1E-3) . يعد ضبط هذه القيمة أمرا بالغ الأهمية لعملية التحسين ، مما يؤثر على مدى سرعة تحديث أوزان النموذج.
lrf 0.01 معدل التعلم النهائي كجزء من المعدل الأولي = (lr0 * lrf)، تستخدم جنبا إلى جنب مع برامج الجدولة لضبط معدل التعلم بمرور الوقت.
momentum 0.937 عامل الزخم ل SGD أو beta1 لمحسنات Adam ، مما يؤثر على دمج التدرجات السابقة في التحديث الحالي.
weight_decay 0.0005 L2 مصطلح التنظيم ، معاقبة الأوزان الكبيرة لمنع الإفراط في التجهيز.
warmup_epochs 3.0 عدد فترات الإحماء لمعدل التعلم ، وزيادة معدل التعلم تدريجيا من قيمة منخفضة إلى معدل التعلم الأولي لتحقيق الاستقرار في التدريب في وقت مبكر.
warmup_momentum 0.8 الزخم الأولي لمرحلة الإحماء ، والتكيف تدريجيا مع الزخم المحدد خلال فترة الإحماء.
warmup_bias_lr 0.1 معدل التعلم لمعلمات التحيز خلال مرحلة الإحماء ، مما يساعد على استقرار تدريب النموذج في العصور الأولية.
box 7.5 وزن مكون فقدان الصندوق في دالة الخسارة ، مما يؤثر على مقدار التركيز على التنبؤ بدقة بإحداثيات المربع المحيط.
cls 0.5 وزن خسارة التصنيف في دالة الخسارة الكلية ، مما يؤثر على أهمية التنبؤ الصحيح بالفئة بالنسبة للمكونات الأخرى.
dfl 1.5 وزن الخسارة البؤرية للتوزيع ، المستخدمة في بعض YOLO إصدارات للتصنيف الدقيق الحبيبات.
pose 12.0 وزن فقدان الوضع في النماذج المدربة على تقدير الوضع ، مما يؤثر على التركيز على التنبؤ بدقة بالنقاط الرئيسية.
kobj 2.0 وزن فقدان كائن النقطة الرئيسية في نماذج تقدير الوضع ، وتحقيق التوازن بين ثقة الكشف ودقة الوضع.
label_smoothing 0.0 يمكن أن يؤدي تطبيق تجانس الملصقات ، وتليين الملصقات الصلبة على مزيج من الملصق المستهدف والتوزيع الموحد على الملصقات ، إلى تحسين التعميم.
nbs 64 حجم الدفعة الاسمي لتطبيع الخسارة.
overlap_mask True يحدد ما إذا كان يجب أن تتداخل أقنعة التجزئة أثناء التدريب، قابلة للتطبيق في مهام تجزئة المثيل.
mask_ratio 4 نسبة العينة السفلية لأقنعة التجزئة ، مما يؤثر على دقة الأقنعة المستخدمة أثناء التدريب.
dropout 0.0 معدل التسرب لتسوية مهام التصنيف ، ومنع الإفراط في التجهيز عن طريق حذف الوحدات بشكل عشوائي أثناء التدريب.
val True يتيح التحقق من الصحة أثناء التدريب ، مما يسمح بالتقييم الدوري لأداء النموذج على مجموعة بيانات منفصلة.
plots False يقوم بإنشاء وحفظ مخططات مقاييس التدريب والتحقق من الصحة، بالإضافة إلى أمثلة التنبؤ، مما يوفر رؤى مرئية حول أداء النموذج وتقدم التعلم.

دليل القطار

تنبأ

إعدادات التنبؤ ل YOLO تشمل النماذج مجموعة من المعلمات والتكوينات الفائقة التي تؤثر على أداء النموذج وسرعته ودقته أثناء الاستدلال على البيانات الجديدة. يعد الضبط الدقيق والتجريب مع هذه الإعدادات أمرا ضروريا لتحقيق الأداء الأمثل لمهمة محددة. تتضمن الإعدادات الرئيسية حد الثقة وعتبة الإلغاء غير الأقصى (NMS) وعدد الفئات التي تم النظر فيها. العوامل الإضافية التي تؤثر على عملية التنبؤ هي حجم بيانات الإدخال وشكلها ، ووجود ميزات تكميلية مثل الأقنعة أو الملصقات المتعددة لكل صندوق ، والمهمة الخاصة التي يتم استخدام النموذج من أجلها.

حجج الاستدلال:

جدال نوع افتراضي وصف
source str 'ultralytics/assets' يحدد مصدر البيانات للاستدلال. يمكن أن يكون مسار صورة أو ملف فيديو أو دليل أو عنوان URL أو معرف جهاز للخلاصات المباشرة. يدعم مجموعة واسعة من التنسيقات والمصادر ، مما يتيح التطبيق المرن عبر أنواع مختلفة من المدخلات.
conf float 0.25 يعين الحد الأدنى للثقة للاكتشافات. سيتم تجاهل الكائنات المكتشفة بثقة أقل من هذا الحد. يمكن أن يساعد ضبط هذه القيمة في تقليل الإيجابيات الخاطئة.
iou float 0.7 عتبة التقاطع فوق الاتحاد (IoU) للقمع غير الأقصى (NMS). تؤدي القيم الأعلى إلى عدد أقل من الاكتشافات عن طريق إزالة المربعات المتداخلة ، وهو أمر مفيد لتقليل التكرارات.
imgsz int or tuple 640 يحدد حجم الصورة للاستدلال. يمكن أن يكون عددا صحيحا واحدا 640 لتغيير حجم المربع أو مجموعة (الارتفاع والعرض). يمكن أن يؤدي التحجيم المناسب إلى تحسين دقة الكشف وسرعة المعالجة.
half bool False تمكين الاستدلال بنصف الدقة (FP16) ، والذي يمكنه تسريع استدلال النموذج على وحدات معالجة الرسومات المدعومة بأقل تأثير على الدقة.
device str None يحدد جهاز الاستدلال (على سبيل المثال ، cpu, cuda:0 أو 0). يسمح للمستخدمين بالاختيار بين وحدة المعالجة المركزية أو وحدة معالجة رسومات معينة أو أجهزة حوسبة أخرى لتنفيذ النموذج.
max_det int 300 الحد الأقصى لعدد الاكتشافات المسموح بها لكل صورة. يحد من العدد الإجمالي للكائنات التي يمكن للنموذج اكتشافها في استدلال واحد، مما يمنع المخرجات الزائدة في المشاهد الكثيفة.
vid_stride int 1 خطوة الإطار لمدخلات الفيديو. يسمح بتخطي الإطارات في مقاطع الفيديو لتسريع المعالجة على حساب الدقة الزمنية. قيمة 1 تعالج كل إطار ، القيم الأعلى تتخطى الإطارات.
stream_buffer bool False يحدد ما إذا كان يجب تخزين كل الإطارات مؤقتا عند معالجة تدفقات الفيديو (True)، أو إذا كان يجب أن يعيد النموذج أحدث إطار (False). مفيد للتطبيقات في الوقت الحقيقي.
visualize bool False ينشط تصور ميزات النموذج أثناء الاستدلال ، مما يوفر رؤى حول ما "يراه" النموذج. مفيد لتصحيح الأخطاء وتفسير النموذج.
augment bool False يتيح زيادة وقت الاختبار (TTA) للتنبؤات ، مما قد يؤدي إلى تحسين متانة الكشف على حساب سرعة الاستدلال.
agnostic_nms bool False تمكين منع عدم الحد الأقصى (NMS) اللاأدري للفئة ، والذي يدمج المربعات المتداخلة لفئات مختلفة. مفيد في سيناريوهات الكشف متعددة الفئات حيث يكون تداخل الفئة شائعا.
classes list[int] None تصفية التوقعات إلى مجموعة من معرفات الفئة. سيتم إرجاع الاكتشافات التي تنتمي إلى الفئات المحددة فقط. مفيد للتركيز على الكائنات ذات الصلة في مهام الكشف متعددة الفئات.
retina_masks bool False يستخدم أقنعة تجزئة عالية الدقة إذا كانت متوفرة في النموذج. يمكن أن يؤدي ذلك إلى تحسين جودة القناع لمهام التجزئة ، مما يوفر تفاصيل أدق.
embed list[int] None يحدد الطبقات التي سيتم استخراج متجهات المعالم أو الدمجات منها. مفيد للمهام النهائية مثل التجميع أو البحث عن التشابه.

وسيطات التصور:

جدال نوع افتراضي وصف
show bool False لو True، يعرض الصور أو مقاطع الفيديو المشروحة في نافذة. مفيد للملاحظات المرئية الفورية أثناء التطوير أو الاختبار.
save bool False يتيح حفظ الصور أو مقاطع الفيديو المشروحة إلى ملف. مفيد للتوثيق أو التحليل الإضافي أو مشاركة النتائج.
save_frames bool False عند معالجة مقاطع الفيديو ، يحفظ الإطارات الفردية كصور. مفيد لاستخراج إطارات محددة أو لتحليل مفصل لكل إطار على حدة.
save_txt bool False يحفظ نتائج الكشف في ملف نصي، باتباع التنسيق [class] [x_center] [y_center] [width] [height] [confidence]. مفيد للتكامل مع أدوات التحليل الأخرى.
save_conf bool False يتضمن درجات الثقة في الملفات النصية المحفوظة. يعزز التفاصيل المتاحة للمعالجة اللاحقة والتحليل.
save_crop bool False يحفظ الصور التي تم اقتصاصها من الاكتشافات. مفيد لزيادة مجموعة البيانات أو تحليلها أو إنشاء مجموعات بيانات مركزة لكائنات محددة.
show_labels bool True يعرض تسميات لكل اكتشاف في الإخراج المرئي. يوفر فهما فوريا للكائنات المكتشفة.
show_conf bool True يعرض درجة الثقة لكل اكتشاف بجانب الملصق. يعطي نظرة ثاقبة على يقين النموذج لكل اكتشاف.
show_boxes bool True يرسم المربعات المحيطة حول الكائنات المكتشفة. ضروري للتحديد البصري وموقع الكائنات في الصور أو إطارات الفيديو.
line_width None or int None يحدد عرض خط المربعات المحيطة. لو None، يتم ضبط عرض الخط تلقائيا بناء على حجم الصورة. يوفر التخصيص المرئي للوضوح.

دليل التنبؤ

فال

إعدادات val (التحقق من الصحة) ل YOLO تتضمن النماذج العديد من المعلمات الفائقة والتكوينات المستخدمة لتقييم أداء النموذج على مجموعة بيانات التحقق من الصحة. تؤثر هذه الإعدادات على أداء النموذج وسرعته ودقته. شائع YOLO تتضمن إعدادات التحقق من الصحة حجم الدفعة وتكرار التحقق أثناء التدريب ومقاييس تقييم الأداء. تشمل العوامل الأخرى التي تؤثر على عملية التحقق من الصحة حجم مجموعة بيانات التحقق من الصحة وتكوينها ، بالإضافة إلى المهمة المحددة التي يتم استخدام النموذج من أجلها. يعد الضبط الدقيق والتجريب مع هذه الإعدادات أمرا بالغ الأهمية لضمان الأداء الأمثل لمجموعة بيانات التحقق من الصحة واكتشاف ومنع الإفراط في التجهيز.

مفتاح قيمة وصف
data None المسار إلى ملف البيانات ، أي coco128.yaml
imgsz 640 حجم الصور المدخلة كعدد صحيح
batch 16 عدد الصور لكل دفعة (-1 للدفعة التلقائية)
save_json False حفظ النتائج في ملف JSON
save_hybrid False حفظ النسخة المختلطة من التصنيفات (التسميات + التوقعات الإضافية)
conf 0.001 عتبة ثقة الكائن للكشف
iou 0.6 التقاطع على عتبة الاتحاد (IoU) ل NMS
max_det 300 الحد الأقصى لعدد الاكتشافات لكل صورة
half True استخدام نصف الدقة (FP16)
device None جهاز للتشغيل ، أي جهاز cuda = 0/1/2/3 أو الجهاز = وحدة المعالجة المركزية
dnn False استخدم OpenCV DNN ل ONNX استدلال
plots False حفظ المؤامرات والصور أثناء القطار / فال
rect False val مستطيل مع كل دفعة مرتبة للحد الأدنى من الحشو
split val تقسيم مجموعة البيانات لاستخدامها للتحقق من الصحة ، أي "VAL" أو "اختبار" أو "قطار"

دليل فال

تصدير

تصدير الإعدادات ل YOLO تشمل النماذج التكوينات والخيارات المتعلقة بحفظ النموذج أو تصديره للاستخدام في بيئات أو منصات مختلفة. يمكن أن تؤثر هذه الإعدادات على أداء النموذج وحجمه وتوافقه مع الأنظمة المختلفة. تتضمن إعدادات التصدير الرئيسية تنسيق ملف النموذج المصدر (على سبيل المثال ، ONNX, TensorFlow SavedModel)، والجهاز المستهدف (على سبيل المثال، وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU)، وميزات إضافية مثل الأقنعة أو التسميات المتعددة لكل صندوق. قد تتأثر عملية التصدير أيضا بالمهمة المحددة للنموذج ومتطلبات أو قيود بيئة الوجهة أو النظام الأساسي. من الأهمية بمكان تكوين هذه الإعدادات بعناية لضمان تحسين النموذج المصدر لحالة الاستخدام المقصودة ويعمل بشكل فعال في البيئة المستهدفة.

مفتاح قيمة وصف
format 'torchscript' تنسيق للتصدير إليه
imgsz 640 حجم الصورة كعدد قياسي أو قائمة (H ، W) ، أي (640 ، 480)
keras False استخدام Keras ل TF SavedModel تصدير
optimize False TorchScriptالتحسين للجوال:
half False تكميم FP16
int8 False تكميم INT8
dynamic False ONNX/TensorRTالمحاور الديناميكية:
simplify False ONNX/TensorRTتبسيط النموذج:
opset None ONNXإصدار Opset (اختياري ، افتراضي إلى أحدث):
workspace 4 TensorRTحجم مساحة العمل (جيجابايت):
nms False CoreMLإضافة NMS:

دليل التصدير

تكبير

إعدادات التعزيز ل YOLO تشير النماذج إلى التحولات والتعديلات المختلفة المطبقة على بيانات التدريب لزيادة تنوع وحجم مجموعة البيانات. يمكن أن تؤثر هذه الإعدادات على أداء النموذج وسرعته ودقته. بعض المشتركة YOLO تتضمن إعدادات التعزيز نوع وشدة التحويلات المطبقة (مثل التقلبات العشوائية ، والتدوير ، والاقتصاص ، وتغييرات اللون) ، والاحتمالية التي يتم بها تطبيق كل تحويل ، ووجود ميزات إضافية مثل الأقنعة أو التسميات المتعددة لكل صندوق. تشمل العوامل الأخرى التي قد تؤثر على عملية التعزيز حجم وتكوين مجموعة البيانات الأصلية والمهمة المحددة التي يتم استخدام النموذج من أجلها. من المهم ضبط هذه الإعدادات وتجربتها بعناية للتأكد من أن مجموعة البيانات المعززة متنوعة وتمثيلية بما يكفي لتدريب نموذج عالي الأداء.

مفتاح قيمة وصف
hsv_h 0.015 صورة HSV-Hue زيادة (الكسر)
hsv_s 0.7 صورة HSV- زيادة التشبع (الكسر)
hsv_v 0.4 صورة HSV- زيادة القيمة (كسر)
degrees 0.0 تدوير الصورة (+/- درجة)
translate 0.1 ترجمة الصور (+/- كسر)
scale 0.5 مقياس الصورة (+/- الكسب)
shear 0.0 قص الصورة (+/- درجة)
perspective 0.0 منظور الصورة (+/- الكسر) ، النطاق 0-0.001
flipud 0.0 قلب الصورة لأعلى لأسفل (احتمال)
fliplr 0.5 صورة الوجه من اليسار إلى اليمين (الاحتمال)
mosaic 1.0 صورة الفسيفساء (احتمال)
mixup 0.0 خلط الصور (احتمال)
copy_paste 0.0 نسخ ولصق المقطع (احتمال)
auto_augment 'randaugment' سياسة التعزيز التلقائي للتصنيف (RandAugment ، AutoAugment ، AUGMIX)
erasing 0.4 احتمال o محو عشوائي أثناء تدريب التصنيف (0-1) تدريب

التسجيل ونقاط التفتيش والتآمر وإدارة الملفات

يعد التسجيل ونقاط التفتيش والتآمر وإدارة الملفات من الاعتبارات المهمة عند تدريب YOLO نموذج.

  • التسجيل: غالبا ما يكون من المفيد تسجيل مقاييس وإحصائيات مختلفة أثناء التدريب لتتبع تقدم النموذج وتشخيص أي مشكلات قد تنشأ. يمكن القيام بذلك باستخدام مكتبة تسجيل مثل TensorBoard أو عن طريق كتابة رسائل السجل إلى ملف.
  • نقاط التفتيش: من الممارسات الجيدة حفظ نقاط التفتيش الخاصة بالنموذج على فترات منتظمة أثناء التدريب. يتيح لك ذلك استئناف التدريب من نقطة سابقة إذا تمت مقاطعة عملية التدريب أو إذا كنت ترغب في تجربة تكوينات تدريب مختلفة.
  • التخطيط: يمكن أن يكون تصور أداء النموذج وتقدم التدريب مفيدا لفهم كيفية تصرف النموذج وتحديد المشكلات المحتملة. يمكن القيام بذلك باستخدام مكتبة تخطيط مثل matplotlib أو عن طريق إنشاء مؤامرات باستخدام مكتبة تسجيل مثل TensorBoard.
  • إدارة الملفات: قد تكون إدارة الملفات المختلفة التي تم إنشاؤها أثناء عملية التدريب ، مثل نقاط فحص النموذج وملفات السجل والمؤامرات ، أمرا صعبا. من المهم أن يكون لديك بنية ملفات واضحة ومنظمة لتتبع هذه الملفات وتسهيل الوصول إليها وتحليلها حسب الحاجة.

يمكن أن يساعدك التسجيل الفعال ونقاط التفتيش والتخطيط وإدارة الملفات في تتبع تقدم النموذج وتسهيل تصحيح أخطاء عملية التدريب وتحسينها.

مفتاح قيمة وصف
project 'runs' اسم المشروع
name 'exp' اسم التجربة. exp يتم زيادتها تلقائيا إذا لم يتم تحديدها ، أي exp, exp2 ...
exist_ok False ما إذا كنت تريد الكتابة فوق التجربة الحالية
plots False حفظ المؤامرات أثناء القطار / فال
save False حفظ نقاط تفتيش القطارات وتوقع النتائج


تم النشر في 2023-11-12, اخر تحديث 2024-02-19
المؤلفون: Laughing-q (1) ، جلين جوشر (11) ، AyushExel (1) ، fcakyon (1) ، chr043416@gmail.com (1) ، tensorturtle (1)

التعليقات