تكوين
YOLO settings and hyperparameters play a critical role in the model's performance, speed, and accuracy. These settings and hyperparameters can affect the model's behavior at various stages of the model development process, including training, validation, and prediction.
شاهد: Mastering Ultralytics YOLO: Configuration
Ultralytics تستخدم الأوامر بناء الجملة التالي:
مثل
أين:
TASK
(اختياري) هو واحد من (الكشف عن, الجزء, جنس, تشكل, أوبب)MODE
(مطلوب) هو واحد من (قطار, فال, تنبأ, تصدير, المسار, المعيار)ARGS
(اختياري) هيarg=value
أزواج مثلimgsz=640
التي تتجاوز الإعدادات الافتراضية.
افتراضي ARG
يتم تعريف القيم في هذه الصفحة من cfg/defaults.yaml
ملف.
المهام
YOLO يمكن استخدام النماذج لمجموعة متنوعة من المهام ، بما في ذلك الكشف والتجزئة والتصنيف والوضع. تختلف هذه المهام في نوع المخرجات التي تنتجها والمشكلة المحددة التي تم تصميمها لحلها.
- كشف: لتحديد وتوطين الكائنات أو المناطق ذات الأهمية في صورة أو مقطع فيديو.
- الجزء: لتقسيم صورة أو مقطع فيديو إلى مناطق أو وحدات بكسل تتوافق مع كائنات أو فئات مختلفة.
- تصنيف: للتنبؤ بتسمية الفئة لصورة الإدخال.
- الوضعية: لتحديد الأشياء وتقدير نقاطها الرئيسية في صورة أو مقطع فيديو.
- OBB: صناديق محيطة موجهة (أي دوارة) مناسبة لصور الأقمار الصناعية أو الصور الطبية.
جدال | افتراضي | وصف |
---|---|---|
task | 'detect' | يحدد YOLO المهمة المراد تنفيذها. تشمل الخيارات detect for object detection, segment للتجزئة ، classify للتصنيف ، pose لتقدير الوضع و obb للمربعات المحيطة الموجهة. تم تصميم كل مهمة لأنواع محددة من المخرجات والمشاكل في تحليل الصور والفيديو. |
وسائط
YOLO يمكن استخدام النماذج في أوضاع مختلفة اعتمادا على المشكلة المحددة التي تحاول حلها. تتضمن هذه الأوضاع:
- Train: For training a YOLO11 model on a custom dataset.
- Val: For validating a YOLO11 model after it has been trained.
- Predict: For making predictions using a trained YOLO11 model on new images or videos.
- Export: For exporting a YOLO11 model to a format that can be used for deployment.
- Track: For tracking objects in real-time using a YOLO11 model.
- Benchmark: For benchmarking YOLO11 exports (ONNX, TensorRT, etc.) speed and accuracy.
جدال | افتراضي | وصف |
---|---|---|
mode | 'train' | يحدد الوضع الذي YOLO نموذج يعمل. الخيارات هي train للتدريب النموذجي ، val للتحقق من الصحة ، predict للاستدلال على البيانات الجديدة ، export لتحويل النموذج إلى تنسيقات النشر ، track لتتبع الكائنات، و benchmark لتقييم الأداء. تم تصميم كل وضع لمراحل مختلفة من دورة حياة النموذج ، من التطوير إلى النشر. |
إعدادات القطار
The training settings for YOLO models encompass various hyperparameters and configurations used during the training process. These settings influence the model's performance, speed, and accuracy. Key training settings include batch size, learning rate, momentum, and weight decay. Additionally, the choice of optimizer, loss function, and training dataset composition can impact the training process. Careful tuning and experimentation with these settings are crucial for optimizing performance.
جدال | افتراضي | وصف |
---|---|---|
model | None | يحدد ملف النموذج للتدريب. يقبل مسارا إلى أي منهما .pt نموذج تم تدريبه مسبقا أو أ .yaml ملف التكوين. ضروري لتحديد هيكل النموذج أو تهيئة الأوزان. |
data | None | المسار إلى ملف تكوين مجموعة البيانات (على سبيل المثال، coco8.yaml ). This file contains dataset-specific parameters, including paths to training and validation data, class names, and number of classes. |
epochs | 100 | Total number of training epochs. Each epoch represents a full pass over the entire dataset. Adjusting this value can affect training duration and model performance. |
time | None | الحد الأقصى لوقت التدريب بالساعات. إذا تم تعيينه، فإن هذا يتجاوز epochs وسيطة ، مما يسمح للتدريب بالتوقف تلقائيا بعد المدة المحددة. مفيد لسيناريوهات التدريب المقيدة بالوقت. |
patience | 100 | Number of epochs to wait without improvement in validation metrics before early stopping the training. Helps prevent overfitting by stopping training when performance plateaus. |
batch | 16 | Batch size, with three modes: set as an integer (e.g., batch=16 )، الوضع التلقائي لاستخدام الذاكرة بنسبة 60% GPU (batch=-1 )، أو الوضع التلقائي مع جزء استخدام محدد (batch=0.70 ). |
imgsz | 640 | Target image size for training. All images are resized to this dimension before being fed into the model. Affects model accuracy and computational complexity. |
save | True | Enables saving of training checkpoints and final model weights. Useful for resuming training or model deployment. |
save_period | -1 | تواتر نقاط التفتيش النموذجية المحفوظة ، المحددة في العصور. تؤدي القيمة -1 إلى تعطيل هذه الميزة. مفيد لحفظ النماذج المؤقتة أثناء جلسات التدريب الطويلة. |
cache | False | تمكين التخزين المؤقت لصور مجموعة البيانات في الذاكرة (True /ram )، على القرص (disk )، أو تعطيله (False ). يحسن سرعة التدريب عن طريق تقليل إدخال/إخراج القرص على حساب زيادة استخدام الذاكرة. |
device | None | يحدد الجهاز (الأجهزة) الحسابية للتدريب: جهاز (أجهزة) حسابية واحدة GPU (device=0 ) ، ووحدات معالجة رسومات متعددة (device=0,1 )، CPU (device=cpu )، أو MPS لسيليكون Apple (device=mps ). |
workers | 8 | عدد مؤشرات الترابط العاملة لتحميل البيانات (لكل RANK إذا كان التدريب متعددGPU ). يؤثر على سرعة المعالجة المسبقة للبيانات وتغذيتها في النموذج، وهو مفيد بشكل خاص في الإعدادات المتعددةGPU . |
project | None | اسم دليل المشروع حيث يتم حفظ مخرجات التدريب. يسمح بالتخزين المنظم للتجارب المختلفة. |
name | None | اسم تشغيل التدريب. يستخدم لإنشاء دليل فرعي داخل مجلد المشروع ، حيث يتم تخزين سجلات التدريب والمخرجات. |
exist_ok | False | إذا كان صحيحا ، يسمح بالكتابة فوق دليل مشروع / اسم موجود. مفيد للتجربة التكرارية دون الحاجة إلى مسح المخرجات السابقة يدويا. |
pretrained | True | يحدد ما إذا كان سيبدأ التدريب من نموذج تم تدريبه مسبقا. يمكن أن تكون قيمة منطقية أو مسار سلسلة إلى نموذج معين يتم من خلاله تحميل الأوزان. يعزز كفاءة التدريب وأداء النموذج. |
optimizer | 'auto' | اختيار محسن للتدريب. تشمل الخيارات SGD , Adam , AdamW , NAdam , RAdam , RMSProp إلخ، أو auto للاختيار التلقائي بناء على تكوين النموذج. يؤثر على سرعة التقارب والاستقرار. |
verbose | False | تمكين الإخراج المطول أثناء التدريب ، وتوفير سجلات مفصلة وتحديثات التقدم. مفيد لتصحيح الأخطاء ومراقبة عملية التدريب عن كثب. |
seed | 0 | يحدد البذور العشوائية للتدريب ، مما يضمن إمكانية تكرار النتائج عبر عمليات التشغيل بنفس التكوينات. |
deterministic | True | يفرض استخدام الخوارزمية الحتمية ، مما يضمن قابلية التكرار ولكنه قد يؤثر على الأداء والسرعة بسبب القيود المفروضة على الخوارزميات غير الحتمية. |
single_cls | False | يعامل جميع الفئات في مجموعات البيانات متعددة الفئات كفئة واحدة أثناء التدريب. مفيد لمهام التصنيف الثنائي أو عند التركيز على وجود الكائن بدلا من التصنيف. |
rect | False | يتيح التدريب المستطيل ، وتحسين تكوين الدفعات للحد الأدنى من الحشو. يمكن أن يحسن الكفاءة والسرعة ولكنه قد يؤثر على دقة النموذج. |
cos_lr | False | Utilizes a cosine learning rate scheduler, adjusting the learning rate following a cosine curve over epochs. Helps in managing learning rate for better convergence. |
close_mosaic | 10 | Disables mosaic data augmentation in the last N epochs to stabilize training before completion. Setting to 0 disables this feature. |
resume | False | يستأنف التدريب من آخر نقطة تفتيش محفوظة. يقوم تلقائيا بتحميل أوزان النموذج وحالة المحسن وعدد العصور، مع مواصلة التدريب بسلاسة. |
amp | True | Enables Automatic Mixed Precision (AMP) training, reducing memory usage and possibly speeding up training with minimal impact on accuracy. |
fraction | 1.0 | يحدد جزء مجموعة البيانات المراد استخدامه للتدريب. يسمح بالتدريب على مجموعة فرعية من مجموعة البيانات الكاملة ، وهو مفيد للتجارب أو عندما تكون الموارد محدودة. |
profile | False | تمكين التنميط من ONNX و TensorRT سرعات أثناء التدريب ، مفيدة لتحسين نشر النموذج. |
freeze | None | Freezes the first N layers of the model or specified layers by index, reducing the number of trainable parameters. Useful for fine-tuning or transfer learning. |
lr0 | 0.01 | معدل التعلم الأولي (أي SGD=1E-2 , Adam=1E-3 ) . يعد ضبط هذه القيمة أمرا بالغ الأهمية لعملية التحسين ، مما يؤثر على مدى سرعة تحديث أوزان النموذج. |
lrf | 0.01 | معدل التعلم النهائي كجزء من المعدل الأولي = (lr0 * lrf )، تستخدم جنبا إلى جنب مع برامج الجدولة لضبط معدل التعلم بمرور الوقت. |
momentum | 0.937 | Momentum factor for SGD or beta1 for Adam optimizers, influencing the incorporation of past gradients in the current update. |
weight_decay | 0.0005 | L2 regularization term, penalizing large weights to prevent overfitting. |
warmup_epochs | 3.0 | عدد فترات الإحماء لمعدل التعلم ، وزيادة معدل التعلم تدريجيا من قيمة منخفضة إلى معدل التعلم الأولي لتحقيق الاستقرار في التدريب في وقت مبكر. |
warmup_momentum | 0.8 | الزخم الأولي لمرحلة الإحماء ، والتكيف تدريجيا مع الزخم المحدد خلال فترة الإحماء. |
warmup_bias_lr | 0.1 | معدل التعلم لمعلمات التحيز خلال مرحلة الإحماء ، مما يساعد على استقرار تدريب النموذج في العصور الأولية. |
box | 7.5 | Weight of the box loss component in the loss function, influencing how much emphasis is placed on accurately predicting bounding box coordinates. |
cls | 0.5 | وزن خسارة التصنيف في دالة الخسارة الكلية ، مما يؤثر على أهمية التنبؤ الصحيح بالفئة بالنسبة للمكونات الأخرى. |
dfl | 1.5 | وزن الخسارة البؤرية للتوزيع ، المستخدمة في بعض YOLO إصدارات للتصنيف الدقيق الحبيبات. |
pose | 12.0 | وزن فقدان الوضع في النماذج المدربة على تقدير الوضع ، مما يؤثر على التركيز على التنبؤ بدقة بالنقاط الرئيسية. |
kobj | 2.0 | وزن فقدان كائن النقطة الرئيسية في نماذج تقدير الوضع ، وتحقيق التوازن بين ثقة الكشف ودقة الوضع. |
label_smoothing | 0.0 | يمكن أن يؤدي تطبيق تجانس الملصقات ، وتليين الملصقات الصلبة على مزيج من الملصق المستهدف والتوزيع الموحد على الملصقات ، إلى تحسين التعميم. |
nbs | 64 | حجم الدفعة الاسمي لتطبيع الخسارة. |
overlap_mask | True | Determines whether segmentation masks should overlap during training, applicable in instance segmentation tasks. |
mask_ratio | 4 | نسبة العينة السفلية لأقنعة التجزئة ، مما يؤثر على دقة الأقنعة المستخدمة أثناء التدريب. |
dropout | 0.0 | معدل التسرب لتسوية مهام التصنيف ، ومنع الإفراط في التجهيز عن طريق حذف الوحدات بشكل عشوائي أثناء التدريب. |
val | True | يتيح التحقق من الصحة أثناء التدريب ، مما يسمح بالتقييم الدوري لأداء النموذج على مجموعة بيانات منفصلة. |
plots | False | يقوم بإنشاء وحفظ مخططات مقاييس التدريب والتحقق من الصحة، بالإضافة إلى أمثلة التنبؤ، مما يوفر رؤى مرئية حول أداء النموذج وتقدم التعلم. |
ملاحظة حول إعدادات حجم الدفعة
ال batch
يمكن تكوين الوسيطة بثلاث طرق:
- Fixed Batch Size: تعيين قيمة صحيحة (على سبيل المثال,
batch=16
)، مع تحديد عدد الصور لكل دفعة مباشرة. - الوضع التلقائي (60% GPU ذاكرة ): الاستخدام
batch=-1
لضبط حجم الدُفعات تلقائيًا للحصول على استخدام ذاكرة CUDA بنسبة 60% تقريبًا. - الوضع التلقائي مع جزء الاستخدام: تعيين قيمة الكسر (على سبيل المثال,
batch=0.70
) لضبط حجم الدفعة بناءً على الجزء المحدد من استخدام الذاكرة GPU .
توقع الإعدادات
إعدادات التنبؤ ل YOLO تشمل النماذج مجموعة من المعلمات والتكوينات الفائقة التي تؤثر على أداء النموذج وسرعته ودقته أثناء الاستدلال على البيانات الجديدة. يعد الضبط الدقيق والتجريب مع هذه الإعدادات أمرا ضروريا لتحقيق الأداء الأمثل لمهمة محددة. تتضمن الإعدادات الرئيسية حد الثقة وعتبة الإلغاء غير الأقصى (NMS) وعدد الفئات التي تم النظر فيها. العوامل الإضافية التي تؤثر على عملية التنبؤ هي حجم بيانات الإدخال وشكلها ، ووجود ميزات تكميلية مثل الأقنعة أو الملصقات المتعددة لكل صندوق ، والمهمة الخاصة التي يتم استخدام النموذج من أجلها.
حجج الاستدلال:
جدال | نوع | افتراضي | وصف |
---|---|---|---|
source | str | 'ultralytics/assets' | Specifies the data source for inference. Can be an image path, video file, directory, URL, or device ID for live feeds. Supports a wide range of formats and sources, enabling flexible application across different types of input. |
conf | float | 0.25 | يعين الحد الأدنى للثقة للاكتشافات. سيتم تجاهل الكائنات المكتشفة بثقة أقل من هذا الحد. يمكن أن يساعد ضبط هذه القيمة في تقليل الإيجابيات الخاطئة. |
iou | float | 0.7 | Intersection Over Union (IoU) threshold for Non-Maximum Suppression (NMS). Lower values result in fewer detections by eliminating overlapping boxes, useful for reducing duplicates. |
imgsz | int or tuple | 640 | يحدد حجم الصورة للاستدلال. يمكن أن يكون عددا صحيحا واحدا 640 for square resizing or a (height, width) tuple. Proper sizing can improve detection accuracy and processing speed. |
half | bool | False | Enables half-precision (FP16) inference, which can speed up model inference on supported GPUs with minimal impact on accuracy. |
device | str | None | يحدد جهاز الاستدلال (على سبيل المثال ، cpu , cuda:0 أو 0 ). يسمح للمستخدمين بالاختيار بين CPU ، أو جهاز GPU معين، أو أجهزة حوسبة أخرى لتنفيذ النموذج. |
max_det | int | 300 | الحد الأقصى لعدد الاكتشافات المسموح بها لكل صورة. يحد من العدد الإجمالي للكائنات التي يمكن للنموذج اكتشافها في استدلال واحد، مما يمنع المخرجات الزائدة في المشاهد الكثيفة. |
vid_stride | int | 1 | خطوة الإطار لمدخلات الفيديو. يسمح بتخطي الإطارات في مقاطع الفيديو لتسريع المعالجة على حساب الدقة الزمنية. قيمة 1 تعالج كل إطار ، القيم الأعلى تتخطى الإطارات. |
stream_buffer | bool | False | Determines whether to queue incoming frames for video streams. If False , old frames get dropped to accomodate new frames (optimized for real-time applications). If `True', queues new frames in a buffer, ensuring no frames get skipped, but will cause latency if inference FPS is lower than stream FPS. |
visualize | bool | False | ينشط تصور ميزات النموذج أثناء الاستدلال ، مما يوفر رؤى حول ما "يراه" النموذج. مفيد لتصحيح الأخطاء وتفسير النموذج. |
augment | bool | False | يتيح زيادة وقت الاختبار (TTA) للتنبؤات ، مما قد يؤدي إلى تحسين متانة الكشف على حساب سرعة الاستدلال. |
agnostic_nms | bool | False | تمكين منع عدم الحد الأقصى (NMS) اللاأدري للفئة ، والذي يدمج المربعات المتداخلة لفئات مختلفة. مفيد في سيناريوهات الكشف متعددة الفئات حيث يكون تداخل الفئة شائعا. |
classes | list[int] | None | تصفية التوقعات إلى مجموعة من معرفات الفئة. سيتم إرجاع الاكتشافات التي تنتمي إلى الفئات المحددة فقط. مفيد للتركيز على الكائنات ذات الصلة في مهام الكشف متعددة الفئات. |
retina_masks | bool | False | يستخدم أقنعة تجزئة عالية الدقة إذا كانت متوفرة في النموذج. يمكن أن يؤدي ذلك إلى تحسين جودة القناع لمهام التجزئة ، مما يوفر تفاصيل أدق. |
embed | list[int] | None | Specifies the layers from which to extract feature vectors or embeddings. Useful for downstream tasks like clustering or similarity search. |
وسيطات التصور:
جدال | نوع | افتراضي | وصف |
---|---|---|---|
show | bool | False | لو True ، يعرض الصور أو مقاطع الفيديو المشروحة في نافذة. مفيد للملاحظات المرئية الفورية أثناء التطوير أو الاختبار. |
save | bool | False أو True | Enables saving of the annotated images or videos to file. Useful for documentation, further analysis, or sharing results. Defaults to True when using CLI & False when used in Python. |
save_frames | bool | False | عند معالجة مقاطع الفيديو ، يحفظ الإطارات الفردية كصور. مفيد لاستخراج إطارات محددة أو لتحليل مفصل لكل إطار على حدة. |
save_txt | bool | False | يحفظ نتائج الكشف في ملف نصي، باتباع التنسيق [class] [x_center] [y_center] [width] [height] [confidence] . مفيد للتكامل مع أدوات التحليل الأخرى. |
save_conf | bool | False | يتضمن درجات الثقة في الملفات النصية المحفوظة. يعزز التفاصيل المتاحة للمعالجة اللاحقة والتحليل. |
save_crop | bool | False | يحفظ الصور التي تم اقتصاصها من الاكتشافات. مفيد لزيادة مجموعة البيانات أو تحليلها أو إنشاء مجموعات بيانات مركزة لكائنات محددة. |
show_labels | bool | True | يعرض تسميات لكل اكتشاف في الإخراج المرئي. يوفر فهما فوريا للكائنات المكتشفة. |
show_conf | bool | True | يعرض درجة الثقة لكل اكتشاف بجانب الملصق. يعطي نظرة ثاقبة على يقين النموذج لكل اكتشاف. |
show_boxes | bool | True | يرسم المربعات المحيطة حول الكائنات المكتشفة. ضروري للتحديد البصري وموقع الكائنات في الصور أو إطارات الفيديو. |
line_width | None أو int | None | يحدد عرض خط المربعات المحيطة. لو None ، يتم ضبط عرض الخط تلقائيا بناء على حجم الصورة. يوفر التخصيص المرئي للوضوح. |
إعدادات التحقق من الصحة
إعدادات val (التحقق من الصحة) ل YOLO تتضمن النماذج العديد من المعلمات الفائقة والتكوينات المستخدمة لتقييم أداء النموذج على مجموعة بيانات التحقق من الصحة. تؤثر هذه الإعدادات على أداء النموذج وسرعته ودقته. شائع YOLO تتضمن إعدادات التحقق من الصحة حجم الدفعة وتكرار التحقق أثناء التدريب ومقاييس تقييم الأداء. تشمل العوامل الأخرى التي تؤثر على عملية التحقق من الصحة حجم مجموعة بيانات التحقق من الصحة وتكوينها ، بالإضافة إلى المهمة المحددة التي يتم استخدام النموذج من أجلها.
جدال | نوع | افتراضي | وصف |
---|---|---|---|
data | str | None | يحدد المسار إلى ملف تكوين مجموعة البيانات (على سبيل المثال، coco8.yaml ). This file includes paths to validation data, class names, and number of classes. |
imgsz | int | 640 | يحدد حجم الصور المدخلة. يتم تغيير حجم جميع الصور إلى هذا البعد قبل المعالجة. |
batch | int | 16 | يضبط عدد الصور لكل دفعة. استخدام -1 للدفعات التلقائية، والتي يتم ضبطها تلقائيًا بناءً على توفر الذاكرة GPU . |
save_json | bool | False | لو True ، يحفظ النتائج في ملف JSON لمزيد من التحليل أو التكامل مع الأدوات الأخرى. |
save_hybrid | bool | False | لو True ، يحفظ إصدارا مختلطا من التسميات يجمع بين التعليقات التوضيحية الأصلية وتنبؤات النموذج الإضافية. |
conf | float | 0.001 | يعين الحد الأدنى للثقة للاكتشافات. يتم تجاهل الاكتشافات بثقة أقل من هذا الحد. |
iou | float | 0.6 | Sets the Intersection Over Union (IoU) threshold for Non-Maximum Suppression (NMS). Helps in reducing duplicate detections. |
max_det | int | 300 | يحد من الحد الأقصى لعدد الاكتشافات لكل صورة. مفيد في المشاهد الكثيفة لمنع الاكتشافات المفرطة. |
half | bool | True | Enables half-precision (FP16) computation, reducing memory usage and potentially increasing speed with minimal impact on accuracy. |
device | str | None | يحدد الجهاز للتحقق من صحته (cpu , cuda:0 إلخ). يتيح المرونة في استخدام الموارد CPU أو GPU . |
dnn | bool | False | لو True , uses the أوبن سي في DNN module for ONNX model inference, offering an alternative to PyTorch inference methods. |
plots | bool | False | عند الضبط على True ، يولد ويحفظ مخططات التنبؤات مقابل الحقيقة الأرضية للتقييم البصري لأداء النموذج. |
rect | bool | False | لو True ، يستخدم الاستدلال المستطيل للتجميع وتقليل الحشو وربما زيادة السرعة والكفاءة. |
split | str | val | يحدد تقسيم مجموعة البيانات المراد استخدامه للتحقق من الصحة (val , test أو train ). يتيح المرونة في اختيار شريحة البيانات لتقييم الأداء. |
Careful tuning and experimentation with these settings are crucial to ensure optimal performance on the validation dataset and detect and prevent overfitting.
إعدادات التصدير
تشمل إعدادات التصدير لنماذج YOLO التكوينات والخيارات المتعلقة بحفظ النموذج أو تصديره لاستخدامه في بيئات أو منصات مختلفة. يمكن أن تؤثر هذه الإعدادات على أداء النموذج وحجمه وتوافقه مع الأنظمة المختلفة. تتضمن إعدادات التصدير الرئيسية تنسيق ملف النموذج المُصدَّر (على سبيل المثال، ONNX ، TensorFlow SavedModel )، والجهاز المستهدف (على سبيل المثال، CPU ، GPU)، وميزات إضافية مثل الأقنعة أو التسميات المتعددة لكل مربع. قد تتأثر عملية التصدير أيضًا بالمهمة المحددة للنموذج ومتطلبات أو قيود البيئة أو المنصة الوجهة.
جدال | نوع | افتراضي | وصف |
---|---|---|---|
format | str | 'torchscript' | التنسيق الهدف للنموذج المصدر، مثل 'onnx' , 'torchscript' , 'tensorflow' ، أو غيرها، تحديد التوافق مع بيئات النشر المختلفة. |
imgsz | int أو tuple | 640 | حجم الصورة المطلوب لإدخال النموذج. يمكن أن يكون عددا صحيحا للصور المربعة أو مجموعة (height, width) لأبعاد محددة. |
keras | bool | False | Enables export to Keras format for TensorFlow SavedModel, providing compatibility with TensorFlow serving and APIs. |
optimize | bool | False | يطبق التحسين للأجهزة المحمولة عند التصدير إلى TorchScript، مما قد يقلل من حجم النموذج ويحسن الأداء. |
half | bool | False | تمكين التكميم FP16 (نصف الدقة) ، مما يقلل من حجم النموذج ويحتمل أن يسرع الاستدلال على الأجهزة المدعومة. |
int8 | bool | False | Activates INT8 quantization, further compressing the model and speeding up inference with minimal accuracy loss, primarily for edge devices. |
dynamic | bool | False | يسمح بأحجام إدخال ديناميكية للصادرات ONNX و TensorRT و OpenVINO ، مما يعزز المرونة في التعامل مع أبعاد الصور المختلفة. |
simplify | bool | True | يبسط الرسم البياني النموذجي ل ONNX الصادرات مع onnxslim ، مما قد يؤدي إلى تحسين الأداء والتوافق. |
opset | int | None | يحدد ONNX إصدار Opset للتوافق مع مختلف ONNX المحللون وأوقات التشغيل. إذا لم يتم تعيينه، يستخدم أحدث إصدار مدعوم. |
workspace | float | 4.0 | يضبط الحد الأقصى لحجم مساحة العمل بالجيغابايت من أجل تحسينات TensorRT ، وتحقيق التوازن بين استخدام الذاكرة والأداء. |
nms | bool | False | يضيف منع غير أقصى (NMS) إلى CoreML التصدير ، ضروري للكشف الدقيق والفعال بعد المعالجة. |
batch | int | 1 | يحدد حجم الاستدلال على دفعة نموذج التصدير أو الحد الأقصى لعدد الصور التي سيعالجها النموذج المصدر بشكل متزامن في predict الوضع. |
من الأهمية بمكان تكوين هذه الإعدادات بعناية لضمان تحسين النموذج المصدر لحالة الاستخدام المقصودة ويعمل بشكل فعال في البيئة المستهدفة.
إعدادات التعزيز
Augmentation techniques are essential for improving the robustness and performance of YOLO models by introducing variability into the training data, helping the model generalize better to unseen data. The following table outlines the purpose and effect of each augmentation argument:
جدال | نوع | افتراضي | نطاق | وصف |
---|---|---|---|---|
hsv_h | float | 0.015 | 0.0 - 1.0 | يضبط تدرج الصورة بجزء من عجلة الألوان، مما يؤدي إلى تباين اللون. يساعد النموذج على التعميم عبر ظروف الإضاءة المختلفة. |
hsv_s | float | 0.7 | 0.0 - 1.0 | يغير تشبع الصورة بكسر، مما يؤثر على كثافة الألوان. مفيد لمحاكاة الظروف البيئية المختلفة. |
hsv_v | float | 0.4 | 0.0 - 1.0 | يعدل قيمة (سطوع) الصورة بمقدار كسر ، مما يساعد النموذج على الأداء الجيد في ظل ظروف الإضاءة المختلفة. |
degrees | float | 0.0 | -180 - +180 | يقوم بتدوير الصورة عشوائيا ضمن نطاق الدرجة المحدد، مما يحسن قدرة النموذج على التعرف على الكائنات في اتجاهات مختلفة. |
translate | float | 0.1 | 0.0 - 1.0 | يترجم الصورة أفقيا وعموديا بجزء صغير من حجم الصورة ، مما يساعد في تعلم اكتشاف الأشياء المرئية جزئيا. |
scale | float | 0.5 | >=0.0 | يقيس الصورة بعامل كسب، ويحاكي الكائنات على مسافات مختلفة من الكاميرا. |
shear | float | 0.0 | -180 - +180 | يقص الصورة بدرجة محددة، ويحاكي تأثير الكائنات التي يتم عرضها من زوايا مختلفة. |
perspective | float | 0.0 | 0.0 - 0.001 | يطبق تحويل منظور عشوائي على الصورة ، مما يعزز قدرة النموذج على فهم الكائنات في مساحة 3D. |
flipud | float | 0.0 | 0.0 - 1.0 | يقلب الصورة رأسا على عقب مع الاحتمال المحدد، مما يزيد من تباين البيانات دون التأثير على خصائص الكائن. |
fliplr | float | 0.5 | 0.0 - 1.0 | يقلب الصورة من اليسار إلى اليمين بالاحتمال المحدد ، وهو مفيد لتعلم الكائنات المتماثلة وزيادة تنوع مجموعة البيانات. |
bgr | float | 0.0 | 0.0 - 1.0 | يقلب قنوات الصورة من RGB إلى BGR بالاحتمال المحدد، مفيد لزيادة المتانة لترتيب القنوات غير الصحيح. |
mosaic | float | 1.0 | 0.0 - 1.0 | يجمع بين أربع صور تدريب في صورة واحدة ، ويحاكي تركيبات المشهد المختلفة وتفاعلات الكائنات. فعالة للغاية لفهم المشهد المعقد. |
mixup | float | 0.0 | 0.0 - 1.0 | يمزج صورتين وعناوينهما، مما يخلق صورة مركبة. يعزز قدرة النموذج على التعميم من خلال إدخال ضوضاء التسمية والتباين البصري. |
copy_paste | float | 0.0 | 0.0 - 1.0 | ينسخ كائنات من صورة ويلصقها على صورة أخرى، مفيد لزيادة تواجدات الكائن وتعلم انسداد الكائن. |
copy_paste_mode | str | flip | - | Copy-Paste augmentation method selection among the options of ("flip" , "mixup" ). |
auto_augment | str | randaugment | - | يطبق تلقائيا سياسة زيادة محددة مسبقا (randaugment , autoaugment , augmix ) ، وتحسين مهام التصنيف من خلال تنويع الميزات المرئية. |
erasing | float | 0.4 | 0.0 - 0.9 | يمحو بشكل عشوائي جزءا من الصورة أثناء التدريب على التصنيف ، مما يشجع النموذج على التركيز على الميزات الأقل وضوحا للتعرف عليها. |
crop_fraction | float | 1.0 | 0.1 - 1.0 | يقصاص صورة التصنيف إلى جزء صغير من حجمها للتأكيد على الميزات المركزية والتكيف مع مقاييس الكائن، مما يقلل من تشتيت الخلفية. |
يمكن ضبط هذه الإعدادات لتلبية المتطلبات المحددة لمجموعة البيانات والمهمة المطروحة. يمكن أن تساعد تجربة قيم مختلفة في العثور على استراتيجية التعزيز المثلى التي تؤدي إلى أفضل أداء للنموذج.
إعدادات التسجيل ونقاط التفتيش والتخطيط
يعد التسجيل ونقاط التفتيش والتآمر وإدارة الملفات من الاعتبارات المهمة عند تدريب YOLO نموذج.
- التسجيل: غالبا ما يكون من المفيد تسجيل مقاييس وإحصائيات مختلفة أثناء التدريب لتتبع تقدم النموذج وتشخيص أي مشكلات قد تنشأ. يمكن القيام بذلك باستخدام مكتبة تسجيل مثل TensorBoard أو عن طريق كتابة رسائل السجل إلى ملف.
- نقاط التفتيش: من الممارسات الجيدة حفظ نقاط التفتيش الخاصة بالنموذج على فترات منتظمة أثناء التدريب. يتيح لك ذلك استئناف التدريب من نقطة سابقة إذا تمت مقاطعة عملية التدريب أو إذا كنت ترغب في تجربة تكوينات تدريب مختلفة.
- التخطيط: يمكن أن يكون تصور أداء النموذج وتقدم التدريب مفيدا لفهم كيفية تصرف النموذج وتحديد المشكلات المحتملة. يمكن القيام بذلك باستخدام مكتبة تخطيط مثل matplotlib أو عن طريق إنشاء مؤامرات باستخدام مكتبة تسجيل مثل TensorBoard.
- إدارة الملفات: قد تكون إدارة الملفات المختلفة التي تم إنشاؤها أثناء عملية التدريب ، مثل نقاط فحص النموذج وملفات السجل والمؤامرات ، أمرا صعبا. من المهم أن يكون لديك بنية ملفات واضحة ومنظمة لتتبع هذه الملفات وتسهيل الوصول إليها وتحليلها حسب الحاجة.
يمكن أن يساعدك التسجيل الفعال ونقاط التفتيش والتخطيط وإدارة الملفات في تتبع تقدم النموذج وتسهيل تصحيح أخطاء عملية التدريب وتحسينها.
جدال | افتراضي | وصف |
---|---|---|
project | 'runs' | يحدد الدليل الجذر لحفظ عمليات تشغيل التدريب. سيتم حفظ كل تشغيل في دليل فرعي منفصل داخل هذا الدليل. |
name | 'exp' | يحدد اسم التجربة. إذا لم يتم تحديده ، YOLO زيادة هذا الاسم تلقائيا لكل تشغيل ، على سبيل المثال ، exp , exp2 ، وما إلى ذلك، لتجنب الكتابة فوق التجارب السابقة. |
exist_ok | False | يحدد هذا الإعداد ما إذا كان سيتم استبدال دليل تجربة حالي إذا كان الدليل الذي يحمل الاسم نفسه موجودا بالفعل. تعيين هذا إلى True يسمح بالكتابة فوقها ، بينما False يمنع ذلك. |
plots | False | يتحكم في إنشاء وحفظ مؤامرات التدريب والتحقق من الصحة. اضبط على True to create plots such as loss curves, precision-recall curves, and sample predictions. Useful for visually tracking model performance over time. |
save | False | تمكن من توفير نقاط التفتيش التدريبية وأوزان النموذج النهائي. اضبط على True لحفظ الدول النموذجية بشكل دوري ، مما يسمح باستئناف التدريب من نقاط التفتيش هذه أو النماذج التي سيتم نشرها. |
الأسئلة المتداولة
كيف يمكنني تحسين أداء نموذجي YOLO أثناء التدريب؟
Improving YOLO model performance involves tuning hyperparameters like batch size, learning rate, momentum, and weight decay. Adjusting augmentation settings, selecting the right optimizer, and employing techniques like early stopping or mixed precision can also help. For detailed guidance on training settings, refer to the Train Guide.
ما هي المعلمات الفائقة الرئيسية التي يجب أخذها في الاعتبار من أجل دقة النموذج YOLO ؟
تتضمن المعلمات الفائقة الرئيسية التي تؤثر على دقة النموذج YOLO ما يلي:
- حجم الدفعة (
batch
): يمكن أن تؤدي أحجام الدفعات الأكبر إلى استقرار التدريب ولكنها قد تتطلب المزيد من الذاكرة. - معدل التعلم (
lr0
): يتحكم في حجم الخطوة لتحديثات الوزن؛ المعدلات الأصغر توفر تعديلات دقيقة ولكن التقارب بطيء. - الزخم (
momentum
): يساعد على تسريع متجهات التدرج في الاتجاهات الصحيحة، مما يخفف من التذبذبات. - حجم الصورة (
imgsz
): يمكن أن تؤدي أحجام الصور الأكبر إلى تحسين الدقة ولكنها تزيد من العبء الحسابي.
اضبط هذه القيم بناءً على مجموعة بياناتك وقدرات أجهزتك. استكشف المزيد في قسم إعدادات القطار.
كيف يمكنني تعيين معدل التعلم لتدريب نموذج YOLO ؟
معدل التعلم (lr0
) أمر بالغ الأهمية للتحسين. نقطة البداية الشائعة هي 0.01
بالدولار السنغافوري أو 0.001
لآدم. من الضروري مراقبة مقاييس التدريب وتعديلها إذا لزم الأمر. استخدم جداول معدل تعلم جيب التمام (cos_lr
) أو تقنيات الإحماء (warmup_epochs
, warmup_momentum
) لتعديل المعدل ديناميكيًا أثناء التدريب. اعثر على مزيد من التفاصيل في دليل القطار.
ما هي إعدادات الاستدلال الافتراضية لنماذج YOLO ؟
تتضمن إعدادات الاستدلال الافتراضية ما يلي:
- عتبة الثقة (
conf=0.25
): الحد الأدنى من الثقة للاكتشافات. - عتبة IoU (
iou=0.7
): للقمع غير الأقصى (NMS). - حجم الصورة (
imgsz=640
): تغيير حجم الصور المدخلة قبل الاستدلال. - الجهاز (
device=None
): Selects CPU or GPU for inference. For a comprehensive overview, visit the توقع الإعدادات وقسم دليل التنبؤ.
لماذا يجب استخدام التدريب الدقيق المختلط مع نماذج YOLO ؟
تدريب دقيق مختلط، ممكّن مع amp=True
يساعد على تقليل استخدام الذاكرة ويمكنه تسريع التدريب من خلال الاستفادة من مزايا كل من FP16 وFP32. هذا الأمر مفيد لوحدات معالجة الرسومات الحديثة، التي تدعم الدقة المختلطة في الأصل، مما يسمح بتضمين المزيد من النماذج في الذاكرة وتمكين إجراء عمليات حسابية أسرع دون خسارة كبيرة في الدقة. تعرف على المزيد حول هذا الأمر في دليل القطار.