Prédiction de modèle avec Ultralytics YOLO
Introduction
Dans le monde de l'apprentissage automatique et de la vision par ordinateur, le processus visant à donner un sens aux données visuelles est souvent appelé inférence ou prédiction. Ultralytics YOLO26 propose une fonctionnalité puissante appelée mode prédiction, conçue pour une inférence haute performance en temps réel sur une large gamme de sources de données.
Watch: How to Extract Results from Ultralytics YOLO26 Tasks for Custom Projects 🚀
Applications concrètes
| Fabrication | Sports | Sécurité |
|---|---|---|
![]() | ![]() | ![]() |
| Détection de pièces détachées automobiles | Détection de joueurs de football | Détection de chute de personnes |
Pourquoi utiliser Ultralytics YOLO pour l'inférence ?
Voici pourquoi tu devrais envisager le mode prédiction de YOLO26 pour tes divers besoins d'inférence :
- Polyvalence : Capable d'exécuter l'inférence sur des images, des vidéos et même des flux en direct.
- Performance : Conçu pour un traitement en temps réel à haute vitesse sans sacrifier la précision.
- Facilité d'utilisation : Interfaces Python et CLI intuitives pour un déploiement et des tests rapides.
- Hautement personnalisable : Divers réglages et paramètres pour ajuster le comportement d'inférence du modèle selon tes besoins spécifiques.
- Prêt pour la production : Déploie tes modèles en tant que points de terminaison d'API sur Ultralytics Platform avec mise à l'échelle automatique et surveillance, ou exécute l'inférence localement.
Fonctionnalités clés du mode prédiction
Le mode prédiction de YOLO26 est conçu pour être robuste et polyvalent, incluant :
- Compatibilité avec de multiples sources de données : Que tes données soient sous forme d'images individuelles, d'une collection d'images, de fichiers vidéo ou de flux vidéo en temps réel, le mode prédiction te couvre.
- Mode streaming : Utilise la fonctionnalité de streaming pour générer un générateur d'objets
Resultséconome en mémoire. Active cela en définissantstream=Truedans la méthode d'appel du prédicteur. - Traitement par lots : Traite plusieurs images ou images vidéo dans un seul lot, réduisant encore le temps total d'inférence.
- Facile à intégrer : S'intègre facilement aux pipelines de données existants et à d'autres composants logiciels, grâce à son API flexible.
Les modèles Ultralytics YOLO renvoient soit une liste Python d'objets Results, soit un générateur d'objets Results économe en mémoire lorsque stream=True est passé au modèle lors de l'inférence :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # pretrained YOLO26n model
# Run batched inference on a list of images
results = model(["image1.jpg", "image2.jpg"]) # return a list of Results objects
# Process results list
for result in results:
boxes = result.boxes # Boxes object for bounding box outputs
masks = result.masks # Masks object for segmentation masks outputs
keypoints = result.keypoints # Keypoints object for pose outputs
probs = result.probs # Probs object for classification outputs
obb = result.obb # Oriented boxes object for OBB outputs
result.show() # display to screen
result.save(filename="result.jpg") # save to diskSources d'inférence
YOLO26 peut traiter différents types de sources d'entrée pour l'inférence, comme indiqué dans le tableau ci-dessous. Les sources incluent des images statiques, des flux vidéo et divers formats de données. Le tableau indique également si chaque source peut être utilisée en mode streaming avec l'argument stream=True ✅. Le mode streaming est bénéfique pour traiter des vidéos ou des flux en direct car il crée un générateur de résultats au lieu de charger toutes les images en mémoire.
Utilise stream=True pour traiter de longues vidéos ou de grands jeux de données afin de gérer efficacement la mémoire. Lorsque stream=False, les résultats pour toutes les images ou tous les points de données sont stockés en mémoire, ce qui peut rapidement s'accumuler et provoquer des erreurs de manque de mémoire pour les entrées importantes. À l'inverse, stream=True utilise un générateur qui ne garde en mémoire que les résultats de l'image ou du point de données actuel, réduisant considérablement la consommation de mémoire et évitant les problèmes de saturation mémoire.
| Source | Exemple | Type | Notes |
|---|---|---|---|
| image | 'image.jpg' | str ou Path | Fichier image unique. |
| URL | 'https://ultralytics.com/images/bus.jpg' | str | URL vers une image. |
| screenshot | 'screen' | str | Capturer une capture d'écran. |
| PIL | Image.open('image.jpg') | PIL.Image | Format HWC avec canaux RGB. |
| OpenCV | cv2.imread('image.jpg') | np.ndarray | Format HWC avec canaux BGR uint8 (0-255). |
| NumPy | np.zeros((640,1280,3)) | np.ndarray | Format HWC avec canaux BGR uint8 (0-255). |
| torch | torch.zeros(16,3,320,640) | torch.Tensor | Format BCHW avec canaux RGB float32 (0.0-1.0). |
| CSV | 'sources.csv' | str ou Path | Fichier CSV contenant des chemins vers des images, des vidéos ou des répertoires. |
| video ✅ | 'video.mp4' | str ou Path | Fichier vidéo dans des formats comme MP4, AVI, etc. |
| directory ✅ | 'path/' | str ou Path | Chemin vers un répertoire contenant des images ou des vidéos. |
| glob ✅ | 'path/*.jpg' | str | Modèle glob pour faire correspondre plusieurs fichiers. Utilise le caractère * comme caractère générique. |
| YouTube ✅ | 'https://youtu.be/LNwODJXcvt4' | str | URL vers une vidéo YouTube. |
| stream ✅ | 'rtsp://example.com/media.mp4' | str | URL pour les protocoles de streaming tels que RTSP, RTMP, TCP ou une adresse IP. |
| multi-stream ✅ | 'list.streams' | str ou Path | Fichier texte *.streams avec une URL de flux par ligne, c'est-à-dire 8 flux fonctionneront avec une taille de lot de 8. |
| webcam ✅ | 0 | int | Index du périphérique de caméra connecté pour exécuter l'inférence. |
Voici ci-dessous des exemples de code pour utiliser chaque type de source :
Exécute l'inférence sur un fichier image.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Define path to the image file
source = "path/to/image.jpg"
# Run inference on the source
results = model(source) # list of Results objectsArguments d'inférence
model.predict() accepte plusieurs arguments qui peuvent être passés au moment de l'inférence pour remplacer les paramètres par défaut :
Forme fixe vs rectangle minimum (rect)
Par défaut, predict utilise rect=True, ce qui active le remplissage par rectangle minimum lorsque cela est possible. L'image est mise à l'échelle pour tenir dans imgsz et complétée uniquement jusqu'au multiple de foulée (stride) le plus proche, le tenseur final peut donc être plus petit que imgsz. Le remplissage par rectangle minimum n'est utilisé que lorsque toutes les images du lot ont la même forme et que le backend le prend en charge (PyTorch .pt, ou ONNX / Triton dynamique). Sinon, les images sont complétées jusqu'à la cible imgsz complète.
Utilise rect=False pour toujours compléter jusqu'à la cible imgsz complète. C'est recommandé lorsque tu as besoin d'une taille d'entrée fixe pour correspondre aux modèles exportés (ONNX, TensorRT, etc.).
imgsz entier vs tuple
- Un entier
imgsz=640devient une cible carrée(640, 640)après l'arrondi du stride. - Un tuple
imgsz=(384, 672)définit une cible rectangulaire. Avecrect=Trueetauto=True, le tenseur réel peut être plus petit que cette cible.
Entraînement vs prédiction/export
Training accepts only a single integer imgsz (a [h, w] list is coerced to the largest value). Predict and export accept either an integer or a (height, width) tuple.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference on 'bus.jpg' with arguments
model.predict("https://ultralytics.com/images/bus.jpg", save=True, imgsz=320, conf=0.25)Arguments d'inférence :
| Argument | Type | Défaut | Description |
|---|---|---|---|
source | str ou int ou None | None | Spécifie la source de données pour l'inférence. Peut être un chemin d'image, un fichier vidéo, un répertoire, une URL ou un identifiant d'appareil pour des flux en direct. Si omis, un avertissement est journalisé et le modèle revient aux assets de démonstration intégrés (ultralytics/assets, ou une URL de démonstration pour OBB). Prend en charge une large gamme de formats et de sources, permettant une application flexible à travers différents types d'entrée. |
conf | float | 0.25 | Définit le seuil de confiance minimal pour les détections. Les objets détectés avec une confiance inférieure à ce seuil seront ignorés. Ajuster cette valeur peut aider à réduire les faux positifs. |
iou | float | 0.7 | Seuil d'Intersection Over Union (IoU) pour la Non-Maximum Suppression (NMS). Des valeurs plus faibles entraînent moins de détections en éliminant les boîtes qui se chevauchent, utile pour réduire les doublons. |
imgsz | int ou tuple | 640 | Letterbox target. An integer gives a square N×N; a tuple gives (height, width). With rect=True, the actual tensor may be smaller than this target due to minimum-rectangle padding. Use rect=False for a fixed size. See Fixed shape vs minimum rectangle. |
rect | bool | True | Si True, utilise le remplissage du rectangle minimal lorsque c'est possible (lot de même forme et backend pris en charge). Si False, remplit toujours jusqu'à imgsz complet. Voir Forme fixe vs rectangle minimal. |
half | bool | False | Active l'inférence en demi-précision (FP16), ce qui peut accélérer l'inférence du modèle sur les GPU pris en charge avec un impact minimal sur la précision. |
device | str | None | Spécifie l'appareil pour l'inférence (ex: cpu, cuda:0, 0, npu ou npu:0). Permet aux utilisateurs de choisir entre le CPU, un GPU spécifique, le NPU Huawei Ascend ou d'autres appareils de calcul pour l'exécution du modèle. |
batch | int | 1 | Spécifie la taille de lot pour l'inférence (fonctionne uniquement lorsque la source est un répertoire, un fichier vidéo ou un fichier .txt). Une taille de lot plus grande peut fournir un débit plus élevé, réduisant la durée totale requise pour l'inférence. |
max_det | int | 300 | Nombre maximal de détections autorisées par image. Limite le nombre total d'objets que le modèle peut détecter en une seule inférence, ce qui évite des sorties excessives dans les scènes denses. |
vid_stride | int | 1 | Pas de trame pour les entrées vidéo. Permet de sauter des images dans les vidéos pour accélérer le traitement au prix d'une perte de résolution temporelle. Une valeur de 1 traite chaque image, les valeurs plus élevées sautent des images. |
stream_buffer | bool | False | Détermine s'il faut mettre en file d'attente les images entrantes pour les flux vidéo. Si False, les anciennes images sont supprimées pour laisser place aux nouvelles (optimisé pour les applications temps réel). Si True, met les nouvelles images en mémoire tampon, garantissant qu'aucune image n'est sautée, mais cela causera de la latence si le FPS de l'inférence est inférieur au FPS du flux. |
visualize | bool | False | Active la visualisation des caractéristiques du modèle pendant l'inférence, offrant un aperçu de ce que le modèle "voit". Utile pour le débogage et l'interprétation du modèle. |
augment | bool | False | Active l'augmentation en temps de test (TTA) pour les prédictions, améliorant potentiellement la robustesse de la détection au prix d'une vitesse d'inférence réduite. |
agnostic_nms | bool | False | Active la suppression non maximale (NMS) agnostique aux classes, qui fusionne les boîtes qui se chevauchent de classes différentes. Utile dans les scénarios de détection multi-classes où le chevauchement de classes est courant. Pour les modèles de bout en bout (YOLO26, YOLOv10), cela empêche uniquement la même détection d'apparaître avec plusieurs étiquettes de classe (doublons IoU=1.0) et n'effectue pas de suppression basée sur le seuil IoU entre des boîtes distinctes. |
classes | list[int] | None | Filtre les prédictions selon un ensemble d'IDs de classe. Seules les détections appartenant aux classes spécifiées seront renvoyées. Utile pour se concentrer sur les objets pertinents dans les tâches de détection multi-classes. |
retina_masks | bool | False | Renvoie des masques de segmentation haute résolution. Les masques renvoyés (masks.data) correspondront à la taille originale de l'image si activé. S'ils sont désactivés, ils auront la taille de l'image utilisée pendant l'inférence. |
embed | list[int] | None | Spécifie les couches à partir desquelles extraire les vecteurs de caractéristiques ou embeddings. Utile pour les tâches en aval comme le clustering ou la recherche de similarité. |
project | str | None | Nom du répertoire de projet où les sorties de prédiction sont enregistrées si save est activé. |
name | str | None | Nom de l'exécution de prédiction. Utilisé pour créer un sous-répertoire dans le dossier de projet, où les sorties de prédiction sont stockées si save est activé. |
stream | bool | False | Active un traitement efficace en mémoire pour les longues vidéos ou les nombreuses images en renvoyant un générateur d'objets Results au lieu de charger toutes les images en mémoire simultanément. |
verbose | bool | True | Contrôle l'affichage des logs d'inférence détaillés dans le terminal, fournissant un retour en temps réel sur le processus de prédiction. |
compile | bool ou str | False | Active la compilation de graphe torch.compile de PyTorch 2.x avec backend='inductor'. Accepte True → "default", False → désactive, ou un mode chaîne comme "default", "reduce-overhead", "max-autotune-no-cudagraphs". Revient au mode eager avec un avertissement si non pris en charge. |
end2end | bool | None | Remplace le mode de bout en bout dans les modèles YOLO qui supportent l'inférence sans NMS (YOLO26, YOLOv10). Le définir sur False te permet d'exécuter la prédiction en utilisant le pipeline NMS traditionnel, tout en te permettant d'utiliser l'argument iou. Consulte le guide de détection de bout en bout pour plus de détails. |
Arguments de visualisation :
| Argument | Type | Défaut | Description |
|---|---|---|---|
show | bool | False | Si True, affiche les images ou vidéos annotées dans une fenêtre. Utile pour un retour visuel immédiat lors du développement ou des tests. |
save | bool | False or True | Active l'enregistrement des images ou vidéos annotées dans des fichiers. Utile pour la documentation, l'analyse approfondie ou le partage des résultats. Par défaut à True lors de l'utilisation de l'CLI et False lors de l'utilisation en Python. |
save_frames | bool | False | Lors du traitement de vidéos, enregistre des images individuelles sous forme de fichiers. Utile pour extraire des images spécifiques ou pour une analyse détaillée image par image. |
save_txt | bool | False | Enregistre les résultats de détection dans un fichier texte, en suivant le format [class] [x_center] [y_center] [width] [height] [confidence]. Utile pour l'intégration avec d'autres outils d'analyse. |
save_conf | bool | False | Inclut les scores de confiance dans les fichiers texte enregistrés. Améliore le niveau de détail disponible pour le post-traitement et l'analyse. |
save_crop | bool | False | Enregistre les images recadrées des détections. Utile pour l'augmentation de données, l'analyse ou la création de jeux de données ciblés pour des objets spécifiques. |
show_labels | bool | True | Affiche les étiquettes pour chaque détection dans la sortie visuelle. Fournit une compréhension immédiate des objets détectés. |
show_conf | bool | True | Affiche le score de confiance pour chaque détection à côté de l'étiquette. Donne un aperçu de la certitude du modèle pour chaque détection. |
show_boxes | bool | True | Dessine des boîtes englobantes autour des objets détectés. Essentiel pour l'identification visuelle et la localisation des objets dans les images ou les séquences vidéo. |
line_width | int or None | None | Spécifie l'épaisseur de ligne des boîtes englobantes. Si None, l'épaisseur de ligne est automatiquement ajustée en fonction de la taille de l'image. Fournit une personnalisation visuelle pour plus de clarté. |
Formats d'image et de vidéo
YOLO26 prend en charge divers formats d'image et de vidéo, comme spécifié dans ultralytics/data/utils.py. Consulte les tableaux ci-dessous pour les suffixes valides et des exemples de commandes predict.
Images
Le tableau ci-dessous contient les formats d'image valides pour Ultralytics.
Les formats HEIC/HEIF nécessitent pi-heif, qui est installé automatiquement lors de la première utilisation. AVIF est pris en charge nativement par Pillow.
| Suffixes d'image | Exemple de commande Predict | Référence |
|---|---|---|
.avif | yolo predict source=image.avif | AV1 Image File Format |
.bmp | yolo predict source=image.bmp | Microsoft BMP File Format |
.dng | yolo predict source=image.dng | Adobe DNG |
.heic | yolo predict source=image.heic | High Efficiency Image Format |
.heif | yolo predict source=image.heif | High Efficiency Image Format |
.jp2 | yolo predict source=image.jp2 | JPEG 2000 |
.jpeg | yolo predict source=image.jpeg | JPEG |
.jpg | yolo predict source=image.jpg | JPEG |
.mpo | yolo predict source=image.mpo | Multi Picture Object |
.png | yolo predict source=image.png | Portable Network Graphics |
.tif | yolo predict source=image.tif | Tag Image File Format |
.tiff | yolo predict source=image.tiff | Tag Image File Format |
.webp | yolo predict source=image.webp | WebP |
Vidéos
Le tableau ci-dessous contient les formats vidéo valides pour Ultralytics.
| Suffixes de vidéo | Exemple de commande Predict | Référence |
|---|---|---|
.asf | yolo predict source=video.asf | Advanced Systems Format |
.avi | yolo predict source=video.avi | Audio Video Interleave |
.gif | yolo predict source=video.gif | Graphics Interchange Format |
.m4v | yolo predict source=video.m4v | MPEG-4 Part 14 |
.mkv | yolo predict source=video.mkv | Matroska |
.mov | yolo predict source=video.mov | QuickTime File Format |
.mp4 | yolo predict source=video.mp4 | MPEG-4 Part 14 - Wikipedia |
.mpeg | yolo predict source=video.mpeg | MPEG-1 Part 2 |
.mpg | yolo predict source=video.mpg | MPEG-1 Part 2 |
.ts | yolo predict source=video.ts | MPEG Transport Stream |
.wmv | yolo predict source=video.wmv | Windows Media Video |
.webm | yolo predict source=video.webm | WebM Project |
Travailler avec les résultats
Tous les appels Ultralytics predict() renvoient une liste d'objets Results :
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results = model(
[
"https://ultralytics.com/images/bus.jpg",
"https://ultralytics.com/images/zidane.jpg",
]
) # batch inferenceLes objets Results possèdent les attributs suivants :
| Attribut | Type | Description |
|---|---|---|
orig_img | np.ndarray | L'image originale sous forme de tableau NumPy. |
orig_shape | tuple | La forme de l'image originale au format (hauteur, largeur). |
boxes | Boxes, optional | Un objet Boxes contenant les boîtes englobantes de détection. |
masks | Masks, optional | Un objet Masks contenant les masques de détection. |
probs | Probs, optional | Un objet Probs contenant les probabilités de chaque classe pour la tâche de classification. |
keypoints | Keypoints, optional | Un objet Keypoints contenant les points clés détectés pour chaque objet. |
obb | OBB, optional | Un objet OBB contenant les boîtes englobantes orientées. |
speed | dict | Un dictionnaire des vitesses de prétraitement, d'inférence et de post-traitement en millisecondes par image. |
names | dict | Un dictionnaire associant les indices de classe aux noms de classe. |
path | str | Le chemin vers le fichier image. |
save_dir | str, optional | Répertoire pour enregistrer les résultats. |
Les objets Results possèdent les méthodes suivantes :
| Méthode | Type de retour | Description |
|---|---|---|
update() | None | Met à jour l'objet Results avec de nouvelles données de détection (boîtes, masques, probs, obb, keypoints). |
cpu() | Results | Renvoie une copie de l'objet Results avec tous les tenseurs déplacés vers la mémoire CPU. |
numpy() | Results | Renvoie une copie de l'objet Results avec tous les tenseurs convertis en tableaux NumPy. |
cuda() | Results | Renvoie une copie de l'objet Results avec tous les tenseurs déplacés vers la mémoire GPU. |
to() | Results | Renvoie une copie de l'objet Results avec les tenseurs déplacés vers le périphérique et le type de données spécifiés. |
new() | Results | Crée un nouvel objet Results avec les mêmes attributs d'image, de chemin, de noms et de vitesse. |
plot() | np.ndarray | Trace les résultats de détection sur une image RGB d'entrée et renvoie l'image annotée. |
show() | None | Affiche l'image avec les résultats d'inférence annotés. |
save() | str | Enregistre l'image des résultats d'inférence annotée dans un fichier et renvoie le nom du fichier. |
verbose() | str | Renvoie une chaîne de journal pour chaque tâche, détaillant les résultats de détection et de classification. |
save_txt() | str | Enregistre les résultats de détection dans un fichier texte et renvoie le chemin vers le fichier enregistré. |
save_crop() | None | Enregistre les images de détection recadrées dans le répertoire spécifié. |
summary() | List[Dict[str, Any]] | Convertit les résultats d'inférence en un dictionnaire résumé avec une normalisation optionnelle. |
to_df() | DataFrame | Convertit les résultats de détection en un DataFrame Polars. |
to_csv() | str | Convertit les résultats de détection au format CSV. |
to_json() | str | Convertit les résultats de détection au format JSON. |
Pour plus de détails, consulte la documentation de la classe Results.
Boxes
L'objet Boxes peut être utilisé pour indexer, manipuler et convertir des boîtes englobantes vers différents formats.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg") # results list
# View results
for r in results:
print(r.boxes) # print the Boxes object containing the detection bounding boxesVoici un tableau des méthodes et propriétés de la classe Boxes, incluant leur nom, type et description :
| Nom | Type | Description |
|---|---|---|
cpu() | Méthode | Déplace l'objet vers la mémoire CPU. |
numpy() | Méthode | Convertit l'objet en un tableau NumPy. |
cuda() | Méthode | Déplace l'objet vers la mémoire CUDA. |
to() | Méthode | Déplace l'objet vers le périphérique spécifié. |
xyxy | Propriété (torch.Tensor) | Renvoie les boîtes au format xyxy. |
conf | Propriété (torch.Tensor) | Renvoie les valeurs de confiance des boîtes. |
cls | Propriété (torch.Tensor) | Renvoie les valeurs de classe des boîtes. |
id | Propriété (torch.Tensor) | Renvoie les identifiants de suivi des boîtes (si disponibles). |
xywh | Propriété (torch.Tensor) | Renvoie les boîtes au format xywh. |
xyxyn | Propriété (torch.Tensor) | Renvoie les boîtes au format xyxy normalisées par la taille de l'image originale. |
xywhn | Propriété (torch.Tensor) | Renvoie les boîtes au format xywh normalisées par la taille de l'image originale. |
Pour plus de détails, consulte la documentation de la classe Boxes.
Masks
L'objet Masks peut être utilisé pour indexer, manipuler et convertir des masques en segments.
from ultralytics import YOLO
# Load a pretrained YOLO26n-seg Segment model
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg") # results list
# View results
for r in results:
print(r.masks) # print the Masks object containing the detected instance masksVoici un tableau des méthodes et propriétés de la classe Masks, incluant leur nom, type et description :
| Nom | Type | Description |
|---|---|---|
cpu() | Méthode | Renvoie le tenseur des masques en mémoire CPU. |
numpy() | Méthode | Renvoie le tenseur des masques sous forme de tableau NumPy. |
cuda() | Méthode | Renvoie le tenseur des masques en mémoire GPU. |
to() | Méthode | Renvoie le tenseur des masques avec le périphérique et le type de données spécifiés. |
xyn | Propriété (torch.Tensor) | Une liste de segments normalisés représentés sous forme de tenseurs. |
xy | Propriété (torch.Tensor) | Une liste de segments en coordonnées de pixels représentés sous forme de tenseurs. |
Pour plus de détails, consulte la documentation de la classe Masks.
Keypoints
L'objet Keypoints peut être utilisé pour indexer, manipuler et normaliser des coordonnées.
from ultralytics import YOLO
# Load a pretrained YOLO26n-pose Pose model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg") # results list
# View results
for r in results:
print(r.keypoints) # print the Keypoints object containing the detected keypointsVoici un tableau des méthodes et propriétés de la classe Keypoints, incluant leur nom, leur type et leur description :
| Nom | Type | Description |
|---|---|---|
cpu() | Méthode | Renvoie le tenseur des points clés sur la mémoire CPU. |
numpy() | Méthode | Renvoie le tenseur des points clés sous forme de tableau NumPy. |
cuda() | Méthode | Renvoie le tenseur des points clés sur la mémoire GPU. |
to() | Méthode | Renvoie le tenseur des points clés avec le périphérique et le type de données spécifiés. |
xyn | Propriété (torch.Tensor) | Une liste de points clés normalisés représentés sous forme de tenseurs. |
xy | Propriété (torch.Tensor) | Une liste de points clés en coordonnées de pixels représentés sous forme de tenseurs. |
conf | Propriété (torch.Tensor) | Renvoie les valeurs de confiance des points clés si disponibles, sinon None. |
Pour plus de détails, consulte la documentation de la classe Keypoints.
Probs
L'objet Probs peut être utilisé pour indexer et obtenir les indices top1 et top5 ainsi que les scores de classification.
from ultralytics import YOLO
# Load a pretrained YOLO26n-cls Classify model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg") # results list
# View results
for r in results:
print(r.probs) # print the Probs object containing the detected class probabilitiesVoici un tableau résumant les méthodes et propriétés de la classe Probs :
| Nom | Type | Description |
|---|---|---|
cpu() | Méthode | Renvoie une copie du tenseur probs sur la mémoire CPU. |
numpy() | Méthode | Renvoie une copie du tenseur probs sous forme de tableau NumPy. |
cuda() | Méthode | Renvoie une copie du tenseur probs sur la mémoire GPU. |
to() | Méthode | Renvoie une copie du tenseur probs avec le périphérique et le type de données spécifiés. |
top1 | Propriété (int) | Indice de la classe top 1. |
top5 | Propriété (list[int]) | Indices des classes top 5. |
top1conf | Propriété (torch.Tensor) | Confiance de la classe top 1. |
top5conf | Propriété (torch.Tensor) | Confiances des classes top 5. |
Pour plus de détails, consulte la documentation de la classe Probs.
OBB
L'objet OBB peut être utilisé pour indexer, manipuler et convertir des boîtes englobantes orientées dans différents formats.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n-obb.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/boats.jpg") # results list
# View results
for r in results:
print(r.obb) # print the OBB object containing the oriented detection bounding boxesVoici un tableau des méthodes et propriétés de la classe OBB, incluant leur nom, leur type et leur description :
| Nom | Type | Description |
|---|---|---|
cpu() | Méthode | Déplace l'objet vers la mémoire CPU. |
numpy() | Méthode | Convertit l'objet en un tableau NumPy. |
cuda() | Méthode | Déplace l'objet vers la mémoire CUDA. |
to() | Méthode | Déplace l'objet vers le périphérique spécifié. |
conf | Propriété (torch.Tensor) | Renvoie les valeurs de confiance des boîtes. |
cls | Propriété (torch.Tensor) | Renvoie les valeurs de classe des boîtes. |
id | Propriété (torch.Tensor) | Renvoie les identifiants de suivi des boîtes (si disponibles). |
xyxy | Propriété (torch.Tensor) | Renvoie les boîtes horizontales au format xyxy. |
xywhr | Propriété (torch.Tensor) | Renvoie les boîtes pivotées au format xywhr. |
xyxyxyxy | Propriété (torch.Tensor) | Renvoie les boîtes pivotées au format xyxyxyxy. |
xyxyxyxyn | Propriété (torch.Tensor) | Renvoie les boîtes pivotées au format xyxyxyxy normalisées par la taille de l'image. |
Pour plus de détails, consulte la documentation de la classe OBB.
Tracer les résultats
La méthode plot() des objets Results facilite la visualisation des prédictions en superposant les objets détectés (tels que les boîtes englobantes, les masques, les points clés et les probabilités) sur l'image originale. Cette méthode renvoie l'image annotée sous forme de tableau NumPy, permettant un affichage ou une sauvegarde facile.
from PIL import Image
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference on 'bus.jpg'
results = model(["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]) # results list
# Visualize the results
for i, r in enumerate(results):
# Plot results image
im_bgr = r.plot() # BGR-order numpy array
im_rgb = Image.fromarray(im_bgr[..., ::-1]) # RGB-order PIL image
# Show results to screen (in supported environments)
r.show()
# Save results to disk
r.save(filename=f"results{i}.jpg")Paramètres de la méthode plot()
La méthode plot() prend en charge divers arguments pour personnaliser le résultat :
| Argument | Type | Description | Défaut |
|---|---|---|---|
conf | bool | Inclure les scores de confiance de détection. | True |
line_width | float | Épaisseur de ligne des boîtes englobantes. S'adapte à la taille de l'image si None. | None |
font_size | float | Taille de police du texte. S'adapte à la taille de l'image si None. | None |
font | str | Nom de la police pour les annotations textuelles. | 'Arial.ttf' |
pil | bool | Renvoie l'image en tant qu'objet PIL Image. | False |
img | np.ndarray | Image alternative pour le traçage. Utilise l'image originale si None. | None |
im_gpu | torch.Tensor | Image accélérée par GPU pour un traçage de masque plus rapide. Forme : (1, 3, 640, 640). | None |
kpt_radius | int | Rayon pour les points clés tracés. | 5 |
kpt_line | bool | Relier les points clés avec des lignes. | True |
labels | bool | Inclure les étiquettes de classe dans les annotations. | True |
boxes | bool | Superposer les boîtes englobantes sur l'image. | True |
masks | bool | Superposer les masques sur l'image. | True |
probs | bool | Inclure les probabilités de classification. | True |
show | bool | Afficher l'image annotée directement à l'aide de la visionneuse d'images par défaut. | False |
save | bool | Enregistrer l'image annotée dans un fichier spécifié par filename. | False |
filename | str | Chemin et nom du fichier pour enregistrer l'image annotée si save est True. | None |
color_mode | str | Spécifier le mode couleur, par ex. 'instance' ou 'class'. | 'class' |
txt_color | tuple[int, int, int] | Couleur de texte RVB pour la boîte englobante et l'étiquette de classification d'image. | (255, 255, 255) |
Inférence thread-safe
Assurer la sécurité des threads lors de l'inférence est crucial lorsque tu exécutes plusieurs modèles YOLO en parallèle sur différents threads. L'inférence thread-safe garantit que les prédictions de chaque thread sont isolées et ne s'interfèrent pas les unes avec les autres, évitant ainsi les conditions de concurrence et assurant des résultats cohérents et fiables.
Lorsque tu utilises des modèles YOLO dans une application multithread, il est important d'instancier des objets de modèle distincts pour chaque thread ou d'utiliser un stockage thread-local pour éviter les conflits :
Instancie un seul modèle à l'intérieur de chaque thread pour une inférence thread-safe :
from threading import Thread
from ultralytics import YOLO
def thread_safe_predict(model, image_path):
"""Performs thread-safe prediction on an image using a locally instantiated YOLO model."""
model = YOLO(model)
results = model.predict(image_path)
# Process results
# Starting threads that each have their own model instance
Thread(target=thread_safe_predict, args=("yolo26n.pt", "image1.jpg")).start()
Thread(target=thread_safe_predict, args=("yolo26n.pt", "image2.jpg")).start()Pour un aperçu approfondi de l'inférence thread-safe avec les modèles YOLO et des instructions étape par étape, veuillez consulter notre Guide d'inférence thread-safe YOLO. Ce guide te fournira toutes les informations nécessaires pour éviter les pièges courants et assurer le bon fonctionnement de ton inférence multithread.
Boucle for de source en streaming
Voici un script Python utilisant OpenCV (cv2) et YOLO pour exécuter l'inférence sur des images vidéo. Ce script suppose que tu as déjà installé les paquets nécessaires (opencv-python et ultralytics).
import cv2
from ultralytics import YOLO
# Load the YOLO model
model = YOLO("yolo26n.pt")
# Open the video file
video_path = "path/to/your/video/file.mp4"
cap = cv2.VideoCapture(video_path)
# Loop through the video frames
while cap.isOpened():
# Read a frame from the video
success, frame = cap.read()
if success:
# Run YOLO inference on the frame
results = model(frame)
# Visualize the results on the frame
annotated_frame = results[0].plot()
# Display the annotated frame
cv2.imshow("YOLO Inference", annotated_frame)
# Break the loop if 'q' is pressed
if cv2.waitKey(1) & 0xFF == ord("q"):
break
else:
# Break the loop if the end of the video is reached
break
# Release the video capture object and close the display window
cap.release()
cv2.destroyAllWindows()Ce script exécutera des prédictions sur chaque image de la vidéo, visualisera les résultats et les affichera dans une fenêtre. Tu peux quitter la boucle en appuyant sur 'q'.
FAQ
Qu'est-ce que Ultralytics YOLO et son mode predict pour l'inférence en temps réel ?
Ultralytics YOLO est un modèle de pointe pour la détection d'objets, la segmentation et la classification en temps réel. Son mode predict permet aux utilisateurs d'effectuer une inférence à haute vitesse sur diverses sources de données telles que des images, des vidéos et des flux en direct. Conçu pour la performance et la polyvalence, il offre également des modes de traitement par lots et de streaming. Pour plus de détails sur ses fonctionnalités, consulte le mode predict de Ultralytics YOLO.
Comment puis-je exécuter l'inférence en utilisant Ultralytics YOLO sur différentes sources de données ?
Ultralytics YOLO peut traiter une large gamme de sources de données, y compris des images individuelles, des vidéos, des répertoires, des URL et des flux. Tu peux spécifier la source de données dans l'appel model.predict(). Par exemple, utilise 'image.jpg' pour une image locale ou 'https://ultralytics.com/images/bus.jpg' pour une URL. Consulte les exemples détaillés pour diverses sources d'inférence dans la documentation.
Comment puis-je optimiser la vitesse d'inférence et l'utilisation de la mémoire de YOLO ?
Pour optimiser la vitesse d'inférence et gérer efficacement la mémoire, tu peux utiliser le mode streaming en réglant stream=True dans la méthode d'appel du prédicteur. Le mode streaming génère un générateur économe en mémoire d'objets Results au lieu de charger toutes les images en mémoire. Pour le traitement de longues vidéos ou de grands jeux de données, le mode streaming est particulièrement utile. Apprends-en plus sur le mode streaming.
Quels arguments d'inférence Ultralytics YOLO prend-il en charge ?
La méthode model.predict() dans YOLO prend en charge divers arguments tels que conf, iou, imgsz, device, et plus encore. Ces arguments te permettent de personnaliser le processus d'inférence, en définissant des paramètres comme les seuils de confiance, la taille de l'image et le périphérique utilisé pour le calcul. Des descriptions détaillées de ces arguments se trouvent dans la section arguments d'inférence.
Comment puis-je visualiser et enregistrer les résultats des prédictions YOLO ?
Après avoir exécuté l'inférence avec YOLO, les objets Results contiennent des méthodes pour afficher et enregistrer les images annotées. Tu peux utiliser des méthodes comme result.show() et result.save(filename="result.jpg") pour visualiser et enregistrer les résultats. Tous les répertoires parents manquants dans le chemin du nom de fichier sont créés automatiquement (par ex. result.save("path/to/result.jpg")). Pour une liste complète de ces méthodes, consulte la section travailler avec les résultats.


