Link to this sectionCome convertire le annotazioni COCO nel formato YOLO#

Q: Come posso convertire le annotazioni COCO JSON nel formato YOLO?

Usa la funzione convert_coco() di Ultralytics per convertire le annotazioni COCO JSON nel formato YOLO .txt. Imposta cls91to80=False per i dataset personalizzati: Dopo la conversione, riorganizza i tuoi file delle etichette in modo che labels/ rispecchi la directory images/, quindi crea un file dataset.yaml. Consulta la guida passo-passo per il flusso di lavoro completo.

Q: Perché l'addestramento YOLO mostra "No labels found" dopo la conversione COCO?

Questo accade perché convert_coco() salva le etichette in una sottodirectory all'interno di save_dir/labels/ (es. save_dir/labels/train/) invece che direttamente nella cartella labels/train/ del tuo dataset accanto a images/train/. YOLO si aspetta che le etichette siano parallele alle immagini — ad esempio, images/train/img.jpg richiede labels/train/img.txt. Sposta le tue etichette convertite per farle corrispondere a questa struttura. Vedi correggere la struttura delle directory.

Q: Cosa fa cls91to80 in convert_coco()?

Il parametro cls91to80 controlla come i valori category_id di COCO vengono mappati sugli ID classe YOLO. Quando è True (impostazione predefinita), applica la tabella di lookup coco91_to_coco80_class() progettata per il dataset COCO standard, che ha 80 classi con ID non contigui (1-90). Per i dataset personalizzati, imposta sempre cls91to80=False: questo sottrae semplicemente 1 da ciascun category_id per creare ID classe a indice zero.

Q: Posso convertire le annotazioni di segmentazione COCO nel formato YOLO?

Sì, usa use_segments=True quando chiami convert_coco() per includere le maschere di segmentazione poligonali nelle etichette YOLO convertite. Questo produce file di etichette compatibili con i modelli di segmentazione YOLO:

Q: Come converto le annotazioni dei punti chiave COCO nel formato YOLO?

Usa use_keypoints=True per convertire le annotazioni dei punti chiave COCO per l'addestramento della stima della posa: Nota che se sia use_segments che use_keypoints sono impostati su True, solo i punti chiave verranno scritti nei file delle etichette — i segmenti vengono ignorati silenziosamente.

L'addestramento dei modelli Ultralytics YOLO richiede annotazioni in formato YOLO, ma molti popolari strumenti di annotazione esportano invece in formato COCO JSON. Questa guida ti mostra come convertire le tue annotazioni COCO nel formato YOLO e iniziare ad addestrare modelli di rilevamento oggetti, segmentazione di istanze e stima della posa.

Preferisci saltare la conversione?

Per addestrare direttamente su COCO JSON senza generare file .txt, consulta Train YOLO on COCO JSON Without Conversion.

Link to this sectionPerché convertire da COCO a YOLO?#

Il formato COCO JSON memorizza tutte le annotazioni in un singolo file, mentre YOLO utilizza un file di testo per immagine con coordinate normalizzate. La conversione è necessaria perché:

I modelli YOLO richiedono file di etichette .txt con un file per ogni immagine, contenenti class x_center y_center width height in coordinate normalizzate.
COCO JSON usa coordinate pixel nel formato [x_min, y_min, width, height] con un unico file JSON per tutte le immagini.
Gli ID di classe differiscono — COCO usa valori category_id arbitrari, mentre YOLO richiede ID di classe indicizzati a zero.

Funzionalità	COCO JSON	YOLO TXT
Struttura	Singolo file JSON per tutte le immagini	Un file `.txt` per immagine
Formato Bbox	`[x_min, y_min, width, height]` in pixel	`class x_center y_center width height` normalizzato (0-1)
ID di classe	`category_id` (può iniziare da qualsiasi numero)	Indicizzati a zero (inizia da 0)
Segmentazione	Array di poligoni nel campo `segmentation`	Coordinate del poligono dopo l'ID di classe
Punti chiave (Keypoints)	`[x, y, visibility, ...]` in pixel	`[x, y, visibility, ...]` normalizzato

Link to this sectionAvvio rapido#

Il modo più veloce per convertire le annotazioni COCO e iniziare l'addestramento:

from ultralytics.data.converter import convert_coco

convert_coco(
    labels_dir="my_dataset/annotations/",  # directory containing your JSON files
    save_dir="my_dataset/converted/",  # where to save converted labels
    cls91to80=False,  # set False for custom datasets (see warning below)
)

Dopo la conversione, organizza la struttura delle tue directory, crea un dataset.yaml e avvia l'addestramento. Consulta la guida passo-passo completa qui sotto.

Dataset personalizzati: usa sempre `cls91to80=False`

L'impostazione predefinita cls91to80=True è pensata solo per il dataset COCO standard con 80 classi di oggetti, che mappa 91 ID di categoria non contigui in 80 ID di classe contigui. Per qualsiasi dataset personalizzato, devi impostare cls91to80=False — altrimenti i tuoi ID di classe verranno mappati in modo errato senza avviso e il tuo modello imparerà le classi sbagliate.

Link to this sectionGuida alla conversione passo-passo#

Link to this section1. Prepara il tuo dataset COCO#

Un tipico dataset in formato COCO esportato dagli strumenti di annotazione ha la seguente struttura:

my_dataset/
├── images/
│   ├── train/
│   │   ├── img_001.jpg
│   │   ├── img_002.jpg
│   │   └── ...
│   └── val/
│       ├── img_100.jpg
│       └── ...
└── annotations/
    ├── instances_train.json
    └── instances_val.json

Ogni file JSON segue la specifica del formato dati COCO con tre campi obbligatori — images, annotations e categories:

{
    "images": [{ "id": 1, "file_name": "img_001.jpg", "width": 640, "height": 480 }],
    "annotations": [
        {
            "id": 1,
            "image_id": 1,
            "category_id": 1,
            "bbox": [100, 50, 200, 150],
            "area": 30000,
            "iscrowd": 0
        }
    ],
    "categories": [
        { "id": 1, "name": "helmet" },
        { "id": 2, "name": "vest" }
    ]
}

Link to this section2. Converti le annotazioni#

Usa la funzione convert_coco() per convertire le tue annotazioni COCO JSON nel formato YOLO .txt:

Converti COCO in formato YOLO

from ultralytics.data.converter import convert_coco

convert_coco(
    labels_dir="my_dataset/annotations/",
    save_dir="my_dataset/converted/",
    cls91to80=False,
)

convert_coco() scrive un file .txt per ogni immagine annotata in una sottocartella labels/ che prende il nome da ciascun file JSON, con il prefisso instances_ rimosso (quindi instances_train.json produce labels/train/). Le immagini senza annotazioni vengono saltate e non ricevono alcun file di etichetta, quindi l'albero labels/ potrebbe non rispecchiare ogni immagine:

my_dataset/converted/
└── labels/
    ├── train/   # from instances_train.json
    │   ├── img_001.txt
    │   └── ...
    └── val/     # from instances_val.json
        └── ...

L'esecuzione ripetuta crea una nuova cartella di output

convert_coco() non sovrascrive mai una save_dir esistente: se my_dataset/converted/ esiste già, una nuova esecuzione scrive invece su my_dataset/converted-2/. Elimina l'output precedente (o cambia save_dir) prima di rieseguire, altrimenti i passaggi successivi leggeranno etichette obsolete.

Link to this section3. Organizza la struttura delle directory#

Dopo la conversione, i file delle etichette devono essere posizionati insieme alle tue immagini. YOLO si aspetta una directory labels/ che rispecchi la directory images/:

import shutil
from pathlib import Path

converted_dir = Path("my_dataset/converted/labels")
dataset_dir = Path("my_dataset")

# convert_coco names each subdirectory after its JSON file (minus the "instances_" prefix),
# so iterate the actual subdirectories instead of assuming "train"/"val".
for src in converted_dir.iterdir():
    if not src.is_dir():
        continue
    dst = dataset_dir / "labels" / src.name
    dst.mkdir(parents=True, exist_ok=True)
    for f in src.glob("*.txt"):
        shutil.move(str(f), str(dst / f.name))

La tua struttura finale del dataset dovrebbe apparire così:

my_dataset/
├── images/
│   ├── train/
│   │   ├── img_001.jpg
│   │   └── ...
│   └── val/
│       └── ...
├── labels/
│   ├── train/
│   │   ├── img_001.txt
│   │   └── ...
│   └── val/
│       └── ...
└── dataset.yaml

Link to this section4. Crea dataset.yaml#

Crea un file di configurazione dataset.yaml che mappa le tue categorie COCO ai nomi delle classi YOLO. Questo file comunica a YOLO dove si trovano i tuoi dati e quali classi rilevare:

import json
from pathlib import Path

import yaml

# Read categories from your COCO JSON
with open("my_dataset/annotations/instances_train.json") as f:
    coco = json.load(f)

# Build class names matching convert_coco output (category_id - 1)
categories = sorted(coco["categories"], key=lambda x: x["id"])
names = {cat["id"] - 1: cat["name"] for cat in categories}
# NOTE: convert_coco maps class IDs as category_id - 1, so category_id must
# start from 1. If your categories start from 0, add 1 to each ID first.

# Create dataset.yaml
dataset = {
    "path": str(Path("my_dataset").resolve()),
    "train": "images/train",
    "val": "images/val",
    "names": names,
}

with open("my_dataset/dataset.yaml", "w") as f:
    yaml.dump(dataset, f, default_flow_style=False)

Il file YAML risultante:

path: /absolute/path/to/my_dataset
train: images/train
val: images/val
names:
    0: helmet
    1: vest

Per maggiori dettagli sul formato YAML del dataset, consulta la guida alla configurazione del dataset.

Link to this section5. Addestra il tuo modello YOLO#

Con il tuo dataset convertito pronto, addestra un modello YOLO:

Addestra sui dati COCO convertiti

from ultralytics import YOLO

model = YOLO("yolo26n.pt")  # load a pretrained model
results = model.train(data="my_dataset/dataset.yaml", epochs=100, imgsz=640)

Per suggerimenti sull'addestramento e best practice, consulta la guida all'addestramento dei modelli.

Link to this section6. Verifica la tua conversione#

Prima dell'addestramento, controlla a campione alcuni file di etichette per confermare che gli ID di classe e le coordinate siano corretti:

from pathlib import Path

label_file = Path("my_dataset/labels/train/img_001.txt")
for line in label_file.read_text().strip().splitlines():
    parts = line.split()
    cls_id = int(parts[0])
    coords = [float(v) for v in parts[1:5]]
    assert cls_id >= 0, f"Negative class ID {cls_id} — category_id in your JSON may start from 0"
    assert all(0 <= v <= 1 for v in coords), f"Coordinates out of [0, 1] range: {coords}"

Suggerimento

Se vedi ID di classe negativi, probabilmente il tuo COCO JSON usa un category_id che parte da 0. Aggiungi 1 a tutti i valori category_id nel tuo JSON prima di eseguire convert_coco(), poiché mappa gli ID di classe come category_id - 1.

Link to this sectionRisoluzione dei problemi comuni#

Link to this sectionID di classe errati dopo la conversione#

Se il tuo modello si addestra ma rileva classi di oggetti sbagliate, probabilmente stai usando cls91to80=True (predefinito) su un dataset personalizzato. Questo mappa i tuoi valori category_id tramite la tabella di ricerca COCO da 91 a 80, che è corretta solo per il dataset COCO standard.

Soluzione: Usa sempre cls91to80=False per i dataset personalizzati.

Link to this sectionNessuna etichetta trovata durante l'addestramento#

Se l'addestramento mostra WARNING: No labels found o 0 images, N backgrounds, i tuoi file di etichette non si trovano nella directory prevista. convert_coco() salva le etichette in una directory di output separata (es. save_dir/labels/train/), ma YOLO si aspetta labels/ parallelamente a images/ all'interno della directory del tuo dataset.

Soluzione: Sposta i file delle etichette per farli corrispondere alla struttura delle directory prevista. Assicurati che labels/train/ sia adiacente a images/train/.

Link to this sectionKeyError durante la conversione#

Se ricevi KeyError: 'bbox' o errori simili durante l'esecuzione di convert_coco(), la tua labels_dir contiene probabilmente file JSON non di istanza (es. captions_train2017.json) che hanno una struttura di annotazione diversa.

Soluzione: inserisci solo i file JSON di annotazione delle istanze (ad esempio instances_train2017.json) nella labels_dir.

Link to this sectionFile di etichette vuoti dopo la conversione#

Se la conversione viene completata ma i file .txt sono vuoti o mancanti, tutte le annotazioni potrebbero avere iscrowd: 1 (comune con le maschere generate da SAM), o i bounding box hanno larghezza o altezza pari a zero.

Soluzione: Ispeziona le tue annotazioni JSON per i valori iscrowd. Se usi maschere SAM, pre-elabora il JSON per impostare iscrowd: 0.

Link to this sectionLacune negli ID di classe nelle etichette convertite#

Se gli ID di classe nei file delle etichette non sono contigui (es. 0, 4, 9 invece di 0, 1, 2), il tuo strumento di annotazione usa valori category_id non contigui.

Soluzione: Verifica che gli ID di classe nei tuoi file .txt corrispondano al dizionario names in dataset.yaml. Riassegna gli ID a valori contigui se necessario.

Per i dettagli completi sull'API e le descrizioni dei parametri, consulta il riferimento API convert_coco.

Link to this sectionFAQ#

Link to this sectionCome posso convertire le annotazioni COCO JSON nel formato YOLO?#

Usa la funzione convert_coco() di Ultralytics per convertire le annotazioni COCO JSON nel formato YOLO .txt. Imposta cls91to80=False per i dataset personalizzati:

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/annotations/", save_dir="output/", cls91to80=False)

Dopo la conversione, riorganizza i tuoi file delle etichette in modo che labels/ rispecchi la directory images/, quindi crea un file dataset.yaml. Consulta la guida passo-passo per il flusso di lavoro completo.

Link to this sectionPerché l'addestramento YOLO mostra "No labels found" dopo la conversione COCO?#

Questo accade perché convert_coco() salva le etichette in una sottodirectory all'interno di save_dir/labels/ (es. save_dir/labels/train/) invece che direttamente nella cartella labels/train/ del tuo dataset accanto a images/train/. YOLO si aspetta che le etichette siano parallele alle immagini — ad esempio, images/train/img.jpg richiede labels/train/img.txt. Sposta le tue etichette convertite per farle corrispondere a questa struttura. Vedi correggere la struttura delle directory.

Link to this sectionCosa fa `cls91to80` in `convert_coco()`?#

Il parametro cls91to80 controlla come i valori category_id di COCO vengono mappati sugli ID classe YOLO. Quando è True (impostazione predefinita), applica la tabella di lookup coco91_to_coco80_class() progettata per il dataset COCO standard, che ha 80 classi con ID non contigui (1-90). Per i dataset personalizzati, imposta sempre cls91to80=False: questo sottrae semplicemente 1 da ciascun category_id per creare ID classe a indice zero.

Link to this sectionPosso addestrare YOLO direttamente su COCO JSON senza convertire?#

Non con l'attuale pipeline di addestramento YOLO — le annotazioni devono essere in formato YOLO .txt con un file per immagine. Usa convert_coco() per convertire prima il tuo COCO JSON, poi segui questa guida per organizzare e addestrare. Per ulteriori informazioni sui formati supportati, vedi formati dei dataset.

Link to this sectionPosso convertire le annotazioni di segmentazione COCO nel formato YOLO?#

Sì, usa use_segments=True quando chiami convert_coco() per includere le maschere di segmentazione poligonali nelle etichette YOLO convertite. Questo produce file di etichette compatibili con i modelli di segmentazione YOLO:

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="annotations/", save_dir="output/", use_segments=True, cls91to80=False)

Link to this sectionCome converto le annotazioni dei punti chiave COCO nel formato YOLO?#

Usa use_keypoints=True per convertire le annotazioni dei punti chiave COCO per l'addestramento della stima della posa:

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="annotations/", save_dir="output/", use_keypoints=True, cls91to80=False)

Nota che se sia use_segments che use_keypoints sono impostati su True, solo i punti chiave verranno scritti nei file delle etichette — i segmenti vengono ignorati silenziosamente.

Contributori

GLglenn-jocher³ RAraimbekovm³

Creato 4 mesi faAggiornato settimana scorsa