Meet YOLO26: next-gen vision AI.

Link to this sectionRoboflow 100 Datensatz#

Roboflow 100, gesponsert von Intel, ist ein wegweisender Benchmark-Datensatz für die Objekterkennung. Er umfasst 100 vielfältige Datensätze. Dieser Benchmark wurde speziell entwickelt, um die Anpassungsfähigkeit von Computer Vision-Modellen, wie den Ultralytics YOLO Modellen, an verschiedene Bereiche zu testen, darunter Gesundheitswesen, Luftaufnahmen und Videospiele.

Lizenzierung

Ultralytics bietet zwei Lizenzierungsoptionen für unterschiedliche Anwendungsfälle:

  • AGPL-3.0 Lizenz: Diese OSI-geprüfte Open-Source-Lizenz ist ideal für Studierende und Enthusiasten, da sie offene Zusammenarbeit und Wissensaustausch fördert. Weitere Informationen findest du in der LICENSE-Datei und auf unserer AGPL-3.0 Lizenzseite.
  • Enterprise-Lizenz: Für die Entwicklung und den produktiven Einsatz ermöglicht diese Lizenz die nahtlose Integration von Ultralytics Software und KI-Modellen in Geschäftsprodukte und Dienstleistungen, einschließlich interner Tools, automatisierter Workflows und Produktionsbereitstellungen, unter Umgehung der Open-Source-Anforderungen der AGPL-3.0. Um zu starten, kontaktiere uns bitte über Ultralytics Licensing.

Roboflow 100 diverse object detection benchmark

Link to this sectionHauptfunktionen#

  • Vielfältige Bereiche: Enthält 100 Datensätze aus sieben verschiedenen Bereichen: Luftaufnahmen, Videospiele, Mikroskopie, Unterwasseraufnahmen, Dokumente, Elektromagnetik und reale Welt.
  • Umfang: Der Benchmark umfasst 224.714 Bilder in 805 Klassen, was über 11.170 Stunden an Datenmarkierungs-Aufwand entspricht.
  • Standardisierung: Alle Bilder wurden vorverarbeitet und für eine konsistente Bewertung auf 640x640 Pixel skaliert.
  • Saubere Evaluierung: Konzentriert sich darauf, Klassen-Mehrdeutigkeiten zu eliminieren und unterrepräsentierte Klassen herauszufiltern, um eine sauberere Modellbewertung zu gewährleisten.
  • Annotationen: Enthält Begrenzungsrahmen für Objekte, die für das Training und die Bewertung von Objekterkennungsmodellen unter Verwendung von Metriken wie mAP geeignet sind.

Link to this sectionDatensatzstruktur#

Der Roboflow 100 Datensatz ist in sieben Kategorien unterteilt, von denen jede eine einzigartige Sammlung von Datensätzen, Bildern und Klassen enthält:

  • Luftaufnahmen: 7 Datensätze, 9.683 Bilder, 24 Klassen.
  • Videospiele: 7 Datensätze, 11.579 Bilder, 88 Klassen.
  • Mikroskopie: 11 Datensätze, 13.378 Bilder, 28 Klassen.
  • Unterwasseraufnahmen: 5 Datensätze, 18.003 Bilder, 39 Klassen.
  • Dokumente: 8 Datensätze, 24.813 Bilder, 90 Klassen.
  • Elektromagnetik: 12 Datensätze, 36.381 Bilder, 41 Klassen.
  • Reale Welt: 50 Datensätze, 110.615 Bilder, 495 Klassen.

Diese Struktur bietet eine vielfältige und umfassende Testumgebung für Objekterkennungs-Modelle und spiegelt eine breite Palette realer Anwendungsszenarien wider, die in verschiedenen Ultralytics Solutions zu finden sind.

Link to this sectionBenchmarking#

Datensatz-Benchmarking beinhaltet die Bewertung der Leistung von Machine Learning-Modellen auf spezifischen Datensätzen mithilfe standardisierter Metriken. Häufige Metriken sind Genauigkeit, mean Average Precision (mAP) und F1-Score. Mehr dazu erfährst du in unserem YOLO Performance Metriken Leitfaden.

Benchmarking-Ergebnisse

Every output is grouped under a single runs/<task>/multitrain/ directory: each dataset is fine-tuned in its own subdirectory (with its own results.png), and the per-dataset and mean metrics are written to multitrain_results.json alongside a multitrain_results.png bar chart. The model.train() call also returns a {dataset: metrics} dictionary for programmatic access.

Benchmarking-Beispiel

Das untenstehende Skript lädt die in datasets_links.txt aufgeführten Roboflow 100 Datensätze von Roboflow herunter und führt dann ein einzelnes Basismodell (z. B. YOLO26n) für die gesamte Sammlung in einem model.train()-Aufruf fein ab. Durch die Übergabe einer Liste von Datensätzen wird das Basismodell nacheinander auf jedem Datensatz feinabgestimmt und die Ergebnisse datensatzübergreifend automatisch visualisiert. Ein kostenloser Roboflow API-Schlüssel wird benötigt, um die Datensätze herunterzuladen.

import re
from pathlib import Path

from ultralytics import YOLO
from ultralytics.utils import ASSETS_URL, YAML
from ultralytics.utils.checks import check_requirements
from ultralytics.utils.downloads import safe_download

# Download the RF100 datasets from Roboflow (requires a free Roboflow API key)
check_requirements("roboflow")
from roboflow import Roboflow

rf = Roboflow(api_key="YOUR_ROBOFLOW_API_KEY")
safe_download(f"{ASSETS_URL}/datasets_links.txt")  # list of RF100 dataset links

datasets = []
for line in Path("datasets_links.txt").read_text().splitlines():
    try:
        _, _url, workspace, project, version = re.split("/+", line.strip())
        location = f"rf-100/{project}-{version}"
        rf.workspace(workspace).project(project).version(version).download("yolov8", location=location)
        yaml = Path(location) / "data.yaml"
        cfg = YAML.load(yaml)  # point train/val at the downloaded image folders
        cfg["train"], cfg["val"] = "train/images", "valid/images"
        YAML.save(yaml, cfg)
        datasets.append(str(yaml))
    except Exception:
        continue

# Fine-tune one base model across all RF100 datasets and visualize the cross-dataset results
model = YOLO("yolo26n.pt")
results = model.train(data=datasets, epochs=100, imgsz=640)  # {dataset: metrics}

# Per-dataset runs, multitrain_results.json (per-dataset + mean), and multitrain_results.png are saved
# together under runs/detect/multitrain. Read results in-memory or from the JSON for custom post-processing.
for dataset, metrics in results.items():
    if metrics:  # None if that dataset failed to train
        print(f"{dataset}: mAP50-95 = {metrics['metrics/mAP50-95(B)']:.4f}")

Link to this sectionAnwendungen#

Roboflow 100 ist für verschiedene Anwendungen in den Bereichen Computer Vision und Deep Learning von unschätzbarem Wert. Forscher und Ingenieure können diesen Benchmark nutzen, um:

  • Die Leistung von Objekterkennungsmodellen in einem bereichsübergreifenden Kontext zu bewerten.
  • Die Anpassungsfähigkeit und Robustheit von Modellen an reale Szenarien zu testen, die über gängige Benchmark-Datensätze wie COCO oder PASCAL VOC hinausgehen.
  • Die Fähigkeiten von Objekterkennungsmodellen über verschiedene Datensätze hinweg zu vergleichen, einschließlich spezialisierter Bereiche wie Gesundheitswesen, Luftaufnahmen und Videospiele.
  • Modellleistungen über verschiedene Neuronale Netzwerk-Architekturen und Optimierungs-Techniken hinweg zu vergleichen.
  • Bereichsspezifische Herausforderungen zu identifizieren, die möglicherweise spezielle Tipps für das Modelltraining oder Feinabstimmungs-Ansätze wie Transfer Learning erfordern.

Für weitere Ideen und Inspiration zu praktischen Anwendungen, erkunde unsere Leitfäden zu praktischen Projekten oder besuche die Ultralytics Plattform für optimiertes Modelltraining und Deployment.

Link to this sectionVerwendung#

Der Roboflow 100 Datensatz, einschließlich Metadaten und Download-Links, ist im offiziellen Roboflow 100 GitHub-Repository verfügbar. Du kannst von dort direkt auf den Datensatz zugreifen und ihn für deine Benchmarking-Anforderungen nutzen. Sobald die Datensätze heruntergeladen und wie oben gezeigt vorbereitet sind, können Ultralytics-Modelle über die gesamte Sammlung hinweg in einem einzigen model.train()-Aufruf feinabgestimmt werden, indem die Liste der Datensatz-YAMLs übergeben wird.

Link to this sectionBeispieldaten und Annotationen#

Roboflow 100 besteht aus Datensätzen mit vielfältigen Bildern, die aus verschiedenen Blickwinkeln und in unterschiedlichen Bereichen aufgenommen wurden. Nachfolgend sind Beispiele für annotierte Bilder aus dem RF100-Benchmark aufgeführt, die die Vielfalt der Objekte und Szenen verdeutlichen. Techniken wie Datenaugmentation können die Vielfalt während des Trainings weiter erhöhen.

Roboflow 100 sample images with annotations

Die im Roboflow 100 Benchmark sichtbare Vielfalt stellt einen bedeutenden Fortschritt gegenüber traditionellen Benchmarks dar, die sich oft darauf konzentrieren, eine einzelne Metrik innerhalb eines begrenzten Bereichs zu optimieren. Dieser umfassende Ansatz hilft bei der Entwicklung robusterer und vielseitigerer Computer Vision-Modelle, die in einer Vielzahl unterschiedlicher Szenarien gute Leistungen erbringen können.

Link to this sectionZitate und Danksagungen#

Wenn du den Roboflow 100 Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das Originalpapier:

Zitat
@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

Wir danken dem Roboflow-Team und allen Mitwirkenden für ihren bedeutenden Einsatz bei der Erstellung und Pflege des Roboflow 100 Datensatzes als wertvolle Ressource für die Computer Vision Community.

Wenn du daran interessiert bist, weitere Datensätze zu erkunden, um deine Objekterkennungs- und Machine-Learning-Projekte zu verbessern, besuche gerne unsere umfassende Datensatzsammlung, die eine Vielzahl weiterer Erkennungsdatensätze enthält.

Link to this sectionFAQ#

Link to this sectionWas ist der Roboflow 100 Datensatz und warum ist er wichtig für die Objekterkennung?#

Der Roboflow 100 Datensatz ist ein Benchmark für Objekterkennungs-Modelle. Er umfasst 100 vielfältige Datensätze, die Bereiche wie Gesundheitswesen, Luftaufnahmen und Videospiele abdecken. Seine Bedeutung liegt in der Bereitstellung eines standardisierten Weges, um die Anpassungsfähigkeit und Robustheit von Modellen über eine breite Palette realer Szenarien hinweg zu testen und damit über traditionelle, oft bereichsbezogen begrenzte Benchmarks hinauszugehen.

Link to this sectionWelche Bereiche werden vom Roboflow 100 Datensatz abgedeckt?#

Der Roboflow 100 Datensatz umfasst sieben vielfältige Bereiche, die einzigartige Herausforderungen für Objekterkennungs-Modelle bieten:

  1. Luftaufnahmen: 7 Datensätze (z. B. Satellitenbilder, Drohnenansichten).
  2. Videospiele: 7 Datensätze (z. B. Objekte aus verschiedenen Spielumgebungen).
  3. Mikroskopie: 11 Datensätze (z. B. Zellen, Partikel).
  4. Unterwasseraufnahmen: 5 Datensätze (z. B. Meereslebewesen, untergetauchte Objekte).
  5. Dokumente: 8 Datensätze (z. B. Textbereiche, Formularelemente).
  6. Elektromagnetik: 12 Datensätze (z. B. Radarsignaturen, Visualisierungen von Spektraldaten).
  7. Reale Welt: 50 Datensätze (eine breite Kategorie einschließlich alltäglicher Objekte, Szenen, Einzelhandel usw.).

Diese Vielfalt macht RF100 zu einer exzellenten Ressource zur Bewertung der Verallgemeinerbarkeit von Computer Vision-Modellen.

Link to this sectionWas sollte ich angeben, wenn ich den Roboflow 100 Datensatz in meiner Forschung zitiere?#

Wenn du den Roboflow 100 Datensatz verwendest, zitiere bitte das Originalpapier, um den Erstellern Anerkennung zu zollen. Hier ist das empfohlene BibTeX-Zitat:

Zitat
@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

Für weitere Erkundungen empfiehlt es sich, unsere umfassende Datensatzsammlung zu besuchen oder andere mit Ultralytics-Modellen kompatible Erkennungsdatensätze zu durchsuchen.

Kommentare