Skip to content

Caltech-256-Datensatz

Der Caltech-256-Datensatz ist eine umfangreiche Sammlung von Bildern, die für Objektklassifizierungsaufgaben verwendet werden. Sie enthält rund 30 000 Bilder, die in 257 Kategorien unterteilt sind (256 Objektkategorien und 1 Hintergrundkategorie). Die Bilder wurden sorgfältig kuratiert und kommentiert, um einen anspruchsvollen und vielfältigen Maßstab für Objekterkennungsalgorithmen zu bieten.



Beobachten: Wie man trainiert Bild-Klassifizierung Modell mit Caltech-256-Datensatz und Ultralytics HUB

Wesentliche Merkmale

  • Der Caltech-256-Datensatz umfasst rund 30.000 Farbbilder, die in 257 Kategorien unterteilt sind.
  • Jede Kategorie enthält mindestens 80 Bilder.
  • Die Kategorien umfassen eine Vielzahl von Objekten aus der realen Welt, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
  • Die Bilder sind von unterschiedlicher Größe und Auflösung.
  • Caltech-256 wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Aufgaben der Objekterkennung.

Struktur des Datensatzes

Wie bei Caltech-101 gibt es auch beim Caltech-256-Datensatz keine formale Aufteilung zwischen Trainings- und Testsätzen. Die Benutzer erstellen in der Regel ihre eigene Aufteilung entsprechend ihren spezifischen Anforderungen. Eine gängige Praxis ist es, eine zufällige Teilmenge von Bildern für das Training und die restlichen Bilder für die Tests zu verwenden.

Anwendungen

Der Caltech-256-Datensatz wird ausgiebig für das Training und die Bewertung von Deep-Learning-Modellen bei Objekterkennungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Seine vielfältigen Kategorien und qualitativ hochwertigen Bilder machen ihn zu einem unschätzbaren Datensatz für die Forschung und Entwicklung auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein YOLO auf dem Caltech-256-Datensatz für 100 Epochen zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Beispielbilder und -kommentare

Der Caltech-256-Datensatz enthält qualitativ hochwertige Farbbilder von verschiedenen Objekten und bietet damit einen umfassenden Datensatz für Aufgaben der Objekterkennung. Hier sind einige Beispiele von Bildern aus dem Datensatz(Kredit):

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im Caltech-256-Datensatz und unterstreicht die Bedeutung eines vielfältigen Datensatzes für das Training robuster Objekterkennungsmodelle.

Zitate und Danksagungen

Wenn Sie den Caltech-256-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Wir möchten Gregory Griffin, Alex Holub und Pietro Perona für die Erstellung und Pflege des Caltech-256-Datensatzes als wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision danken. Weitere Informationen über den Caltech-256-Datensatz und seine Schöpfer finden Sie auf der Website des Caltech-256-Datensatzes.

FAQ

Was ist der Caltech-256-Datensatz und warum ist er für maschinelles Lernen wichtig?

Der Caltech-256-Datensatz ist ein großer Bilddatensatz, der in erster Linie für Objektklassifizierungsaufgaben beim maschinellen Lernen und beim Computersehen verwendet wird. Er besteht aus rund 30.000 Farbbildern, die in 257 Kategorien eingeteilt sind und ein breites Spektrum von Objekten aus der realen Welt abdecken. Die vielfältigen und qualitativ hochwertigen Bilder des Datensatzes machen ihn zu einem hervorragenden Maßstab für die Bewertung von Objekterkennungsalgorithmen, was für die Entwicklung robuster Modelle für maschinelles Lernen entscheidend ist.

Wie kann ich ein YOLO -Modell auf dem Caltech-256-Datensatz mit Python oder CLI trainieren?

Um ein YOLO -Modell auf dem Caltech-256-Datensatz für 100 Epochen zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Weitere Optionen finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Was sind die häufigsten Anwendungsfälle für den Caltech-256-Datensatz?

Der Caltech-256-Datensatz wird häufig für verschiedene Aufgaben der Objekterkennung verwendet, z. B:

Durch seine Vielfalt und seine umfassenden Anmerkungen ist es ideal für die Forschung und Entwicklung in den Bereichen maschinelles Lernen und Computer Vision.

Wie ist der Caltech-256-Datensatz strukturiert und für Training und Tests aufgeteilt?

Der Caltech-256-Datensatz wird nicht mit einer vordefinierten Aufteilung für Training und Test geliefert. Die Benutzer erstellen in der Regel ihre eigenen Aufteilungen entsprechend ihren spezifischen Anforderungen. Ein gängiger Ansatz ist die zufällige Auswahl einer Teilmenge von Bildern für das Training und die Verwendung der restlichen Bilder für die Tests. Diese Flexibilität ermöglicht es den Benutzern, den Datensatz an ihre spezifischen Projektanforderungen und Versuchsaufbauten anzupassen.

Warum sollte ich Ultralytics YOLO für das Training von Modellen auf dem Caltech-256-Datensatz verwenden?

Ultralytics YOLO Modelle bieten mehrere Vorteile für das Training mit dem Caltech-256-Datensatz:

  • Hohe Genauigkeit: Die Modelle von YOLO sind für ihre hervorragende Leistung bei der Objekterkennung bekannt.
  • Schnelligkeit: Sie bieten Echtzeit-Inferenzfunktionen und eignen sich daher für Anwendungen, die schnelle Vorhersagen erfordern.
  • Benutzerfreundlichkeit: Mit Ultralytics HUB können Benutzer Modelle ohne umfangreiche Programmierung trainieren, validieren und einsetzen.
  • Vortrainierte Modelle: Ausgehend von vortrainierten Modellen, wie yolo11n-cls.ptkann die Trainingszeit erheblich verkürzen und das Modell verbessern. Genauigkeit.

Weitere Einzelheiten finden Sie in unserem umfassenden Schulungshandbuch, in dem Sie mehr über die Bildklassifizierung mit Ultralytics YOLO erfahren.

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 8 Tagen

Kommentare