Skip to content

Caltech-256-Datensatz

Der Caltech-256-Datensatz ist eine umfangreiche Sammlung von Bildern, die für Aufgaben der Objektklassifizierung verwendet werden. Er enthält rund 30.000 Bilder, die in 257 Kategorien unterteilt sind (256 Objektkategorien und 1 Hintergrundkategorie). Die Bilder sind sorgfältig zusammengestellt und annotiert, um einen anspruchsvollen und vielfältigen Benchmark für Algorithmen zur Objekterkennung zu bieten.



Ansehen: Trainingsanleitung Bildklassifizierung Modelltraining mit dem Caltech-256-Datensatz mit Ultralytics HUB

Automatische Datenaufteilung

Der Caltech-256-Datensatz wird, wie bereitgestellt, nicht mit vordefinierten Trainings-/Validierungsaufteilungen geliefert. Wenn Sie jedoch die in den folgenden Anwendungsbeispielen bereitgestellten Trainingsbefehle verwenden, teilt das Ultralytics-Framework den Datensatz automatisch für Sie auf. Die standardmäßig verwendete Aufteilung beträgt 80 % für den Trainingssatz und 20 % für den Validierungssatz.

Hauptmerkmale

  • Der Caltech-256-Datensatz umfasst rund 30.000 Farbbilder, die in 257 Kategorien unterteilt sind.
  • Jede Kategorie enthält mindestens 80 Bilder.
  • Die Kategorien umfassen eine Vielzahl von realen Objekten, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Personen.
  • Die Bilder haben unterschiedliche Größen und Auflösungen.
  • Caltech-256 wird häufig für das Training und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Objekterkennungsaufgaben.

Dataset-Struktur

Wie Caltech-101 hat auch der Caltech-256-Datensatz keine formale Aufteilung zwischen Trainings- und Testdatensätzen. Benutzer erstellen ihre eigenen Aufteilungen in der Regel nach ihren spezifischen Bedürfnissen. Eine gängige Praxis ist die Verwendung einer zufälligen Teilmenge von Bildern für das Training und der restlichen Bilder für das Testen.

Anwendungen

Der Caltech-256-Datensatz wird häufig zum Trainieren und Evaluieren von Deep Learning-Modellen bei Objekterkennungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Seine vielfältigen Kategorien und hochwertigen Bilder machen ihn zu einem unschätzbaren Datensatz für Forschung und Entwicklung auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Nutzung

Um ein YOLO-Modell auf dem Caltech-256-Datensatz für 100 Epochen zu trainieren, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Trainings-Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

sample_images und Anmerkungen

Der Caltech-256-Datensatz enthält hochwertige Farbbilder verschiedener Objekte und bietet einen umfassenden Datensatz für Objekterkennungsaufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz (credit):

Beispielbild des Datensatzes

Das Beispiel demonstriert die Vielfalt und Komplexität der Objekte im Caltech-256-Datensatz und unterstreicht die Bedeutung eines vielfältigen Datensatzes für das Training robuster Objekterkennungsmodelle.

Zitate und Danksagungen

Wenn Sie den Caltech-256-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Paper:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Wir möchten Gregory Griffin, Alex Holub und Pietro Perona dafür anerkennen, dass sie den Caltech-256-Datensatz als wertvolle Ressource für die Machine-Learning- und Computer-Vision-Forschungsgemeinschaft erstellt und pflegen. Weitere Informationen über den Caltech-256-Datensatz und seine Urheber finden Sie auf der Caltech-256-Datensatz-Website.

FAQ

Was ist der Caltech-256-Datensatz und warum ist er wichtig für maschinelles Lernen?

Der Caltech-256-Datensatz ist ein großer Bilddatensatz, der hauptsächlich für Aufgaben der Objektklassifizierung im maschinellen Lernen und in der Computer Vision verwendet wird. Er besteht aus etwa 30.000 Farbbildern, die in 257 Kategorien unterteilt sind und ein breites Spektrum an realen Objekten abdecken. Die vielfältigen und hochwertigen Bilder des Datensatzes machen ihn zu einem ausgezeichneten Benchmark für die Bewertung von Objekterkennungsalgorithmen, was für die Entwicklung robuster Modelle des maschinellen Lernens von entscheidender Bedeutung ist.

Wie kann ich ein YOLO-Modell auf dem Caltech-256-Datensatz mit python oder der CLI trainieren?

Um ein YOLO-Modell auf dem Caltech-256-Datensatz für 100 Epochen zu trainieren, können Sie die folgenden Code-Snippets verwenden. Weitere Optionen finden Sie auf der Seite Training des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Was sind die häufigsten Anwendungsfälle für den Caltech-256-Datensatz?

Der Caltech-256-Datensatz wird häufig für verschiedene Objekterkennungsaufgaben verwendet, wie zum Beispiel:

  • Training von Convolutional Neural Networks (CNNs)
  • Bewertung der Leistung von Support Vector Machines (SVMs)
  • Benchmarking neuer Deep-Learning-Algorithmen
  • Entwicklung von Objekterkennungs-Modellen mit Frameworks wie Ultralytics YOLO

Seine Vielfalt und umfassenden Anmerkungen machen ihn ideal für Forschung und Entwicklung in den Bereichen maschinelles Lernen und Computer Vision.

Wie ist der Caltech-256-Datensatz für Training und Tests strukturiert und aufgeteilt?

Der Caltech-256-Datensatz wird nicht mit einer vordefinierten Aufteilung für Training und Tests geliefert. Benutzer erstellen ihre eigenen Aufteilungen in der Regel nach ihren spezifischen Bedürfnissen. Ein gängiger Ansatz ist die zufällige Auswahl einer Teilmenge von Bildern für das Training und die Verwendung der verbleibenden Bilder für das Testen. Diese Flexibilität ermöglicht es den Benutzern, den Datensatz an ihre spezifischen Projektanforderungen und experimentellen Aufbauten anzupassen.

Warum sollte ich Ultralytics YOLO für das Trainieren von Modellen auf dem Caltech-256-Datensatz verwenden?

Ultralytics YOLO-Modelle bieten mehrere Vorteile für das Training mit dem Caltech-256-Datensatz:

  • Hohe Genauigkeit: YOLO-Modelle sind für ihre erstklassige Leistung bei Objekterkennungsaufgaben bekannt.
  • Geschwindigkeit: Sie bieten Echtzeit-Inferenzfunktionen und eignen sich daher für Anwendungen, die schnelle Vorhersagen erfordern.
  • Benutzerfreundlichkeit: Mit Ultralytics HUB können Benutzer Modelle trainieren, validieren und bereitstellen, ohne umfangreiche Programmierkenntnisse zu benötigen.
  • Vorab trainierte Modelle: Ausgehend von vortrainierten Modellen, wie beispielsweise yolo11n-cls.pt, kann die Trainingszeit erheblich verkürzen und das Modell verbessern Genauigkeit.

Weitere Details finden Sie in unserem umfassenden Trainingsleitfaden und erfahren Sie mehr über Bildklassifizierung mit Ultralytics YOLO.



📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 4 Monaten

Kommentare