Caltech-101-Datensatz

Q: What are the key features of the Caltech-101 dataset?

Der Caltech-101-Datensatz umfasst: Diese Merkmale machen ihn zu einer ausgezeichneten Wahl für das Training und die Evaluierung von Objekterkennungsmodellen im Bereich des maschinellen Lernens und der Computer Vision.

Der Caltech-101-Datensatz ist ein weit verbreiteter Datensatz für Objekterkennungsaufgaben und enthält etwa 9.000 Bilder aus 101 Objektkategorien. Die Kategorien wurden so gewählt, dass sie eine Vielzahl von Objekten aus der realen Welt widerspiegeln, und die Bilder selbst wurden sorgfältig ausgewählt und kommentiert, um einen anspruchsvollen Maßstab für Objekterkennungsalgorithmen zu bieten.

Wesentliche Merkmale

Der Caltech-101-Datensatz umfasst rund 9.000 Farbbilder, die in 101 Kategorien unterteilt sind.
Die Kategorien umfassen eine breite Palette von Objekten, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
Die Anzahl der Bilder pro Kategorie variiert, wobei jede Kategorie zwischen 40 und 800 Bilder enthält.
Die Bilder sind von unterschiedlicher Größe, wobei die meisten Bilder eine mittlere Auflösung haben.
Caltech-101 wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Aufgaben der Objekterkennung.

Struktur des Datensatzes

Im Gegensatz zu vielen anderen Datensätzen ist der Caltech-101-Datensatz nicht formell in Trainings- und Testdatensätze aufgeteilt. Die Benutzer erstellen in der Regel ihre eigene Aufteilung auf der Grundlage ihrer spezifischen Bedürfnisse. Eine gängige Praxis ist jedoch die Verwendung einer zufälligen Teilmenge von Bildern für das Training (z. B. 30 Bilder pro Kategorie) und der restlichen Bilder für die Tests.

Anwendungen

Der Caltech-101-Datensatz wird ausgiebig für das Training und die Bewertung von Deep-Learning-Modellen bei Objekterkennungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Die große Vielfalt an Kategorien und die hohe Qualität der Bilder machen es zu einem ausgezeichneten Datensatz für die Forschung und Entwicklung auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein YOLO -Modell auf dem Caltech-101-Datensatz für 100 Epochen zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Beispielbilder und -kommentare

Der Caltech-101-Datensatz enthält qualitativ hochwertige Farbbilder von verschiedenen Objekten, die einen gut strukturierten Datensatz für Objekterkennungsaufgaben darstellen. Hier sind einige Beispiele von Bildern aus dem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im Caltech-101-Datensatz und unterstreicht die Bedeutung eines vielfältigen Datensatzes für das Training robuster Objekterkennungsmodelle.

Zitate und Danksagungen

Wenn Sie den Caltech-101-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Wir möchten Li Fei-Fei, Rob Fergus und Pietro Perona für die Erstellung und Pflege des Caltech-101-Datensatzes als wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision danken. Weitere Informationen über den Caltech-101-Datensatz und seine Schöpfer finden Sie auf der Website des Caltech-101-Datensatzes.

FAQ

Wofür wird der Caltech-101-Datensatz beim maschinellen Lernen verwendet?

Der Caltech-101-Datensatz wird beim maschinellen Lernen häufig für Aufgaben der Objekterkennung verwendet. Er enthält rund 9.000 Bilder aus 101 Kategorien und stellt eine anspruchsvolle Benchmark für die Bewertung von Objekterkennungsalgorithmen dar. Forscher nutzen ihn zum Trainieren und Testen von Modellen, insbesondere von Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs), im Bereich des maschinellen Sehens.

Wie kann ich ein Ultralytics YOLO Modell auf dem Caltech-101-Datensatz trainieren?

Um ein Modell Ultralytics YOLO auf dem Caltech-101-Datensatz zu trainieren, können Sie die bereitgestellten Codeschnipsel verwenden. Zum Beispiel, um für 100 Epochen zu trainieren:

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Ausführlichere Argumente und Optionen finden Sie auf der Seite zum Modell Training.

Was sind die wichtigsten Merkmale des Caltech-101-Datensatzes?

Der Caltech-101-Datensatz umfasst:

Rund 9.000 Farbbilder in 101 Kategorien.
Kategorien, die ein breites Spektrum an Objekten abdecken, darunter Tiere, Fahrzeuge und Haushaltsgegenstände.
Variable Anzahl von Bildern pro Kategorie, normalerweise zwischen 40 und 800.
Unterschiedliche Bildgrößen, die meisten mit mittlerer Auflösung.

Diese Eigenschaften machen es zu einer ausgezeichneten Wahl für das Training und die Evaluierung von Objekterkennungsmodellen im Bereich des maschinellen Lernens und der Computer Vision.

Warum sollte ich den Caltech-101-Datensatz in meiner Forschung zitieren?

Wenn Sie den Caltech-101-Datensatz in Ihrer Forschung zitieren, erkennen Sie die Beiträge der Ersteller an und bieten eine Referenz für andere, die den Datensatz verwenden könnten. Die empfohlene Zitierweise ist:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Das Zitieren hilft, die Integrität einer akademischen Arbeit zu bewahren, und erleichtert es den Kollegen, die Originalquelle zu finden.

Kann ich Ultralytics HUB für das Training von Modellen auf dem Caltech-101-Datensatz verwenden?

Ja, Sie können Ultralytics HUB zum Trainieren von Modellen mit dem Caltech-101-Datensatz verwenden. Ultralytics HUB bietet eine intuitive Plattform für die Verwaltung von Datensätzen, das Training von Modellen und deren Bereitstellung ohne umfangreiche Programmierung. Eine ausführliche Anleitung finden Sie in dem Blogbeitrag "How to train your custom models with Ultralytics HUB".

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 2 Monaten