コンテンツぞスキップ

デヌタセットの抂芁

Ultralytics は、怜出、むンスタンス分割、ポヌズ掚定、分類、倚オブゞェクト远跡などのコンピュヌタビゞョンタスクを容易にするために、様々なデヌタセットをサポヌトしおいたす。以䞋は、Ultralytics の䞻なデヌタセットのリストず、各コンピュヌタビゞョンタスクずそれぞれのデヌタセットの抂芁です。



芋るんだ Ultralytics デヌタセットの抂芁

Ultralytics ゚クスプロヌラヌ

コミュニティ・ノヌト ⚠

珟圚 ultralytics>=8.3.10Ultralytics ゚クスプロヌラヌのサポヌトは廃止されたした。しかしご心配なく珟圚では、同様の機胜、さらに匷化された機胜に Ultralytics ハブHUBは、ワヌクフロヌを合理化するために蚭蚈された、盎感的なコヌド䞍芁のプラットフォヌムです。Ultralytics HUBを䜿えば、コヌドを䞀行も曞くこずなく、デヌタの探玢、芖芚化、管理を楜に続けるこずができたす。ぜひチェックしお、その匷力な機胜をご掻甚ください🚀。

デヌタセットの埋め蟌み画像の䜜成、類䌌画像の怜玢、SQLク゚リの実行、セマンティック怜玢の実行、自然蚀語による怜玢も可胜ですGUIアプリで始めるこずも、APIを䜿っお独自に構築するこずもできたす。詳しくはこちらをご芧ください。

Ultralytics ゚クスプロヌラヌ スクリヌンショット

物䜓怜出

バりンディングボックスオブゞェクト怜出は、各オブゞェクトの呚りにバりンディングボックスを描画するこずにより、画像内のオブゞェクトを怜出し、ロヌカラむズするこずを含むコンピュヌタビゞョン技術である。

  • Argoverse豊富なアノテヌションを持぀郜垂環境の3Dトラッキングずモヌション予枬デヌタを含むデヌタセット。
  • COCO: Common Objects in Context (COCO)は、80のオブゞェクトカテゎリを持぀倧芏暡なオブゞェクト怜出、セグメンテヌション、キャプションデヌタセットである。
  • LVIS: 1203のオブゞェクトカテゎリを持぀倧芏暡なオブゞェクト怜出、セグメンテヌション、キャプションデヌタセット。
  • COCO8: COCO trainずCOCO valの最初の4枚の画像のサブセット。
  • COCO128: COCO trainずCOCO valの最初の128枚の画像のうち、テストに適した小さいサブセット。
  • グロヌバル小麊2020Global Wheat Challenge 2020のための小麊の頭郚画像を含むデヌタセット。
  • Objects365365の物䜓カテゎリず600K以䞊の泚釈付き画像を持぀、物䜓怜出のための高品質で倧芏暡なデヌタセット。
  • OpenImagesV7:Google による包括的なデヌタセットで、1.7Mの蚓緎画像ず42kの怜蚌画像がある。
  • SKU-110K1侇1000枚以䞊の画像ず170䞇個のバりンディングボックスを含む、小売環境における高密床な物䜓怜出を特城ずするデヌタセット。
  • VisDroneドロヌンで撮圱された10K以䞊の画像ずビデオシヌケンスからのオブゞェクト怜出ずマルチオブゞェクトトラッキングデヌタを含むデヌタセット。
  • VOC: Pascal Visual Object Classes (VOC)デヌタセット。20のオブゞェクトクラスず11K以䞊の画像を含む、オブゞェクト怜出ずセグメンテヌションのためのデヌタセット。
  • xView60のオブゞェクトカテゎリず100䞇以䞊の泚釈付きオブゞェクトを持぀俯瞰画像䞭のオブゞェクト怜出甚デヌタセット。
  • RF100包括的なモデル評䟡のための、7぀の画像領域にたたがる100のデヌタセットからなる倚様な物䜓怜出ベンチマヌク。
  • 脳腫瘍脳腫瘍を怜出するためのデヌタセットには、腫瘍の有無、䜍眮、特城に関する詳现を含むMRIたたはCTスキャン画像が含たれる。
  • African-wildlifeバッファロヌ、ゟり、サむ、シマりマなど、アフリカの野生動物の画像を集めたデヌタセット。
  • 眲名様々な文曞の画像に眲名の泚釈を付けたデヌタセットで、文曞の怜蚌や䞍正怜出の研究を支揎する。
  • Medical-pills: A dataset containing labeled images of medical-pills, designed to aid in tasks like pharmaceutical quality control, sorting, and ensuring compliance with industry standards.

むンスタンスのセグメンテヌション

むンスタンスセグメンテヌションは、画像内のオブゞェクトをピクセルレベルで識別し、䜍眮を特定するコンピュヌタビゞョン技術である。

  • COCO: オブゞェクト怜出、セグメンテヌション、キャプション付けタスク甚に蚭蚈された倧芏暡なデヌタセットで、20䞇枚以䞊のラベル付き画像がある。
  • COCO8-seg: むンスタンスのセグメンテヌションタスク甚の小芏暡なデヌタセットで、セグメンテヌション泚釈付きのCOCO画像8枚のサブセットを含む。
  • COCO128-seg: むンスタンスのセグメンテヌションタスク甚の小芏暡なデヌタセットで、セグメンテヌション泚釈付きの128枚のCOCO画像のサブセットを含む。
  • Crack-seg道路や壁のひび割れを怜出するために特別に䜜られたデヌタセットで、物䜓怜出ずセグメンテヌションの䞡方のタスクに適甚できる。
  • Package-seg: 倉庫や産業環境で荷物を識別するためのデヌタセットで、物䜓怜出ずセグメンテヌションの䞡方のアプリケヌションに適しおいたす。
  • Carparts-seg: 自動車の郚品を識別するために䜜られたデヌタセットで、蚭蚈、補造、研究のニヌズに察応しおいる。オブゞェクト怜出ずセグメンテヌションの䞡方のタスクに察応しおいる。

ポヌズ掚定

姿勢掚定は、カメラたたはワヌルド座暙系に察するオブゞェクトの盞察的な姿勢を決定するために䜿甚される技術です。

  • COCO: ポヌズ掚定タスクのために蚭蚈された、人間のポヌズアノテヌションを含む倧芏暡デヌタセット。
  • COCO8-pose人間のポヌズアノテヌションが付いた8枚のCOCO画像のサブセットを含む、ポヌズ掚定タスク甚の小芏暡デヌタセット。
  • Tiger-pose: トラに焊点を圓おた263枚の画像からなるコンパクトなデヌタセットで、ポヌズ掚定タスクのためにトラ1頭に぀き12個のキヌポむントがアノテヌションされおいる。
  • 手のキヌポむント人間の手を䞭心ずした26,000点以䞊の画像から構成される簡朔なデヌタセットで、1぀の手に぀き21のキヌポむントがアノテヌションされおおり、ポヌズ掚定タスク甚に蚭蚈されおいたす。
  • Dog-pose: 犬に焊点を圓おた玄6,000枚の画像からなる包括的なデヌタセットで、犬1頭に぀き24のキヌポむントがアノテヌションされおおり、ポヌズ掚定タスク甚に調敎されおいる。

分類

画像分類は、画像をその芖芚的内容に基づいお1぀たたは耇数の定矩枈みのクラスたたはカテゎリに分類するこずを含むコンピュヌタビゞョンのタスクです。

  • Caltech 101: 画像分類タスクのための101のオブゞェクトカテゎリの画像を含むデヌタセット。
  • カルテック256Caltech101の拡匵版で、256のオブゞェクトカテゎリヌず、より難易床の高い画像が甚意されおいる。
  • CIFAR-10: 32x32のカラヌ画像60K枚を10クラスに分類したデヌタセット。
  • CIFAR-100CIFAR-10の拡匵版で、1クラスあたり100のオブゞェクトカテゎリず600の画像を持぀。
  • Fashion-MNIST画像分類タスクのための、10のファッションカテゎリの70,000グレヌスケヌル画像からなるデヌタセット。
  • ImageNet1,400䞇以䞊の画像ず20,000以䞊のカテゎリを持぀、物䜓怜出ず画像分類のための倧芏暡なデヌタセット。
  • ImageNet-10実隓ずテストをより迅速に行うための、ImageNetの10カテゎリより小さいサブセット。
  • ImagenetteImageNetの小さなサブセットで、10個の区別しやすいクラスが含たれ、蚓緎ずテストを迅速に行うこずができる。
  • Imagewoof画像分類タスクのための10犬皮カテゎリを含む、ImageNetのより困難なサブセット。
  • MNIST手曞き数字のグレヌスケヌル画像70,000枚からなる画像分類甚デヌタセット。
  • MNIST160MNISTデヌタセットから、各MNISTカテゎリの最初の8画像。デヌタセットには合蚈160枚の画像が含たれる。

オリ゚ンテッド・バりンディング・ボックスOBB

OBBOriented Bounding Boxesは、回転したバりンディングボックスを䜿甚しお画像内の角床のあるオブゞェクトを怜出するためのコンピュヌタビゞョンの手法であり、倚くの堎合、航空画像や衛星画像に適甚される。

  • DOTA-v2170䞇個のむンスタンスず11,268枚の画像を持぀人気のOBB航空画像デヌタセット。
  • DOTA8: DOTAv1スプリットセットの最初の8枚の画像トレヌニング甚4枚、怜蚌甚4枚のサブセット。

マルチオブゞェクト・トラッキング

マルチオブゞェクトトラッキングは、ビデオシヌケンス内の耇数のオブゞェクトを怜出し、時間経過ずずもに远跡するコンピュヌタビゞョン技術である。

  • Argoverse倚オブゞェクト远跡タスクのための豊富なアノテヌションを持぀、郜垂環境からの3D远跡および運動予枬デヌタを含むデヌタセット。
  • VisDroneドロヌンで撮圱された10K以䞊の画像ずビデオシヌケンスからのオブゞェクト怜出ずマルチオブゞェクトトラッキングデヌタを含むデヌタセット。

新しいデヌタセットを提䟛する

新しいデヌタセットを提䟛するには、既存のむンフラずうたく敎合させるためのいく぀かのステップが必芁である。以䞋に必芁なステップを瀺す

新しいデヌタセットを投皿する手順

  1. 画像を集めるデヌタセットに属する画像を集める。これらの画像は、公共のデヌタベヌスやあなた自身のコレクションなど、さたざたな情報源から集めるこずができる。
  2. 画像に泚釈を付けるタスクに応じお、これらの画像にバりンディングボックス、セグメント、たたはキヌポむントで泚釈を付けたす。
  3. 泚釈の゚クスポヌト:これらの泚釈をYOLO *.txt Ultralytics 。
  4. デヌタセットの敎理:デヌタセットを正しいフォルダ構造に敎理しおください。その際 train/ そしお val/ トップレベル・ディレクトリがあり、それぞれの䞭に images/ そしお labels/ サブディレクトリにある。

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. を䜜成する。 data.yaml ファむル:デヌタセットのルヌト・ディレクトリに data.yaml ファむルには、デヌタセット、クラス、その他必芁な情報が蚘述されおいる。

  6. 画像の最適化オプションより効率的な凊理のためにデヌタセットのサむズを小さくしたい堎合は、以䞋のコヌドを䜿甚しお画像を最適化するこずができたす。これは必須ではありたせんが、デヌタセットのサむズを小さくし、ダりンロヌド速床を速くするためにお勧めしたす。
  7. デヌタセットをZIP圧瞮するデヌタセットフォルダ党䜓をzipファむルに圧瞮する。
  8. ドキュメントずPRあなたのデヌタセットず、それが既存のフレヌムワヌクにどのように適合するかを説明するドキュメントペヌゞを䜜成する。その埌、Pull Request (PR)を提出する。PRの提出方法の詳现に぀いおは、Ultralytics Contribution Guidelinesを参照しおください。

デヌタセットを最適化しお圧瞮するコヌド䟋

デヌタセットの最適化ず圧瞮

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

これらのステップに埓うこずで、Ultralytics' 既存の構造ずうたく統合した新しいデヌタセットを提䟛するこずができる。

よくあるご質問

Ultralytics 、どのようなデヌタセットが物䜓怜出に察応しおいたすか

Ultralytics を含む、物䜓怜出のための倚皮倚様なデヌタセットをサポヌトしおいる

  • COCO: 80のオブゞェクトカテゎリを持぀倧芏暡なオブゞェクト怜出、セグメンテヌション、キャプションデヌタセット。
  • LVIS: 1203のオブゞェクトカテゎリを持぀広範なデヌタセットで、より现かいオブゞェクト怜出ずセグメンテヌションのために蚭蚈されおいる。
  • Argoverse豊富なアノテヌションを持぀郜垂環境の3Dトラッキングずモヌション予枬デヌタを含むデヌタセット。
  • VisDroneドロヌンで撮圱された画像からの物䜓怜出ず耇数物䜓の远跡デヌタを含むデヌタセット。
  • SKU-110K1侇1000枚を超える画像で、小売環境における高密床な物䜓怜出を実珟。

これらのデヌタセットは、様々な物䜓怜出アプリケヌションのためのロバストモデルの孊習を容易にする。

新しいデヌタセットをUltralytics に投皿するには

新しいデヌタセットを提䟛するには、いく぀かのステップがある

  1. 画像を集める公共のデヌタベヌスや個人のコレクションから画像を集める。
  2. 画像に泚釈を付けるタスクに応じお、バりンディングボックス、セグメント、たたはキヌポむントを適甚したす。
  3. 泚釈の゚クスポヌト:アノテヌションをYOLO *.txt ずいう圢匏をずっおいる。
  4. デヌタセットの敎理:でフォルダ構造を䜿甚する。 train/ そしお val/ ディレクトリがあり、それぞれに images/ そしお labels/ サブディレクトリにある。
  5. を䜜成する。 data.yaml ファむル:デヌタセットの説明、クラス、その他の関連情報を含む。
  6. 画像の最適化オプション効率化のためにデヌタセットサむズを瞮小したす。
  7. デヌタセットをZIP圧瞮するデヌタセットをzipファむルに圧瞮する。
  8. 文曞ずPRあなたのデヌタセットを説明し、Ultralytics Contribution Guidelinesに埓っおPull Requestを提出しおください。

包括的なガむドはContribute New Datasetsをご芧ください。

自分のデヌタセットにUltralytics Explorer を䜿うべき理由は

Ultralytics ゚クスプロヌラヌは、デヌタセット分析のための匷力な機胜を提䟛しおいたす

  • 埋め蟌み生成画像のベクトル埋め蟌みを䜜成したす。
  • セマンティック怜玢埋め蟌みやAIを䜿っお類䌌画像を怜玢。
  • SQLク゚リ詳现なデヌタ分析のために高床なSQLク゚リを実行したす。
  • 自然蚀語怜玢䜿いやすさを远求した自然蚀語による怜玢。

詳しくはUltralytics ゚クスプロヌラヌで GUIデモをお詊しください。

Ultralytics YOLO コンピュヌタビゞョン甚モデルのナニヌクな特城は

Ultralytics YOLO モデルにはいく぀かのナニヌクな特城がある

  • リアルタむム性胜高速掚論ずトレヌニング。
  • 汎甚性怜出、セグメンテヌション、分類、姿勢掚定タスクに適しおいる。
  • 事前孊習枈みモデル様々なアプリケヌションに察応した高性胜の事前孊習枈みモデルにアクセスできたす。
  • 広範なコミュニティ・サポヌト掻発なコミュニティず、トラブルシュヌティングや開発のための包括的なドキュメント。

YOLO 。 Ultralytics YOLOペヌゞをご芧ください。

Ultralytics ツヌルを䜿っおデヌタセットを最適化し、zip圧瞮するにはどうすればよいですか

Ultralytics ツヌルを䜿っおデヌタセットを最適化し、zip圧瞮するには、次のコヌド䟋に埓っおください

デヌタセットの最適化ず圧瞮

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

デヌタセットの最適化ずZip圧瞮の方法に぀いおは、こちらをご芧ください。

📅䜜成1幎前 ✏曎新したした 18日前

コメント