コンテンツぞスキップ

デヌタセットの抂芁

Ultralytics は、怜出、むンスタンス分割、ポヌズ掚定、分類、倚オブゞェクト远跡などのコンピュヌタビゞョンタスクを容易にするために、様々なデヌタセットをサポヌトしおいたす。以䞋は、Ultralytics の䞻なデヌタセットのリストず、各コンピュヌタビゞョンタスクずそれぞれのデヌタセットの抂芁です。



芋るんだ Ultralytics デヌタセットの抂芁

NEW 🚀Ultralytics ゚クスプロヌラヌ

デヌタセットの埋め蟌み画像の䜜成、類䌌画像の怜玢、SQLク゚リの実行、セマンティック怜玢の実行、自然蚀語による怜玢も可胜ですGUIアプリで始めるこずも、APIを䜿っお独自に構築するこずもできたす。詳しくはこちらをご芧ください。

Ultralytics ゚クスプロヌラヌ スクリヌンショット

物䜓怜出

バりンディングボックスオブゞェクト怜出は、各オブゞェクトの呚りにバりンディングボックスを描画するこずにより、画像内のオブゞェクトを怜出し、ロヌカラむズするこずを含むコンピュヌタビゞョン技術である。

  • Argoverse豊富なアノテヌションを持぀郜垂環境の3Dトラッキングずモヌション予枬デヌタを含むデヌタセット。
  • COCO: Common Objects in Context (COCO)は、80のオブゞェクトカテゎリを持぀倧芏暡なオブゞェクト怜出、セグメンテヌション、キャプションデヌタセットである。
  • LVIS: 1203のオブゞェクトカテゎリを持぀倧芏暡なオブゞェクト怜出、セグメンテヌション、キャプションデヌタセット。
  • COCO8: COCO trainずCOCO valの最初の4枚の画像のサブセット。
  • グロヌバル小麊2020Global Wheat Challenge 2020のための小麊の頭郚画像を含むデヌタセット。
  • Objects365365の物䜓カテゎリず600K以䞊の泚釈付き画像を持぀、物䜓怜出のための高品質で倧芏暡なデヌタセット。
  • OpenImagesV7:Google による包括的なデヌタセットで、1.7Mの蚓緎画像ず42kの怜蚌画像がある。
  • SKU-110K1侇1000枚以䞊の画像ず170䞇個のバりンディングボックスを含む、小売環境における高密床の物䜓怜出を特城ずするデヌタセット。
  • VisDroneドロヌンで撮圱された10K以䞊の画像ずビデオシヌケンスからのオブゞェクト怜出ずマルチオブゞェクトトラッキングデヌタを含むデヌタセット。
  • VOC: Pascal Visual Object Classes (VOC)デヌタセット。20のオブゞェクトクラスず11K以䞊の画像を含む、オブゞェクト怜出ずセグメンテヌションのためのデヌタセット。
  • xView60のオブゞェクトカテゎリず100䞇以䞊の泚釈付きオブゞェクトを持぀俯瞰画像䞭のオブゞェクト怜出甚デヌタセット。
  • Roboflow 1007぀の画像領域にたたがる100のデヌタセットからなる倚様な物䜓怜出ベンチマヌクで、モデルの包括的な評䟡を行う。
  • 脳腫瘍脳腫瘍を怜出するためのデヌタセットには、腫瘍の有無、䜍眮、特城に関する詳现を含むMRIたたはCTスキャン画像が含たれる。
  • African-wildlifeバッファロヌ、ゟり、サむ、シマりマなど、アフリカの野生動物の画像を集めたデヌタセット。
  • 眲名様々な文曞の画像に眲名の泚釈を付けたデヌタセットで、文曞の怜蚌や䞍正怜出の研究を支揎する。

むンスタンスのセグメンテヌション

むンスタンスセグメンテヌションは、画像内のオブゞェクトをピクセルレベルで識別し、䜍眮を特定するコンピュヌタビゞョン技術である。

  • COCO: オブゞェクト怜出、セグメンテヌション、キャプション付けタスク甚に蚭蚈された倧芏暡なデヌタセットで、20䞇枚以䞊のラベル付き画像がある。
  • COCO8-seg: むンスタンスのセグメンテヌションタスク甚の小芏暡なデヌタセットで、セグメンテヌション泚釈付きのCOCO画像8枚のサブセットを含む。
  • Crack-seg道路や壁のひび割れを怜出するために特別に䜜られたデヌタセットで、物䜓怜出ずセグメンテヌションの䞡方のタスクに適甚できる。
  • Package-seg: 倉庫や産業環境で荷物を識別するためのデヌタセットで、物䜓怜出ずセグメンテヌションの䞡方のアプリケヌションに適しおいたす。
  • Carparts-seg: 自動車の郚品を識別するために䜜られたデヌタセットで、蚭蚈、補造、研究のニヌズに察応しおいる。オブゞェクト怜出ずセグメンテヌションの䞡方のタスクに察応しおいる。

ポヌズ掚定

姿勢掚定は、カメラたたはワヌルド座暙系に察するオブゞェクトの盞察的な姿勢を決定するために䜿甚される技術です。

  • COCO: ポヌズ掚定タスクのために蚭蚈された、人間のポヌズアノテヌションを含む倧芏暡デヌタセット。
  • COCO8-pose人間のポヌズアノテヌションが付いた8枚のCOCO画像のサブセットを含む、ポヌズ掚定タスク甚の小芏暡デヌタセット。
  • Tiger-pose: トラに焊点を圓おた263枚の画像からなるコンパクトなデヌタセットで、ポヌズ掚定タスクのためにトラ1頭に぀き12個のキヌポむントがアノテヌションされおいる。

分類

画像分類は、画像をその芖芚的内容に基づいお1぀たたは耇数の定矩枈みのクラスたたはカテゎリに分類するこずを含むコンピュヌタビゞョンのタスクです。

  • Caltech 101: 画像分類タスクのための101のオブゞェクトカテゎリの画像を含むデヌタセット。
  • カルテック256Caltech101の拡匵版で、256のオブゞェクトカテゎリヌず、より難易床の高い画像が甚意されおいる。
  • CIFAR-10: 32x32のカラヌ画像60K枚を10クラスに分類したデヌタセット。
  • CIFAR-100CIFAR-10の拡匵版で、1クラスあたり100のオブゞェクトカテゎリず600の画像を持぀。
  • Fashion-MNIST画像分類タスクのための、10のファッションカテゎリの70,000グレヌスケヌル画像からなるデヌタセット。
  • ImageNet1,400䞇以䞊の画像ず20,000以䞊のカテゎリを持぀、物䜓怜出ず画像分類のための倧芏暡なデヌタセット。
  • ImageNet-10実隓ずテストをより迅速に行うための、ImageNetの10カテゎリより小さいサブセット。
  • ImagenetteImageNetの小さなサブセットで、10個の区別しやすいクラスが含たれ、蚓緎ずテストを迅速に行うこずができる。
  • Imagewoof画像分類タスクのための10犬皮カテゎリを含む、ImageNetのより困難なサブセット。
  • MNIST手曞き数字のグレヌスケヌル画像70,000枚からなる画像分類甚デヌタセット。

オリ゚ンテッド・バりンディング・ボックスOBB

OBBOriented Bounding Boxesは、回転したバりンディングボックスを䜿甚しお画像内の角床のあるオブゞェクトを怜出するためのコンピュヌタビゞョンの手法であり、倚くの堎合、航空画像や衛星画像に適甚される。

  • DOTA-v2170䞇個のむンスタンスず11,268枚の画像を持぀人気のOBB航空画像デヌタセット。

マルチオブゞェクト・トラッキング

マルチオブゞェクトトラッキングは、ビデオシヌケンス内の耇数のオブゞェクトを怜出し、時間をかけお远跡するコンピュヌタビゞョン技術です。

  • Argoverse倚オブゞェクト远跡タスクのための豊富なアノテヌションを持぀、郜垂環境からの3D远跡および運動予枬デヌタを含むデヌタセット。
  • VisDroneドロヌンで撮圱された10K以䞊の画像ずビデオシヌケンスからのオブゞェクト怜出ずマルチオブゞェクトトラッキングデヌタを含むデヌタセット。

新しいデヌタセットを提䟛する

新しいデヌタセットを提䟛するには、既存のむンフラずうたく敎合させるためのいく぀かのステップが必芁である。以䞋に必芁なステップを瀺す

新しいデヌタセットを投皿する手順

  1. 画像を集めるデヌタセットに属する画像を集める。これらの画像は、公共デヌタベヌスやあなた自身のコレクションなど、さたざたな情報源から集めるこずができる。
  2. 画像に泚釈を付けるタスクに応じお、バりンディングボックス、セグメント、たたはキヌポむントで画像に泚釈を付けたす。
  3. 泚釈の゚クスポヌト:これらの泚釈をYOLO *.txt Ultralytics 。
  4. デヌタセットの敎理:デヌタセットを正しいフォルダ構造に敎理しおください。その際 train/ そしお val/ トップレベル・ディレクトリがあり、それぞれの䞭に images/ そしお labels/ サブディレクトリにある。

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. を䜜成する。 data.yaml ファむル:デヌタセットのルヌト・ディレクトリに data.yaml ファむルには、デヌタセット、クラス、その他必芁な情報が蚘述されおいる。

  6. 画像の最適化オプションより効率的な凊理のためにデヌタセットのサむズを小さくしたい堎合は、以䞋のコヌドを䜿っお画像を最適化するこずができたす。これは必須ではありたせんが、デヌタセットのサむズを小さくし、ダりンロヌド速床を速くするためにお勧めしたす。
  7. デヌタセットをZIP圧瞮するデヌタセットフォルダ党䜓をzipファむルに圧瞮する。
  8. ドキュメントずPRあなたのデヌタセットず、それが既存のフレヌムワヌクにどのように適合するかを説明するドキュメントペヌゞを䜜成する。その埌、Pull Request (PR)を提出する。PRの提出方法の詳现に぀いおは、Ultralytics Contribution Guidelinesを参照しおください。

デヌタセットを最適化しお圧瞮するコヌド䟋

デヌタセットの最適化ず圧瞮

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

これらのステップに埓うこずで、Ultralytics' 既存の構造ずうたく統合した新しいデヌタセットを提䟛するこずができる。

よくあるご質問

Ultralytics 、どのようなデヌタセットが物䜓怜出に察応しおいたすか

Ultralytics は、以䞋のような物䜓怜出のための倚様なデヌタセットをサポヌトしおいる -COCO: 80のオブゞェクトカテゎリを持぀倧芏暡なオブゞェクト怜出、セグメンテヌション、キャプション付けのデヌタセット。 -LVIS: 1203のオブゞェクトカテゎリを持぀広範なデヌタセットで、より现かいオブゞェクト怜出ずセグメンテヌションのために蚭蚈されおいる。 - Argoverse豊富なアノテヌションを持぀郜垂環境からの3Dトラッキングずモヌション予枬デヌタを含むデヌタセット。 -VisDroneドロヌンで撮圱された画像からの物䜓怜出ずマルチオブゞェクトトラッキングデヌタセット。 -SKU-110K1侇1000枚を超える画像から、小売店環境における高密床な物䜓怜出が可胜。

これらのデヌタセットは、様々な物䜓怜出アプリケヌションのためのロバストモデルの孊習を容易にする。

新しいデヌタセットをUltralytics に投皿するには

新しいデヌタセットを提䟛するには、いく぀かのステップがある 1. 画像を集める:公的デヌタベヌスや個人のコレクションから画像を収集する。 2. 画像に泚釈を付ける:タスクに応じお、バりンディングボックス、セグメント、たたはキヌポむントを適甚したす。 3. 泚釈の゚クスポヌト:アノテヌションをYOLO *.txt フォヌマット。 4. デヌタセットの敎理:でフォルダ構造を䜿甚する。 train/ そしお val/ ディレクトリがあり、それぞれに images/ そしお labels/ サブディレクトリにある。 5. を䜜成する。 data.yaml ファむル:デヌタセットの説明クラスその他の関連情報を含む 6. 画像の最適化オプション:効率化のためにデヌタセットのサむズを小さくする。 7. Zipデヌタセット:デヌタセットをzipファむルに圧瞮する。 8. ドキュメントずPR:デヌタセットを説明し、以䞋の Pull Request を提出する。 Ultralytics 寄付ガむドラむン.

包括的なガむドはContribute New Datasetsをご芧ください。

自分のデヌタセットにUltralytics Explorer を䜿うべき理由は

Ultralytics Explorerは、デヌタセット解析のために以䞋のような匷力な機胜を提䟛したす - 埋め蟌み画像の生成画像のベクトル埋め蟌みを䜜成したす。 - セマンティック怜玢埋め蟌み画像やAIを䜿っお類䌌画像を怜玢したす。 - SQLク゚リ詳现なデヌタ分析のための高床なSQLク゚リを実行したす。 - 自然蚀語怜玢䜿いやすさを远求した自然蚀語による怜玢。

詳しくはUltralytics ゚クスプロヌラヌで GUIデモをお詊しください。

Ultralytics YOLO コンピュヌタビゞョン甚モデルのナニヌクな特城は

Ultralytics YOLO モデルにはいく぀かのナニヌクな特城がありたす - リアルタむム性胜高速掚論ずトレヌニング。 - 汎甚性怜出、セグメンテヌション、分類、および姿勢掚定タスクに適しおいたす。 - 事前孊習枈みモデル様々なアプリケヌションのための高性胜な事前孊習枈みモデルぞのアクセス。 - 広範なコミュニティサポヌト掻発なコミュニティず、トラブルシュヌティングや開発のための包括的なドキュメント。

YOLO 。 Ultralytics YOLOペヌゞをご芧ください。

Ultralytics ツヌルを䜿っおデヌタセットを最適化し、zip圧瞮するにはどうすればよいですか

Ultralytics ツヌルを䜿っおデヌタセットを最適化し、zip圧瞮するには、次のコヌド䟋に埓っおください

デヌタセットの最適化ず圧瞮

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

デヌタセットの最適化ずZip圧瞮の方法に぀いおは、こちらをご芧ください。



䜜成日2023-11-12 曎新日2024-07-04
䜜成者glenn-jocher(10),RizwanMunawar(2),Burhan-Q(1),Laughing-q(1),abirami-vina(1),AyushExel(2)

コメント