Objects365 데이터 세트
Objects365 데이터 세트는 야생의 다양한 객체에 중점을 두고 객체 감지 연구를 촉진하기 위해 설계된 대규모 고품질 데이터 세트입니다. Megvii 연구원 팀에서 만든 이 데이터 세트는 365개의 객체 범주를 포괄하는 포괄적인 어노테이션 경계 상자 세트와 함께 광범위한 고해상도 이미지를 제공합니다.
참고: Ultralytics를 사용하여 Objects365 데이터 세트에서 Ultralytics YOLO11을 훈련하는 방법 | 2백만 개의 주석 🚀
주요 기능
- Objects365에는 365개의 객체 범주, 2백만 개의 이미지 및 3천만 개 이상의 경계 상자가 포함되어 있습니다.
- 이 데이터 세트는 다양한 시나리오의 다양한 객체를 포함하여 객체 감지 작업에 대한 풍부하고 도전적인 벤치마크를 제공합니다.
- 주석에는 객체에 대한 경계 상자가 포함되어 있어 객체 감지 모델을 훈련하고 평가하는 데 적합합니다.
- Objects365 사전 훈련된 모델은 ImageNet 사전 훈련된 모델보다 성능이 훨씬 뛰어나 다양한 작업에서 더 나은 일반화를 제공합니다.
데이터 세트 구조
Objects365 데이터 세트는 해당 주석이 있는 단일 이미지 세트로 구성됩니다.
- 이미지: 이 데이터 세트에는 365개 범주에 걸쳐 다양한 객체를 포함하는 2백만 개의 고해상도 이미지가 포함되어 있습니다.
- Annotations: 이미지는 3천만 개 이상의 바운딩 박스로 어노테이션되어 객체 탐지 작업에 대한 포괄적인 Ground Truth 정보를 제공합니다.
응용 분야
Objects365 데이터 세트는 객체 감지 작업에서 딥러닝 모델을 훈련하고 평가하는 데 널리 사용됩니다. 이 데이터 세트는 다양한 객체 범주와 고품질 주석을 제공하므로 컴퓨터 비전 분야의 연구원과 실무자에게 매우 유용한 리소스입니다.
데이터세트 YAML
YAML(Yet Another Markup Language) 파일은 데이터 세트 구성을 정의하는 데 사용됩니다. 여기에는 데이터 세트의 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. Objects365 데이터 세트의 경우, Objects365.yaml
파일은 다음 위치에서 관리됩니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/Objects365.yaml.
ultralytics/cfg/datasets/Objects365.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Objects365 dataset https://www.objects365.org/ by Megvii
# Documentation: https://docs.ultralytics.com/datasets/detect/objects365/
# Example usage: yolo train data=Objects365.yaml
# parent
# ├── ultralytics
# └── datasets
# └── Objects365 ← downloads here (712 GB = 367G data + 345G zips)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: Objects365 # dataset root dir
train: images/train # train images (relative to 'path') 1742289 images
val: images/val # val images (relative to 'path') 80000 images
test: # test images (optional)
# Classes
names:
0: Person
1: Sneakers
2: Chair
3: Other Shoes
4: Hat
5: Car
6: Lamp
7: Glasses
8: Bottle
9: Desk
10: Cup
11: Street Lights
12: Cabinet/shelf
13: Handbag/Satchel
14: Bracelet
15: Plate
16: Picture/Frame
17: Helmet
18: Book
19: Gloves
20: Storage box
21: Boat
22: Leather Shoes
23: Flower
24: Bench
25: Potted Plant
26: Bowl/Basin
27: Flag
28: Pillow
29: Boots
30: Vase
31: Microphone
32: Necklace
33: Ring
34: SUV
35: Wine Glass
36: Belt
37: Monitor/TV
38: Backpack
39: Umbrella
40: Traffic Light
41: Speaker
42: Watch
43: Tie
44: Trash bin Can
45: Slippers
46: Bicycle
47: Stool
48: Barrel/bucket
49: Van
50: Couch
51: Sandals
52: Basket
53: Drum
54: Pen/Pencil
55: Bus
56: Wild Bird
57: High Heels
58: Motorcycle
59: Guitar
60: Carpet
61: Cell Phone
62: Bread
63: Camera
64: Canned
65: Truck
66: Traffic cone
67: Cymbal
68: Lifesaver
69: Towel
70: Stuffed Toy
71: Candle
72: Sailboat
73: Laptop
74: Awning
75: Bed
76: Faucet
77: Tent
78: Horse
79: Mirror
80: Power outlet
81: Sink
82: Apple
83: Air Conditioner
84: Knife
85: Hockey Stick
86: Paddle
87: Pickup Truck
88: Fork
89: Traffic Sign
90: Balloon
91: Tripod
92: Dog
93: Spoon
94: Clock
95: Pot
96: Cow
97: Cake
98: Dining Table
99: Sheep
100: Hanger
101: Blackboard/Whiteboard
102: Napkin
103: Other Fish
104: Orange/Tangerine
105: Toiletry
106: Keyboard
107: Tomato
108: Lantern
109: Machinery Vehicle
110: Fan
111: Green Vegetables
112: Banana
113: Baseball Glove
114: Airplane
115: Mouse
116: Train
117: Pumpkin
118: Soccer
119: Skiboard
120: Luggage
121: Nightstand
122: Tea pot
123: Telephone
124: Trolley
125: Head Phone
126: Sports Car
127: Stop Sign
128: Dessert
129: Scooter
130: Stroller
131: Crane
132: Remote
133: Refrigerator
134: Oven
135: Lemon
136: Duck
137: Baseball Bat
138: Surveillance Camera
139: Cat
140: Jug
141: Broccoli
142: Piano
143: Pizza
144: Elephant
145: Skateboard
146: Surfboard
147: Gun
148: Skating and Skiing shoes
149: Gas stove
150: Donut
151: Bow Tie
152: Carrot
153: Toilet
154: Kite
155: Strawberry
156: Other Balls
157: Shovel
158: Pepper
159: Computer Box
160: Toilet Paper
161: Cleaning Products
162: Chopsticks
163: Microwave
164: Pigeon
165: Baseball
166: Cutting/chopping Board
167: Coffee Table
168: Side Table
169: Scissors
170: Marker
171: Pie
172: Ladder
173: Snowboard
174: Cookies
175: Radiator
176: Fire Hydrant
177: Basketball
178: Zebra
179: Grape
180: Giraffe
181: Potato
182: Sausage
183: Tricycle
184: Violin
185: Egg
186: Fire Extinguisher
187: Candy
188: Fire Truck
189: Billiards
190: Converter
191: Bathtub
192: Wheelchair
193: Golf Club
194: Briefcase
195: Cucumber
196: Cigar/Cigarette
197: Paint Brush
198: Pear
199: Heavy Truck
200: Hamburger
201: Extractor
202: Extension Cord
203: Tong
204: Tennis Racket
205: Folder
206: American Football
207: earphone
208: Mask
209: Kettle
210: Tennis
211: Ship
212: Swing
213: Coffee Machine
214: Slide
215: Carriage
216: Onion
217: Green beans
218: Projector
219: Frisbee
220: Washing Machine/Drying Machine
221: Chicken
222: Printer
223: Watermelon
224: Saxophone
225: Tissue
226: Toothbrush
227: Ice cream
228: Hot-air balloon
229: Cello
230: French Fries
231: Scale
232: Trophy
233: Cabbage
234: Hot dog
235: Blender
236: Peach
237: Rice
238: Wallet/Purse
239: Volleyball
240: Deer
241: Goose
242: Tape
243: Tablet
244: Cosmetics
245: Trumpet
246: Pineapple
247: Golf Ball
248: Ambulance
249: Parking meter
250: Mango
251: Key
252: Hurdle
253: Fishing Rod
254: Medal
255: Flute
256: Brush
257: Penguin
258: Megaphone
259: Corn
260: Lettuce
261: Garlic
262: Swan
263: Helicopter
264: Green Onion
265: Sandwich
266: Nuts
267: Speed Limit Sign
268: Induction Cooker
269: Broom
270: Trombone
271: Plum
272: Rickshaw
273: Goldfish
274: Kiwi fruit
275: Router/modem
276: Poker Card
277: Toaster
278: Shrimp
279: Sushi
280: Cheese
281: Notepaper
282: Cherry
283: Pliers
284: CD
285: Pasta
286: Hammer
287: Cue
288: Avocado
289: Hami melon
290: Flask
291: Mushroom
292: Screwdriver
293: Soap
294: Recorder
295: Bear
296: Eggplant
297: Board Eraser
298: Coconut
299: Tape Measure/Ruler
300: Pig
301: Showerhead
302: Globe
303: Chips
304: Steak
305: Crosswalk Sign
306: Stapler
307: Camel
308: Formula 1
309: Pomegranate
310: Dishwasher
311: Crab
312: Hoverboard
313: Meatball
314: Rice Cooker
315: Tuba
316: Calculator
317: Papaya
318: Antelope
319: Parrot
320: Seal
321: Butterfly
322: Dumbbell
323: Donkey
324: Lion
325: Urinal
326: Dolphin
327: Electric Drill
328: Hair Dryer
329: Egg tart
330: Jellyfish
331: Treadmill
332: Lighter
333: Grapefruit
334: Game board
335: Mop
336: Radish
337: Baozi
338: Target
339: French
340: Spring Rolls
341: Monkey
342: Rabbit
343: Pencil Case
344: Yak
345: Red Cabbage
346: Binoculars
347: Asparagus
348: Barbell
349: Scallop
350: Noddles
351: Comb
352: Dumpling
353: Oyster
354: Table Tennis paddle
355: Cosmetics Brush/Eyeliner Pencil
356: Chainsaw
357: Eraser
358: Lobster
359: Durian
360: Okra
361: Lipstick
362: Cosmetics Mirror
363: Curling
364: Table Tennis
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from pathlib import Path
import numpy as np
from ultralytics.utils import TQDM
from ultralytics.utils.checks import check_requirements
from ultralytics.utils.downloads import download
from ultralytics.utils.ops import xyxy2xywhn
check_requirements("faster-coco-eval")
from faster_coco_eval import COCO
# Make Directories
dir = Path(yaml["path"]) # dataset root dir
for p in "images", "labels":
(dir / p).mkdir(parents=True, exist_ok=True)
for q in "train", "val":
(dir / p / q).mkdir(parents=True, exist_ok=True)
# Train, Val Splits
for split, patches in [("train", 50 + 1), ("val", 43 + 1)]:
print(f"Processing {split} in {patches} patches ...")
images, labels = dir / "images" / split, dir / "labels" / split
# Download
url = f"https://dorc.ks3-cn-beijing.ksyun.com/data-set/2020Objects365%E6%95%B0%E6%8D%AE%E9%9B%86/{split}/"
if split == "train":
download([f"{url}zhiyuan_objv2_{split}.tar.gz"], dir=dir) # annotations json
download([f"{url}patch{i}.tar.gz" for i in range(patches)], dir=images, curl=True, threads=8)
elif split == "val":
download([f"{url}zhiyuan_objv2_{split}.json"], dir=dir) # annotations json
download([f"{url}images/v1/patch{i}.tar.gz" for i in range(15 + 1)], dir=images, curl=True, threads=8)
download([f"{url}images/v2/patch{i}.tar.gz" for i in range(16, patches)], dir=images, curl=True, threads=8)
# Move
for f in TQDM(images.rglob("*.jpg"), desc=f"Moving {split} images"):
f.rename(images / f.name) # move to /images/{split}
# Labels
coco = COCO(dir / f"zhiyuan_objv2_{split}.json")
names = [x["name"] for x in coco.loadCats(coco.getCatIds())]
for cid, cat in enumerate(names):
catIds = coco.getCatIds(catNms=[cat])
imgIds = coco.getImgIds(catIds=catIds)
for im in TQDM(coco.loadImgs(imgIds), desc=f"Class {cid + 1}/{len(names)} {cat}"):
width, height = im["width"], im["height"]
path = Path(im["file_name"]) # image filename
try:
with open(labels / path.with_suffix(".txt").name, "a", encoding="utf-8") as file:
annIds = coco.getAnnIds(imgIds=im["id"], catIds=catIds, iscrowd=None)
for a in coco.loadAnns(annIds):
x, y, w, h = a["bbox"] # bounding box in xywh (xy top-left corner)
xyxy = np.array([x, y, x + w, y + h])[None] # pixels(1,4)
x, y, w, h = xyxy2xywhn(xyxy, w=width, h=height, clip=True)[0] # normalized and clipped
file.write(f"{cid} {x:.5f} {y:.5f} {w:.5f} {h:.5f}\n")
except Exception as e:
print(e)
사용법
이미지 크기가 640인 Objects365 데이터 세트에서 YOLO11n 모델을 100 epoch 동안 학습시키려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하십시오.
훈련 예제
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="Objects365.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=Objects365.yaml model=yolo11n.pt epochs=100 imgsz=640
샘플 데이터 및 주석
Objects365 데이터 세트에는 365개 범주의 객체가 있는 다양한 고해상도 이미지 세트가 포함되어 있어 객체 감지 작업에 풍부한 컨텍스트를 제공합니다. 다음은 데이터 세트의 이미지 예입니다.
- Objects365: 이 이미지는 객체 감지의 예를 보여 주며, 객체는 경계 상자로 주석이 추가됩니다. 데이터 세트는 이 작업에 대한 모델 개발을 용이하게 하기 위해 광범위한 이미지를 제공합니다.
이 예는 Objects365 데이터 세트의 데이터의 다양성과 복잡성을 보여주고 컴퓨터 비전 응용 프로그램에서 정확한 객체 감지의 중요성을 강조합니다.
인용 및 감사의 말씀
연구 또는 개발 작업에서 Objects365 데이터 세트를 사용하는 경우 다음 논문을 인용하십시오.
@inproceedings{shao2019objects365,
title={Objects365: A Large-scale, High-quality Dataset for Object Detection},
author={Shao, Shuai and Li, Zeming and Zhang, Tianyuan and Peng, Chao and Yu, Gang and Li, Jing and Zhang, Xiangyu and Sun, Jian},
booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision},
pages={8425--8434},
year={2019}
}
Objects365 데이터 세트를 만들고 유지 관리하여 컴퓨터 비전 연구 커뮤니티에 귀중한 리소스를 제공한 연구팀에 감사를 표합니다. Objects365 데이터 세트 및 제작자에 대한 자세한 내용은 Objects365 데이터 세트 웹사이트를 참조하십시오.
FAQ
Objects365 데이터 세트는 무엇에 사용됩니까?
Objects365 데이터 세트는 머신 러닝 및 컴퓨터 비전의 객체 감지 작업을 위해 설계되었습니다. 2백만 개의 어노테이션이 달린 이미지와 365개 범주에 걸쳐 3천만 개의 바운딩 박스를 포함하는 대규모 고품질 데이터 세트를 제공합니다. 이처럼 다양한 데이터 세트를 활용하면 객체 감지 모델의 성능과 일반화 능력을 향상시켜 해당 분야의 연구 및 개발에 매우 유용합니다.
Objects365 데이터 세트에서 YOLO11 모델을 어떻게 학습할 수 있습니까?
Objects365 데이터 세트를 사용하여 이미지 크기 640으로 YOLO11n 모델을 100 epoch 동안 훈련하려면 다음 지침을 따르십시오.
훈련 예제
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="Objects365.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=Objects365.yaml model=yolo11n.pt epochs=100 imgsz=640
사용 가능한 인수의 전체 목록은 Training 페이지를 참조하십시오.
객체 감지 프로젝트에 Objects365 데이터 세트를 사용해야 하는 이유는 무엇인가요?
Objects365 데이터 세트는 객체 감지 작업에 여러 가지 이점을 제공합니다.
- 다양성: 다양한 시나리오의 객체가 포함된 2백만 개의 이미지를 포함하며, 365개의 범주를 다룹니다.
- 고품질 어노테이션: 3천만 개 이상의 바운딩 박스가 포괄적인 Ground Truth 데이터를 제공합니다.
- 성능: Objects365에서 사전 훈련된 모델은 ImageNet과 같은 데이터 세트에서 훈련된 모델보다 성능이 훨씬 뛰어나 일반화가 더 잘 됩니다.
Objects365 데이터 세트에 대한 YAML 구성 파일은 어디에서 찾을 수 있나요?
Objects365 데이터 세트에 대한 YAML 구성 파일은 Objects365.yaml에서 사용할 수 있습니다. 이 파일에는 데이터 세트 경로 및 클래스 레이블과 같이 훈련 환경을 설정하는 데 중요한 필수 정보가 포함되어 있습니다.
Objects365의 데이터 세트 구조는 객체 감지 모델링을 어떻게 향상시키나요?
Objects365 데이터 세트는 2백만 개의 고해상도 이미지와 3천만 개 이상의 바운딩 박스에 대한 포괄적인 주석으로 구성되어 있습니다. 이러한 구조는 객체 감지에서 딥 러닝 모델을 훈련하기 위한 강력한 데이터 세트를 보장하며, 광범위한 객체와 시나리오를 제공합니다. 이러한 다양성과 볼륨은 실제 애플리케이션에 더 정확하고 일반화할 수 있는 모델을 개발하는 데 도움이 됩니다. 데이터 세트 구조에 대한 자세한 내용은 Dataset YAML 섹션을 참조하세요.