Tài liệu tham khảo cho ultralytics/data/loaders.py
Ghi
Tệp này có sẵn tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/dữ liệu/loaders.py. Nếu bạn phát hiện ra một vấn đề, vui lòng giúp khắc phục nó bằng cách đóng góp Yêu cầu 🛠️ kéo. Cảm ơn bạn 🙏 !
ultralytics.data.loaders.SourceTypes
dataclass
Lớp để đại diện cho các loại nguồn đầu vào khác nhau cho các dự đoán.
Mã nguồn trong ultralytics/data/loaders.py
ultralytics.data.loaders.LoadStreams
Trình tải luồng cho các loại luồng video khác nhau, Hỗ trợ các luồng RTSP, RTMP, HTTP và TCP.
Thuộc tính:
Tên | Kiểu | Sự miêu tả |
---|---|---|
sources |
str
|
Đường dẫn nhập nguồn hoặc URL cho luồng video. |
vid_stride |
int
|
Sải bước tốc độ khung hình video, mặc định là 1. |
buffer |
bool
|
Có đệm các luồng đầu vào hay không, mặc định là False. |
running |
bool
|
Gắn cờ để cho biết chuỗi phát trực tuyến có đang chạy hay không. |
mode |
str
|
Đặt thành 'luồng' cho biết chụp theo thời gian thực. |
imgs |
list
|
Danh sách khung hình ảnh cho mỗi luồng. |
fps |
list
|
Danh sách FPS cho mỗi luồng. |
frames |
list
|
Danh sách tổng số khung cho mỗi luồng. |
threads |
list
|
Danh sách các chủ đề cho mỗi luồng. |
shape |
list
|
Danh sách các hình dạng cho mỗi luồng. |
caps |
list
|
Danh sách cv2. VideoCapture đối tượng cho mỗi luồng. |
bs |
int
|
Kích thước lô để xử lý. |
Phương pháp:
Tên | Sự miêu tả |
---|---|
__init__ |
Khởi tạo trình tải luồng. |
update |
Đọc khung sự kiện trực tiếp trong chuỗi daemon. |
close |
Đóng trình tải luồng và giải phóng tài nguyên. |
__iter__ |
Trả về một đối tượng lặp cho lớp. |
__next__ |
Trả về đường dẫn nguồn, hình ảnh đã chuyển đổi và hình ảnh gốc để xử lý. |
__len__ |
Trả về độ dài của đối tượng sources. |
Mã nguồn trong ultralytics/data/loaders.py
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 |
|
__init__(sources='file.streams', vid_stride=1, buffer=False)
Khởi tạo các biến phiên bản và kiểm tra các hình dạng luồng đầu vào nhất quán.
Mã nguồn trong ultralytics/data/loaders.py
__iter__()
__len__()
__next__()
Trả về đường dẫn nguồn, hình ảnh đã chuyển đổi và ảnh gốc để xử lý.
Mã nguồn trong ultralytics/data/loaders.py
close()
Đóng trình tải luồng và giải phóng tài nguyên.
Mã nguồn trong ultralytics/data/loaders.py
update(i, cap, stream)
Đọc luồng i
khung trong chủ đề daemon.
Mã nguồn trong ultralytics/data/loaders.py
ultralytics.data.loaders.LoadScreenshots
YOLOv8 Ảnh chụp màn hình Dataloader.
Lớp này quản lý việc tải hình ảnh chụp màn hình để xử lý với YOLOv8. Thích hợp để sử dụng với yolo predict source=screen
.
Thuộc tính:
Tên | Kiểu | Sự miêu tả |
---|---|---|
source |
str
|
Đầu vào nguồn cho biết màn hình nào cần chụp. |
screen |
int
|
Số màn hình cần chụp. |
left |
int
|
Tọa độ bên trái cho khu vực chụp màn hình. |
top |
int
|
Tọa độ trên cùng cho khu vực chụp màn hình. |
width |
int
|
Chiều rộng của khu vực chụp màn hình. |
height |
int
|
Chiều cao của khu vực chụp màn hình. |
mode |
str
|
Đặt thành 'luồng' cho biết chụp theo thời gian thực. |
frame |
int
|
Bộ đếm cho các khung hình đã chụp. |
sct |
mss
|
Đối tượng chụp màn hình từ |
bs |
int
|
Kích thước lô, đặt thành 1. |
monitor |
dict
|
Giám sát chi tiết cấu hình. |
Phương pháp:
Tên | Sự miêu tả |
---|---|
__iter__ |
Trả về một đối tượng lặp. |
__next__ |
Chụp ảnh màn hình tiếp theo và trả về. |
Mã nguồn trong ultralytics/data/loaders.py
__init__(source)
Nguồn = [screen_number chiều cao chiều rộng trên cùng bên trái] (pixel).
Mã nguồn trong ultralytics/data/loaders.py
__iter__()
__next__()
MSS Screen Capture: Lấy pixel thô từ màn hình dưới dạng mảng NP.
Mã nguồn trong ultralytics/data/loaders.py
ultralytics.data.loaders.LoadImagesAndVideos
YOLOv8 Bộ tải dữ liệu hình ảnh / video.
Lớp này quản lý việc tải và tiền xử lý dữ liệu hình ảnh và video cho YOLOv8. Nó hỗ trợ tải từ Các định dạng khác nhau, bao gồm các tệp hình ảnh đơn lẻ, tệp video và danh sách các đường dẫn hình ảnh và video.
Thuộc tính:
Tên | Kiểu | Sự miêu tả |
---|---|---|
files |
list
|
Danh sách đường dẫn tệp hình ảnh và video. |
nf |
int
|
Tổng số tệp (hình ảnh và video). |
video_flag |
list
|
Cờ cho biết tệp là video (True) hay hình ảnh (False). |
mode |
str
|
Chế độ hiện tại, 'hình ảnh' hoặc 'video'. |
vid_stride |
int
|
Sải bước cho tốc độ khung hình video, mặc định là 1. |
bs |
int
|
Kích thước lô, được đặt thành 1 cho lớp này. |
cap |
VideoCapture
|
Đối tượng quay video cho OpenCV. |
frame |
int
|
Bộ đếm khung hình cho video. |
frames |
int
|
Tổng số khung hình trong video. |
count |
int
|
Bộ đếm cho lần lặp, được khởi tạo tại 0 trong |
Phương pháp:
Tên | Sự miêu tả |
---|---|
_new_video |
Tạo CV2 mới. Đối tượng VideoCapture cho một đường dẫn video nhất định. |
Mã nguồn trong ultralytics/data/loaders.py
251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 |
|
__init__(path, batch=1, vid_stride=1)
Khởi tạo Dataloader và nâng cao FileNotFoundError nếu không tìm thấy tệp.
Mã nguồn trong ultralytics/data/loaders.py
__iter__()
__len__()
__next__()
Trả về lô hình ảnh hoặc khung video tiếp theo cùng với đường dẫn và siêu dữ liệu của chúng.
Mã nguồn trong ultralytics/data/loaders.py
ultralytics.data.loaders.LoadPilAndNumpy
Tải hình ảnh từ mảng PIL và Numpy để xử lý hàng loạt.
Lớp này được thiết kế để quản lý tải và tiền xử lý dữ liệu hình ảnh từ cả định dạng PIL và Numpy. Nó thực hiện xác nhận cơ bản và chuyển đổi định dạng để đảm bảo rằng hình ảnh ở định dạng yêu cầu cho xử lý hạ nguồn.
Thuộc tính:
Tên | Kiểu | Sự miêu tả |
---|---|---|
paths |
list
|
Danh sách đường dẫn hình ảnh hoặc tên tệp được tạo tự động. |
im0 |
list
|
Danh sách các hình ảnh được lưu trữ dưới dạng mảng Numpy. |
mode |
str
|
Loại dữ liệu đang được xử lý, mặc định là 'hình ảnh'. |
bs |
int
|
Kích thước lô, tương đương với chiều dài của |
Phương pháp:
Tên | Sự miêu tả |
---|---|
_single_check |
Xác thực và định dạng một hình ảnh duy nhất thành mảng Numpy. |
Mã nguồn trong ultralytics/data/loaders.py
__init__(im0)
Khởi tạo PIL và Numpy Dataloader.
Mã nguồn trong ultralytics/data/loaders.py
__iter__()
__len__()
__next__()
Trả về đường dẫn hàng loạt, hình ảnh, hình ảnh đã xử lý, Không có, ''.
ultralytics.data.loaders.LoadTensor
Tải hình ảnh từ torch.Tensor dữ liệu.
Lớp này quản lý việc tải và tiền xử lý dữ liệu hình ảnh từ PyTorch tensor để xử lý thêm.
Thuộc tính:
Tên | Kiểu | Sự miêu tả |
---|---|---|
im0 |
Tensor
|
Đầu vào tensor chứa (các) hình ảnh. |
bs |
int
|
Kích thước lô, suy ra từ hình dạng của |
mode |
str
|
Chế độ hiện tại, được đặt thành 'hình ảnh'. |
paths |
list
|
Danh sách đường dẫn hình ảnh hoặc tên tệp. |
count |
int
|
Bộ đếm cho lần lặp, được khởi tạo tại 0 trong |
Phương pháp:
Tên | Sự miêu tả |
---|---|
_single_check |
Xác thực và có thể sửa đổi đầu vào tensor. |
Mã nguồn trong ultralytics/data/loaders.py
__init__(im0)
Khởi tạo Tensor Bộ tải dữ liệu.
Mã nguồn trong ultralytics/data/loaders.py
__iter__()
__len__()
ultralytics.data.loaders.autocast_list(source)
Hợp nhất một danh sách các nguồn của các loại khác nhau vào một danh sách các mảng numpy hoặc hình ảnh PIL.
Mã nguồn trong ultralytics/data/loaders.py
ultralytics.data.loaders.get_best_youtube_url(url, use_pafy=True)
Truy xuất URL của luồng video MP4 chất lượng tốt nhất từ một video YouTube nhất định.
Chức năng này sử dụng thư viện pafy hoặc yt_dlp để trích xuất thông tin video từ YouTube. Sau đó, nó tìm thấy cao nhất định dạng MP4 chất lượng có codec video nhưng không có codec âm thanh và trả về URL của luồng video này.
Thông số:
Tên | Kiểu | Sự miêu tả | Mặc định |
---|---|---|---|
url |
str
|
URL của video YouTube. |
bắt buộc |
use_pafy |
bool
|
Sử dụng gói pafy, default = True, nếu không hãy sử dụng gói yt_dlp. |
True
|
Trở lại:
Kiểu | Sự miêu tả |
---|---|
str
|
URL của luồng video MP4 chất lượng tốt nhất hoặc Không có nếu không tìm thấy luồng phù hợp. |