Bỏ qua nội dung

Roboflow 100 Bộ dữ liệu

Roboflow 100, được phát triển bởi Roboflow và được tài trợ bởi Intel , là một chuẩn mực phát hiện đối tượng mang tính đột phá. Nó bao gồm 100 tập dữ liệu đa dạng được lấy mẫu từ hơn 90.000 tập dữ liệu công khai. Chuẩn mực này được thiết kế để kiểm tra khả năng thích ứng của các mô hình với nhiều lĩnh vực khác nhau, bao gồm chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử.

Roboflow 100 Tổng quan

Các tính năng chính

  • Bao gồm 100 tập dữ liệu trong bảy lĩnh vực: Trên không, Trò chơi điện tử, Kính hiển vi, Dưới nước, Tài liệu, Điện từ và Thế giới thực.
  • Điểm chuẩn này bao gồm 224.714 hình ảnh trên 805 lớp, nhờ hơn 11.170 giờ nỗ lực ghi nhãn.
  • Tất cả hình ảnh đều được thay đổi kích thước thành 640x640 pixel, tập trung vào việc loại bỏ sự mơ hồ về lớp và lọc ra các lớp chưa được đại diện đầy đủ.
  • Chú thích bao gồm các hộp giới hạn cho các đối tượng, phù hợp cho việc đào tạo và đánh giá các mô hình phát hiện đối tượng.

Cấu trúc tập dữ liệu

Các Roboflow 100 tập dữ liệu được tổ chức thành bảy danh mục, mỗi danh mục có một tập hợp các tập dữ liệu, hình ảnh và lớp riêng biệt:

  • Ảnh trên không : Bao gồm 7 tập dữ liệu với tổng cộng 9.683 hình ảnh, bao gồm 24 lớp riêng biệt.
  • Trò chơi điện tử : Bao gồm 7 tập dữ liệu, có 11.579 hình ảnh thuộc 88 lớp.
  • Kính hiển vi : Bao gồm 11 tập dữ liệu với 13.378 hình ảnh, trải dài trên 28 lớp.
  • Dưới nước : Bao gồm 5 tập dữ liệu, bao gồm 18.003 hình ảnh trong 39 lớp.
  • Tài liệu : Bao gồm 8 tập dữ liệu với 24.813 hình ảnh, được chia thành 90 lớp.
  • Điện từ : Gồm 12 tập dữ liệu, tổng cộng 36.381 hình ảnh trong 41 lớp.
  • Thế giới thực : Danh mục lớn nhất với 50 tập dữ liệu, cung cấp 110.615 hình ảnh trên 495 lớp.

Cấu trúc này cho phép có cơ sở thử nghiệm đa dạng và rộng rãi cho các mô hình phát hiện đối tượng, phản ánh các tình huống ứng dụng trong thế giới thực.

Đánh giá chuẩn

Đánh giá chuẩn bộ dữ liệu đánh giá hiệu suất của mô hình học máy trên các bộ dữ liệu cụ thể bằng các số liệu chuẩn hóa như độ chính xác , độ chính xác trung bình và điểm F1.

Đánh giá chuẩn

Kết quả đánh giá chuẩn sẽ được lưu trữ trong " ultralytics -benchmarks/evaluation.txt"

Ví dụ về chuẩn mực

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolo11s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

Ứng dụng

Roboflow 100 là vô giá đối với nhiều ứng dụng liên quan đến thị giác máy tínhhọc sâu . Các nhà nghiên cứu và kỹ sư có thể sử dụng chuẩn mực này để:

  • Đánh giá hiệu suất của các mô hình phát hiện đối tượng trong bối cảnh đa miền.
  • Kiểm tra khả năng thích ứng của mô hình với các tình huống thực tế vượt ra ngoài khả năng nhận dạng vật thể thông thường.
  • Đánh giá chuẩn khả năng của các mô hình phát hiện đối tượng trên nhiều tập dữ liệu khác nhau, bao gồm dữ liệu trong chăm sóc sức khỏe, ảnh trên không và trò chơi điện tử.

Để có thêm ý tưởng và cảm hứng về các ứng dụng thực tế, hãy nhớ xem hướng dẫn của chúng tôi về các dự án thực tế .

Cách sử dụng

Các Roboflow 100 tập dữ liệu có sẵn trên cả GitHubRoboflow Universe .

Bạn có thể truy cập trực tiếp từ Roboflow 100 kho lưu trữ GitHub. Ngoài ra, trên Roboflow Universe, bạn có thể linh hoạt tải xuống từng tập dữ liệu riêng lẻ chỉ bằng cách nhấp vào nút xuất trong mỗi tập dữ liệu.

Dữ liệu mẫu và chú thích

Roboflow 100 bao gồm các tập dữ liệu với nhiều hình ảnh và video khác nhau được chụp từ nhiều góc độ và phạm vi khác nhau. Sau đây là ví dụ về hình ảnh có chú thích trong chuẩn RF100.

Dữ liệu mẫu và chú thích

Sự đa dạng trong Roboflow Điểm chuẩn 100 có thể thấy ở trên là một bước tiến đáng kể so với các điểm chuẩn truyền thống thường tập trung vào việc tối ưu hóa một số liệu duy nhất trong một phạm vi hạn chế.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng Roboflow 100 tập dữ liệu trong công trình nghiên cứu hoặc phát triển của bạn, vui lòng trích dẫn bài báo sau:

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

Lời cảm ơn của chúng tôi gửi đến Roboflow nhóm và tất cả những người đóng góp vì đã làm việc chăm chỉ trong việc tạo ra và duy trì Roboflow 100 tập dữ liệu.

Nếu bạn muốn khám phá thêm nhiều tập dữ liệu hơn để nâng cao khả năng phát hiện đối tượng và dự án học máy của mình, hãy truy cập bộ sưu tập tập dữ liệu toàn diện của chúng tôi .

CÂU HỎI THƯỜNG GẶP

Cái gì là Roboflow 100 tập dữ liệu và tại sao nó lại quan trọng đối với việc phát hiện đối tượng?

Bộ dữ liệu Roboflow 100 , được phát triển bởi Roboflow và được tài trợ bởi Intel , là một chuẩn mực phát hiện đối tượng quan trọng. Nó có 100 tập dữ liệu đa dạng từ hơn 90.000 tập dữ liệu công khai, bao gồm các lĩnh vực như chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử. Sự đa dạng này đảm bảo rằng các mô hình có thể thích ứng với nhiều tình huống thực tế khác nhau, nâng cao độ mạnh mẽ và hiệu suất của chúng.

Làm thế nào tôi có thể sử dụng Roboflow 100 tập dữ liệu để đánh giá chuẩn các mô hình phát hiện đối tượng của tôi?

Để sử dụng Roboflow 100 tập dữ liệu để đánh giá chuẩn, bạn có thể triển khai lớp RF100Benchmark từ Ultralytics thư viện. Sau đây là một ví dụ ngắn gọn:

Ví dụ về chuẩn mực

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolo11n.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

Những miền nào được bao phủ bởi Roboflow 100 tập dữ liệu?

Bộ dữ liệu Roboflow 100 bao gồm bảy miền, mỗi miền cung cấp những thách thức và ứng dụng riêng cho các mô hình phát hiện đối tượng :

  1. Trên không : 7 tập dữ liệu, 9.683 hình ảnh, 24 lớp
  2. Trò chơi điện tử : 7 tập dữ liệu, 11.579 hình ảnh, 88 lớp
  3. Kính hiển vi : 11 tập dữ liệu, 13.378 hình ảnh, 28 lớp
  4. Dưới nước : 5 tập dữ liệu, 18.003 hình ảnh, 39 lớp
  5. Tài liệu : 8 tập dữ liệu, 24.813 hình ảnh, 90 lớp
  6. Điện từ : 12 tập dữ liệu, 36.381 hình ảnh, 41 lớp
  7. Thế giới thực : 50 tập dữ liệu, 110.615 hình ảnh, 495 lớp

Thiết lập này cho phép thử nghiệm rộng rãi và đa dạng các mô hình trên nhiều ứng dụng thực tế khác nhau.

Làm thế nào để tôi truy cập và tải xuống Roboflow 100 tập dữ liệu?

Bộ dữ liệu Roboflow 100 có thể truy cập được trên GitHubRoboflow Universe . Bạn có thể tải xuống toàn bộ bộ dữ liệu từ GitHub hoặc chọn từng bộ dữ liệu riêng lẻ trên Roboflow Vũ trụ sử dụng nút xuất.

Tôi nên bao gồm những gì khi trích dẫn Roboflow 100 tập dữ liệu trong nghiên cứu của tôi?

Khi sử dụng Roboflow 100 tập dữ liệu trong nghiên cứu của bạn, hãy đảm bảo trích dẫn đúng. Sau đây là trích dẫn được khuyến nghị:

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

Để biết thêm chi tiết, bạn có thể tham khảo bộ sưu tập dữ liệu toàn diện của chúng tôi.

📅 Được tạo cách đây 10 tháng ✏️ Đã cập nhật cách đây 2 tháng

Bình luận