Các hướng dẫn toàn diện cho Ultralytics YOLO

Chào mừng bạn đến với các Hướng dẫn YOLO của Ultralytics. Các hướng dẫn toàn diện của chúng tôi bao gồm nhiều khía cạnh khác nhau của mô hình object detection YOLO, từ đào tạo và dự đoán cho đến triển khai. Được xây dựng dựa trên PyTorch, YOLO nổi bật nhờ tốc độ vượt trội và độ chính xác trong các tác vụ phát hiện đối tượng thời gian thực.

Cho dù bạn là người mới bắt đầu hay chuyên gia về deep learning, các hướng dẫn của chúng tôi đều cung cấp những kiến thức giá trị về việc triển khai và tối ưu hóa YOLO cho các dự án computer vision của bạn.



Watch: Ultralytics YOLO26 Guides Overview

Hướng dẫn

Dưới đây là tổng hợp các hướng dẫn chuyên sâu để giúp bạn làm chủ nhiều khía cạnh khác nhau của Ultralytics YOLO.

  • Hướng dẫn Kiểm thử Mô hình: Hướng dẫn chi tiết về cách kiểm thử các mô hình computer vision của bạn trong môi trường thực tế. Tìm hiểu cách xác minh độ chính xác, độ tin cậy và hiệu suất phù hợp với mục tiêu dự án.
  • Bắt đầu nhanh với AzureML: Làm quen và chạy các mô hình Ultralytics YOLO trên nền tảng Machine Learning của Microsoft Azure. Tìm hiểu cách đào tạo, triển khai và mở rộng quy mô các dự án phát hiện đối tượng của bạn trên đám mây.
  • Các phương pháp triển khai mô hình tốt nhất: Tìm hiểu các mẹo và phương pháp tối ưu để triển khai mô hình hiệu quả trong các dự án computer vision, tập trung vào tối ưu hóa, xử lý sự cố và bảo mật.
  • Chuyển đổi COCO sang YOLO: Hướng dẫn toàn diện về việc chuyển đổi các chú thích JSON của COCO sang định dạng YOLO để đào tạo. Bao gồm phát hiện, phân đoạn và các điểm chính (keypoints) cùng các mẹo dành riêng cho công cụ CVAT, Label Studio và Roboflow.
  • Đào tạo từ COCO JSON: Đào tạo YOLO trực tiếp trên các chú thích COCO JSON mà không cần chuyển đổi sang định dạng YOLO, sử dụng lớp dữ liệu và trainer tùy chỉnh.
  • Bắt đầu nhanh với Conda: Hướng dẫn từng bước để thiết lập môi trường Conda cho Ultralytics. Tìm hiểu cách cài đặt và bắt đầu sử dụng gói Ultralytics một cách hiệu quả với Conda.
  • Tùy chỉnh Trainer: Tìm hiểu cách tạo lớp con cho trình huấn luyện YOLO để ghi log các chỉ số tùy chỉnh, thêm hàm loss có trọng số theo lớp, tùy chỉnh lưu mô hình, đóng băng/mở băng backbone và thiết lập tốc độ học (learning rate) cho từng lớp.
  • Thu thập và Gán nhãn dữ liệu: Khám phá các công cụ, kỹ thuật và phương pháp tốt nhất để thu thập và gán nhãn dữ liệu nhằm tạo ra các dữ liệu đầu vào chất lượng cao cho các mô hình computer vision của bạn.
  • DeepStream trên NVIDIA Jetson: Hướng dẫn bắt đầu nhanh để triển khai các mô hình YOLO trên các thiết bị NVIDIA Jetson sử dụng DeepStream và TensorRT.
  • Xác định mục tiêu của dự án Computer Vision: Hướng dẫn cách xác định hiệu quả các mục tiêu rõ ràng và có thể đo lường cho dự án computer vision của bạn. Tìm hiểu tầm quan trọng của một tuyên bố vấn đề được xác định rõ và cách nó tạo ra lộ trình cho dự án của bạn.
  • Bắt đầu nhanh với Docker: Hướng dẫn toàn diện để thiết lập và sử dụng các mô hình Ultralytics YOLO với Docker. Tìm hiểu cách cài đặt Docker, quản lý hỗ trợ GPU và chạy các mô hình YOLO trong các container tách biệt để đảm bảo tính nhất quán trong phát triển và triển khai.
  • Edge TPU trên Raspberry Pi: Google Edge TPU giúp tăng tốc độ suy luận (inference) YOLO trên Raspberry Pi.
  • Phát hiện End-to-End: Tìm hiểu về tính năng phát hiện end-to-end không dùng NMS của YOLO26, khả năng tương thích khi xuất mô hình, những thay đổi trong định dạng đầu ra và cách chuyển đổi từ các mô hình YOLO cũ hơn.
  • Xuất các mô hình không phải YOLO: Sử dụng các tiện ích xuất độc lập của Ultralytics để chuyển đổi bất kỳ torch.nn.Module nào (timm, torchvision, tùy chỉnh) sang ONNX, TorchScript, OpenVINO, CoreML, NCNN, MNN, PaddlePaddle, ExecuTorch và TensorFlow SavedModel.
  • Fine-Tuning YOLO trên Dữ liệu tùy chỉnh: Hướng dẫn toàn diện về việc fine-tuning YOLO26 trên các bộ dữ liệu tùy chỉnh với trọng số đã huấn luyện trước, bao gồm học chuyển đổi (transfer learning), đóng băng lớp, chọn trình tối ưu hóa (optimizer), đào tạo hai giai đoạn và xử lý sự cố.
  • Tuning Hyperparameter: Khám phá cách tối ưu hóa các mô hình YOLO của bạn bằng cách tinh chỉnh các siêu tham số (hyperparameters) sử dụng lớp Tuner và các thuật toán tiến hóa di truyền.
  • Thông tin về Đánh giá và Fine-Tuning mô hình: Hiểu sâu về các chiến lược và phương pháp tốt nhất để đánh giá và fine-tuning các mô hình computer vision của bạn. Tìm hiểu về quy trình lặp đi lặp lại để tinh chỉnh các mô hình nhằm đạt được kết quả tối ưu.
  • Cô lập các đối tượng phân đoạn: Quy trình từng bước và giải thích cách trích xuất và/hoặc cô lập các đối tượng từ hình ảnh sử dụng Ultralytics Segmentation.
  • K-Fold Cross Validation: Tìm hiểu cách cải thiện khả năng tổng quát hóa của mô hình bằng kỹ thuật K-Fold cross-validation.
  • Duy trì mô hình Computer Vision: Hiểu các thực tiễn chính để giám sát, duy trì và lập tài liệu cho các mô hình computer vision nhằm đảm bảo độ chính xác, phát hiện các điểm bất thường và giảm thiểu sự lệch dữ liệu (data drift).
  • Tùy chọn triển khai mô hình: Tổng quan về các định dạng triển khai mô hình YOLO như ONNX, OpenVINO và TensorRT, với ưu và nhược điểm của từng loại để thông tin cho chiến lược triển khai của bạn.
  • Hướng dẫn cấu hình Model YAML: Hướng dẫn chuyên sâu toàn diện về các định nghĩa kiến trúc mô hình của Ultralytics. Khám phá định dạng YAML, hiểu hệ thống phân giải module và tìm hiểu cách tích hợp các module tùy chỉnh một cách liền mạch.
  • Tiền xử lý GPU NVIDIA DALI: Loại bỏ các nút thắt cổ chai tiền xử lý CPU bằng cách chạy việc thay đổi kích thước letterbox, đệm và chuẩn hóa của YOLO trên GPU sử dụng NVIDIA DALI, với tích hợp Triton Inference Server.
  • NVIDIA DGX Spark: Hướng dẫn bắt đầu nhanh để triển khai các mô hình YOLO trên các thiết bị NVIDIA DGX Spark.
  • NVIDIA Jetson: Hướng dẫn bắt đầu nhanh để triển khai các mô hình YOLO trên các thiết bị NVIDIA Jetson.
  • Chế độ Độ trễ vs Thông lượng của OpenVINO: Tìm hiểu các kỹ thuật tối ưu hóa độ trễ và thông lượng để đạt hiệu suất suy luận YOLO đỉnh cao.
  • Tiền xử lý Dữ liệu đã gán nhãn: Tìm hiểu về tiền xử lý và tăng cường (augment) dữ liệu hình ảnh trong các dự án computer vision sử dụng YOLO26, bao gồm chuẩn hóa, tăng cường bộ dữ liệu, phân tách và phân tích dữ liệu khám phá (EDA).
  • Raspberry Pi: Hướng dẫn bắt đầu nhanh để chạy các mô hình YOLO trên phần cứng Raspberry Pi mới nhất.
  • Bắt đầu nhanh với ROS: Tìm hiểu cách tích hợp YOLO với Robot Operating System (ROS) để phát hiện đối tượng thời gian thực trong các ứng dụng robot, bao gồm cả hình ảnh Point Cloud và Depth.
  • Suy luận phân mảnh SAHI: Hướng dẫn toàn diện về việc tận dụng khả năng suy luận theo lát cắt (sliced inference) của SAHI với YOLO26 để phát hiện đối tượng trong hình ảnh độ phân giải cao.
  • Các bước của một dự án Computer Vision: Tìm hiểu về các bước chính trong một dự án computer vision, bao gồm xác định mục tiêu, lựa chọn mô hình, chuẩn bị dữ liệu và đánh giá kết quả.
  • Mẹo đào tạo mô hình: Khám phá các mẹo tối ưu hóa batch sizes, sử dụng mixed precision, áp dụng các trọng số đã huấn luyện trước và nhiều hơn nữa để việc đào tạo mô hình computer vision của bạn trở nên dễ dàng.
  • Tích hợp Triton Inference Server: Đi sâu vào việc tích hợp Ultralytics YOLO26 với Triton Inference Server của NVIDIA để triển khai suy luận deep learning có khả năng mở rộng và hiệu quả.
  • Triển khai Vertex AI với Docker: Hướng dẫn hợp lý hóa để đóng gói các mô hình YOLO vào container với Docker và triển khai chúng trên Google Cloud Vertex AI—bao gồm xây dựng, đẩy (push), tự động mở rộng và giám sát.
  • Xem hình ảnh suy luận trong Terminal: Sử dụng terminal tích hợp của VSCode để xem kết quả suy luận khi sử dụng Remote Tunnel hoặc các phiên SSH.
  • Công thức đào tạo YOLO26: Tài liệu đầy đủ về các siêu tham số, quy trình tăng cường (augmentation pipelines) và cài đặt bộ tối ưu hóa được sử dụng để đào tạo các checkpoint cơ bản YOLO26 chính thức trên COCO, cùng hướng dẫn tinh chỉnh thực tế.
  • Các vấn đề thường gặp của YOLO ⭐ KHUYÊN DÙNG: Các giải pháp thực tế và mẹo xử lý sự cố cho những vấn đề thường gặp nhất khi làm việc với các mô hình Ultralytics YOLO.
  • Tăng cường dữ liệu YOLO: Làm chủ toàn bộ các kỹ thuật tăng cường dữ liệu trong YOLO, từ các phép biến đổi cơ bản đến các chiến lược nâng cao để cải thiện độ bền bỉ và hiệu suất của mô hình.
  • Các chỉ số hiệu suất YOLO ⭐ THIẾT YẾU: Hiểu các chỉ số chính như mAP, IoU và F1 score được sử dụng để đánh giá hiệu suất các mô hình YOLO của bạn. Bao gồm các ví dụ thực tế và mẹo về cách cải thiện độ chính xác và tốc độ phát hiện.
  • Suy luận an toàn luồng YOLO: Các hướng dẫn để thực hiện suy luận với các mô hình YOLO theo cách an toàn cho luồng. Tìm hiểu tầm quan trọng của an toàn luồng và các phương pháp tốt nhất để ngăn ngừa race conditions và đảm bảo các dự đoán nhất quán.

Đóng góp cho Hướng dẫn của chúng tôi

Chúng tôi hoan nghênh những đóng góp từ cộng đồng! Nếu bạn đã nắm vững một khía cạnh cụ thể của Ultralytics YOLO chưa có trong hướng dẫn của chúng tôi, chúng tôi khuyến khích bạn chia sẻ chuyên môn của mình. Viết hướng dẫn là một cách tuyệt vời để đóng góp ngược lại cho cộng đồng và giúp chúng tôi làm cho tài liệu của mình toàn diện và thân thiện với người dùng hơn.

Để bắt đầu, vui lòng đọc Hướng dẫn Đóng góp của chúng tôi để biết các quy định về cách mở một Pull Request (PR). Chúng tôi mong chờ những đóng góp từ bạn.

Câu hỏi thường gặp (FAQ)

Làm thế nào để tôi đào tạo một mô hình phát hiện đối tượng tùy chỉnh sử dụng Ultralytics YOLO?

Việc đào tạo một mô hình phát hiện đối tượng tùy chỉnh với Ultralytics YOLO rất đơn giản. Hãy bắt đầu bằng cách chuẩn bị bộ dữ liệu của bạn đúng định dạng và cài đặt gói Ultralytics. Sử dụng mã sau để bắt đầu đào tạo:

Ví dụ
from ultralytics import YOLO

model = YOLO("yolo26n.pt")  # Load a pretrained YOLO model
model.train(data="path/to/dataset.yaml", epochs=50)  # Train on custom dataset

Để biết định dạng bộ dữ liệu chi tiết và các tùy chọn bổ sung, hãy tham khảo hướng dẫn Mẹo đào tạo mô hình của chúng tôi.

Tôi nên sử dụng các chỉ số hiệu suất nào để đánh giá mô hình YOLO của mình?

Việc đánh giá hiệu suất mô hình YOLO của bạn là rất quan trọng để hiểu được hiệu quả của nó. Các chỉ số chính bao gồm Mean Average Precision (mAP), Intersection over Union (IoU) và F1 score. Các chỉ số này giúp đánh giá độ chính xác và độ chính xác của các tác vụ phát hiện đối tượng. Bạn có thể tìm hiểu thêm về các chỉ số này và cách cải thiện mô hình của mình trong hướng dẫn Các chỉ số hiệu suất YOLO của chúng tôi.

Tại sao tôi nên sử dụng Ultralytics Platform cho các dự án computer vision của mình?

Ultralytics Platform là một nền tảng no-code giúp đơn giản hóa việc quản lý, đào tạo và triển khai các mô hình YOLO. Nó hỗ trợ tích hợp liền mạch, theo dõi thời gian thực và đào tạo trên đám mây, khiến nó trở nên lý tưởng cho cả người mới bắt đầu và chuyên gia. Khám phá thêm về các tính năng của nó và cách nó có thể hợp lý hóa quy trình làm việc của bạn với hướng dẫn bắt đầu nhanh Ultralytics Platform.

Những vấn đề thường gặp khi đào tạo mô hình YOLO là gì và làm thế nào tôi có thể giải quyết chúng?

Các vấn đề thường gặp khi đào tạo mô hình YOLO bao gồm lỗi định dạng dữ liệu, không khớp kiến trúc mô hình và không đủ dữ liệu đào tạo. Để giải quyết những vấn đề này, hãy đảm bảo bộ dữ liệu của bạn được định dạng chính xác, kiểm tra các phiên bản mô hình tương thích và tăng cường dữ liệu đào tạo của bạn. Để có danh sách đầy đủ các giải pháp, hãy tham khảo hướng dẫn Các vấn đề thường gặp của YOLO của chúng tôi.

Làm thế nào để tôi triển khai mô hình YOLO của mình để phát hiện đối tượng thời gian thực trên các thiết bị cạnh (edge devices)?

Triển khai các mô hình YOLO trên các thiết bị cạnh như NVIDIA Jetson và Raspberry Pi yêu cầu chuyển đổi mô hình sang định dạng tương thích như TensorRT hoặc TFLite. Hãy làm theo các hướng dẫn từng bước của chúng tôi về việc triển khai trên NVIDIA JetsonRaspberry Pi để bắt đầu với việc phát hiện đối tượng thời gian thực trên phần cứng cạnh. Các hướng dẫn này sẽ dẫn dắt bạn qua quá trình cài đặt, cấu hình và tối ưu hóa hiệu suất.

Bình luận