Meet YOLO26: next-gen vision AI.

Link to this sectionHướng dẫn toàn diện về Ultralytics YOLO#

Chào mừng bạn đến với các Hướng dẫn YOLO của Ultralytics. Các hướng dẫn toàn diện của chúng tôi bao gồm nhiều khía cạnh khác nhau của mô hình object detection YOLO, từ huấn luyện và dự đoán cho đến triển khai. Được xây dựng trên PyTorch, YOLO nổi bật nhờ tốc độ vượt trội và accuracy trong các tác vụ object detection thời gian thực.

Cho dù bạn là người mới bắt đầu hay chuyên gia về deep learning, các hướng dẫn của chúng tôi đều cung cấp những hiểu biết có giá trị về việc triển khai và tối ưu hóa YOLO cho các dự án computer vision của bạn.



Watch: Ultralytics YOLO26 Guides Overview

Link to this sectionHướng dẫn#

Dưới đây là bộ sưu tập các hướng dẫn chuyên sâu để giúp bạn làm chủ nhiều khía cạnh khác nhau của Ultralytics YOLO.

  • Hướng dẫn về Kiểm thử Mô hình: Hướng dẫn chi tiết về cách kiểm thử các mô hình computer vision trong môi trường thực tế. Tìm hiểu cách xác minh độ chính xác, độ tin cậy và hiệu suất sao cho phù hợp với mục tiêu dự án.
  • AzureML Quickstart: Bắt đầu và vận hành các mô hình Ultralytics YOLO trên nền tảng Machine Learning của Microsoft Azure. Tìm hiểu cách huấn luyện, triển khai và mở rộng quy mô các dự án object detection của bạn trên đám mây.
  • Thực tiễn Tốt nhất để Triển khai Mô hình: Tìm hiểu các mẹo và thực tiễn tốt nhất để triển khai mô hình hiệu quả trong các dự án computer vision, tập trung vào tối ưu hóa, khắc phục sự cố và bảo mật.
  • Chuyển đổi COCO sang YOLO: Hướng dẫn đầy đủ về việc chuyển đổi các chú thích JSON COCO sang định dạng YOLO để huấn luyện. Bao gồm phát hiện, phân đoạn và keypoints, cũng như cách ánh xạ class ID và các lỗi thường gặp khi chuyển đổi.
  • Huấn luyện với COCO JSON: Huấn luyện YOLO trực tiếp trên các chú thích COCO JSON mà không cần chuyển đổi sang định dạng YOLO, sử dụng lớp dataset tùy chỉnh và trainer.
  • Conda Quickstart: Hướng dẫn từng bước để thiết lập môi trường Conda cho Ultralytics. Tìm hiểu cách cài đặt và bắt đầu sử dụng gói Ultralytics một cách hiệu quả với Conda.
  • Tùy chỉnh Trainer: Tìm hiểu cách tạo lớp con của YOLO trainer để ghi nhật ký các số liệu tùy chỉnh, thêm class-weighted loss, tùy chỉnh việc lưu mô hình, đóng băng/mở băng backbone và thiết lập tỷ lệ học tập (learning rate) cho từng lớp.
  • Thu thập và Chú thích Dữ liệu: Khám phá các công cụ, kỹ thuật và thực tiễn tốt nhất để thu thập và chú thích dữ liệu nhằm tạo ra các đầu vào chất lượng cao cho các mô hình computer vision của bạn.
  • DeepStream trên NVIDIA Jetson: Hướng dẫn nhanh để triển khai các mô hình YOLO trên thiết bị NVIDIA Jetson sử dụng DeepStream và TensorRT.
  • Xác định Mục tiêu cho Dự án Computer Vision: Hướng dẫn cách xác định hiệu quả các mục tiêu rõ ràng và có thể đo lường được cho dự án computer vision của bạn. Tìm hiểu tầm quan trọng của một tuyên bố vấn đề được xác định rõ ràng và cách nó tạo ra lộ trình cho dự án.
  • Docker Quickstart: Hướng dẫn đầy đủ về cách thiết lập và sử dụng các mô hình Ultralytics YOLO với Docker. Tìm hiểu cách cài đặt Docker, quản lý hỗ trợ GPU và chạy các mô hình YOLO trong các container biệt lập để phát triển và triển khai nhất quán.
  • Edge TPU trên Raspberry Pi: Google Edge TPU giúp tăng tốc độ suy luận (inference) YOLO trên Raspberry Pi.
  • Phát hiện End-to-End: Tìm hiểu về khả năng phát hiện end-to-end không cần NMS của YOLO26, khả năng tương thích xuất, thay đổi định dạng đầu ra và cách chuyển đổi từ các mô hình YOLO cũ hơn.
  • Xuất Mô hình Phi YOLO: Sử dụng các tiện ích xuất độc lập của Ultralytics để chuyển đổi bất kỳ torch.nn.Module nào (timm, torchvision, tùy chỉnh) sang ONNX, TorchScript, OpenVINO, CoreML, NCNN, MNN, PaddlePaddle, ExecuTorch và TensorFlow SavedModel.
  • Fine-Tuning YOLO trên Dữ liệu Tùy chỉnh: Hướng dẫn đầy đủ về việc fine-tuning YOLO26 trên các tập dữ liệu tùy chỉnh với trọng số được huấn luyện trước, bao gồm transfer learning, đóng băng lớp, lựa chọn trình tối ưu hóa (optimizer), huấn luyện hai giai đoạn và khắc phục sự cố.
  • Tinh chỉnh Siêu tham số (Hyperparameter Tuning): Khám phá cách tối ưu hóa các mô hình YOLO của bạn bằng cách tinh chỉnh các siêu tham số bằng lớp Tuner và các thuật toán tiến hóa di truyền.
  • Thông tin chi tiết về Đánh giá và Fine-Tuning Mô hình: Đạt được thông tin chi tiết về các chiến lược và thực tiễn tốt nhất để đánh giá và fine-tuning các mô hình computer vision của bạn. Tìm hiểu về quy trình lặp lại để tinh chỉnh các mô hình nhằm đạt được kết quả tối ưu.
  • Cô lập Đối tượng Phân đoạn (Segmentation): Công thức và giải thích từng bước về cách trích xuất và/hoặc cô lập các đối tượng từ hình ảnh bằng Ultralytics Segmentation.
  • K-Fold Cross Validation: Tìm hiểu cách cải thiện khả năng tổng quát hóa của mô hình bằng cách sử dụng kỹ thuật K-Fold cross-validation.
  • Duy trì Mô hình Computer Vision của bạn: Hiểu các thực tiễn chính để giám sát, duy trì và lập tài liệu cho các mô hình computer vision nhằm đảm bảo độ chính xác, phát hiện các bất thường và giảm thiểu hiện tượng lệch dữ liệu (data drift).
  • Các tùy chọn Triển khai Mô hình: Tổng quan về các định dạng model deployment YOLO như ONNX, OpenVINO và TensorRT, với ưu và nhược điểm cho từng loại để định hướng chiến lược triển khai của bạn.
  • Hướng dẫn Cấu hình YAML cho Mô hình: Một bài phân tích chuyên sâu toàn diện về các định nghĩa kiến trúc mô hình của Ultralytics. Khám phá định dạng YAML, hiểu hệ thống phân giải module và tìm hiểu cách tích hợp liền mạch các module tùy chỉnh.
  • Tiền xử lý GPU với NVIDIA DALI: Loại bỏ các nút thắt cổ chai khi tiền xử lý trên CPU bằng cách chạy tính năng letterbox resize, đệm (padding) và chuẩn hóa (normalization) của YOLO trên GPU bằng NVIDIA DALI, với khả năng tích hợp Triton Inference Server.
  • NVIDIA DGX Spark: Hướng dẫn nhanh để triển khai các mô hình YOLO trên thiết bị NVIDIA DGX Spark.
  • NVIDIA Jetson: Hướng dẫn nhanh để triển khai các mô hình YOLO trên thiết bị NVIDIA Jetson.
  • Chế độ Độ trễ vs Thông lượng (Latency vs Throughput) của OpenVINO: Tìm hiểu các kỹ thuật tối ưu hóa độ trễ và thông lượng để đạt hiệu suất suy luận YOLO cao nhất.
  • Tiền xử lý Dữ liệu đã Chú thích: Tìm hiểu về tiền xử lý và tăng cường dữ liệu hình ảnh trong các dự án computer vision bằng YOLO26, bao gồm chuẩn hóa, tăng cường tập dữ liệu, phân tách và phân tích dữ liệu khám phá (EDA).
  • Raspberry Pi: Hướng dẫn nhanh để chạy các mô hình YOLO trên phần cứng Raspberry Pi mới nhất.
  • ROS Quickstart: Tìm hiểu cách tích hợp YOLO với Robot Operating System (ROS) để phát hiện đối tượng thời gian thực trong các ứng dụng robot, bao gồm cả hình ảnh Point Cloud và Depth.
  • SAHI Tiled Inference: Hướng dẫn toàn diện về việc tận dụng khả năng suy luận theo lát cắt (sliced inference) của SAHI với YOLO26 để phát hiện đối tượng trong hình ảnh độ phân giải cao.
  • Các bước thực hiện Dự án Computer Vision: Tìm hiểu về các bước chính liên quan đến một dự án computer vision, bao gồm xác định mục tiêu, lựa chọn mô hình, chuẩn bị dữ liệu và đánh giá kết quả.
  • Mẹo Huấn luyện Mô hình: Khám phá các mẹo về cách tối ưu hóa batch sizes, sử dụng mixed precision, áp dụng các trọng số được huấn luyện trước và hơn thế nữa để giúp việc huấn luyện mô hình computer vision của bạn trở nên dễ dàng.
  • Tích hợp Triton Inference Server: Đi sâu vào việc tích hợp Ultralytics YOLO26 với Triton Inference Server của NVIDIA cho các triển khai suy luận deep learning có thể mở rộng và hiệu quả.
  • Triển khai Vertex AI với Docker: Hướng dẫn tinh gọn về việc container hóa các mô hình YOLO bằng Docker và triển khai chúng trên Google Cloud Vertex AI—bao gồm xây dựng, đẩy (push), tự động mở rộng (autoscaling) và giám sát.
  • Xem Hình ảnh Suy luận trong Terminal: Sử dụng terminal tích hợp của VSCode để xem kết quả suy luận khi sử dụng phiên làm việc Remote Tunnel hoặc SSH.
  • Công thức Huấn luyện YOLO26: Tài liệu đầy đủ về các siêu tham số, các pipeline tăng cường dữ liệu và các cài đặt trình tối ưu hóa được sử dụng để huấn luyện các base checkpoint chính thức của YOLO26 trên COCO, cùng với hướng dẫn fine-tuning thực tế.
  • Các vấn đề thường gặp với YOLO ⭐ KHUYÊN DÙNG: Các giải pháp thực tế và mẹo khắc phục sự cố cho những vấn đề thường gặp nhất khi làm việc với các mô hình Ultralytics YOLO.
  • Tăng cường Dữ liệu (Data Augmentation) YOLO: Làm chủ toàn bộ các kỹ thuật tăng cường dữ liệu trong YOLO, từ các phép biến đổi cơ bản đến các chiến lược nâng cao nhằm cải thiện độ bền vững và hiệu suất của mô hình.
  • Các số liệu Hiệu suất YOLO ⭐ THIẾT YẾU: Hiểu các số liệu chính như mAP, IoU và F1 score được sử dụng để đánh giá hiệu suất các mô hình YOLO của bạn. Bao gồm các ví dụ thực tế và mẹo về cách cải thiện độ chính xác và tốc độ phát hiện.
  • Suy luận An toàn với Luồng (Thread-Safe) trong YOLO: Hướng dẫn thực hiện suy luận với các mô hình YOLO theo cách an toàn với luồng (thread-safe). Tìm hiểu tầm quan trọng của an toàn luồng và các thực tiễn tốt nhất để ngăn chặn tình trạng race condition và đảm bảo các dự đoán nhất quán.

Link to this sectionĐóng góp cho Hướng dẫn của chúng tôi#

Chúng tôi hoan nghênh sự đóng góp từ cộng đồng! Nếu bạn đã làm chủ một khía cạnh cụ thể nào đó của Ultralytics YOLO chưa được đề cập trong các hướng dẫn của chúng tôi, chúng tôi khuyến khích bạn chia sẻ chuyên môn của mình. Viết hướng dẫn là một cách tuyệt vời để đóng góp lại cho cộng đồng và giúp chúng tôi làm cho tài liệu của mình trở nên toàn diện và thân thiện với người dùng hơn.

Để bắt đầu, vui lòng đọc Hướng dẫn Đóng góp của chúng tôi để biết các quy định về cách mở một Pull Request (PR). Chúng tôi rất mong đợi sự đóng góp của bạn.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionLàm thế nào để tôi huấn luyện một mô hình object detection tùy chỉnh bằng Ultralytics YOLO?#

Việc huấn luyện một mô hình object detection tùy chỉnh với Ultralytics YOLO rất đơn giản. Hãy bắt đầu bằng cách chuẩn bị tập dữ liệu của bạn ở đúng định dạng và cài đặt gói Ultralytics. Sử dụng mã sau để bắt đầu huấn luyện:

Ví dụ
from ultralytics import YOLO

model = YOLO("yolo26n.pt")  # Load a pretrained YOLO model
model.train(data="path/to/dataset.yaml", epochs=50)  # Train on custom dataset

Để biết chi tiết về định dạng tập dữ liệu và các tùy chọn bổ sung, hãy tham khảo hướng dẫn Mẹo Huấn luyện Mô hình của chúng tôi.

Link to this sectionTôi nên sử dụng các số liệu hiệu suất nào để đánh giá mô hình YOLO của mình?#

Việc đánh giá hiệu suất mô hình YOLO của bạn là rất quan trọng để hiểu được tính hiệu quả của nó. Các số liệu chính bao gồm Mean Average Precision (mAP), Intersection over Union (IoU) và F1 score. Những số liệu này giúp đánh giá độ chính xác và precision của các tác vụ object detection. Bạn có thể tìm hiểu thêm về các số liệu này và cách cải thiện mô hình của mình trong hướng dẫn Số liệu Hiệu suất YOLO.

Link to this sectionTại sao tôi nên sử dụng Ultralytics Platform cho các dự án computer vision của mình?#

Ultralytics Platform là một nền tảng no-code giúp đơn giản hóa việc quản lý, huấn luyện và triển khai các mô hình YOLO. Nó hỗ trợ tích hợp liền mạch, theo dõi thời gian thực và huấn luyện trên đám mây, khiến nó trở nên lý tưởng cho cả người mới bắt đầu và chuyên gia. Khám phá thêm về các tính năng của nó và cách nó có thể hợp lý hóa quy trình làm việc của bạn với hướng dẫn quickstart Ultralytics Platform.

Link to this sectionNhững vấn đề thường gặp trong quá trình huấn luyện mô hình YOLO là gì, và làm thế nào để tôi giải quyết chúng?#

Các vấn đề thường gặp trong quá trình huấn luyện mô hình YOLO bao gồm lỗi định dạng dữ liệu, không tương thích kiến trúc mô hình và không đủ training data. Để giải quyết những vấn đề này, hãy đảm bảo tập dữ liệu của bạn được định dạng đúng, kiểm tra các phiên bản mô hình tương thích và tăng cường dữ liệu huấn luyện của bạn. Để có danh sách đầy đủ các giải pháp, hãy tham khảo hướng dẫn Các vấn đề thường gặp với YOLO.

Link to this sectionLàm thế nào để tôi triển khai mô hình YOLO cho object detection thời gian thực trên các thiết bị biên (edge device)?#

Việc triển khai các mô hình YOLO trên các thiết bị biên như NVIDIA Jetson và Raspberry Pi yêu cầu chuyển đổi mô hình sang một định dạng tương thích như TensorRT hoặc TFLite. Hãy làm theo các hướng dẫn từng bước của chúng tôi về triển khai trên NVIDIA JetsonRaspberry Pi để bắt đầu với object detection thời gian thực trên phần cứng biên. Những hướng dẫn này sẽ hướng dẫn bạn qua các bước cài đặt, cấu hình và tối ưu hóa hiệu suất.

Bình luận