Các mô hình được Ultralytics hỗ trợ
Chào mừng bạn đến với tài liệu về các mô hình của Ultralytics! Chúng tôi cung cấp hỗ trợ cho nhiều loại mô hình, mỗi mô hình được thiết kế riêng cho các tác vụ cụ thể như nhận diện đối tượng, phân đoạn cá thể, phân đoạn ngữ nghĩa, phân loại hình ảnh, ước tính tư thế, và theo dõi đa đối tượng. Nếu bạn muốn đóng góp kiến trúc mô hình của mình cho Ultralytics, hãy xem Hướng dẫn đóng góp của chúng tôi.

Các mô hình nổi bật
Dưới đây là một số mô hình chính được hỗ trợ:
- YOLOv3: Phiên bản thứ ba của dòng mô hình YOLO, ban đầu được phát triển bởi Joseph Redmon, nổi tiếng với khả năng nhận diện đối tượng thời gian thực hiệu quả.
- YOLOv4: Bản cập nhật dựa trên nền tảng darknet cho YOLOv3, do Alexey Bochkovskiy phát hành vào năm 2020.
- YOLOv5: Một phiên bản cải tiến của kiến trúc YOLO bởi Ultralytics, mang lại hiệu suất và tốc độ tốt hơn so với các phiên bản trước đó.
- YOLOv6: Do Meituan phát hành vào năm 2022 và được sử dụng trong nhiều robot giao hàng tự hành của công ty này.
- YOLOv7: Các mô hình YOLO được cập nhật vào năm 2022 bởi các tác giả của YOLOv4. Chỉ hỗ trợ suy luận (inference).
- YOLOv8: Một mô hình linh hoạt với các khả năng nâng cao như phân đoạn cá thể, ước tính tư thế/điểm đặc trưng và phân loại.
- YOLOv9: Một mô hình thực nghiệm được huấn luyện trên mã nguồn YOLOv5 của Ultralytics, triển khai Programmable Gradient Information (PGI).
- YOLOv10: Do Đại học Thanh Hoa phát triển, nổi bật với quá trình huấn luyện không cần NMS và kiến trúc tối ưu giữa hiệu suất và độ chính xác, mang lại hiệu năng và độ trễ hiện đại nhất.
- YOLO11: Các mô hình YOLO của Ultralytics mang lại hiệu suất cao trên nhiều tác vụ bao gồm nhận diện, phân đoạn, ước tính tư thế, theo dõi và phân loại.
- YOLO26 🚀 MỚI: Mô hình YOLO thế hệ mới mới nhất của Ultralytics được tối ưu hóa cho triển khai ở biên (edge deployment) với suy luận end-to-end không cần NMS.
- Segment Anything Model (SAM): Segment Anything Model (SAM) nguyên bản của Meta.
- Segment Anything Model 2 (SAM2): Thế hệ tiếp theo của Segment Anything Model từ Meta dành cho video và hình ảnh.
- Segment Anything Model 3 (SAM3) 🚀 MỚI: Thế hệ thứ ba của Segment Anything Model từ Meta với tính năng Promptable Concept Segmentation cho phân đoạn dựa trên văn bản và ví dụ hình ảnh.
- Mobile Segment Anything Model (MobileSAM): MobileSAM dành cho các ứng dụng di động, do Đại học Kyung Hee phát triển.
- Fast Segment Anything Model (FastSAM): FastSAM bởi Nhóm Phân tích Hình ảnh & Video, Viện Tự động hóa, Viện Hàn lâm Khoa học Trung Quốc.
- YOLO-NAS: Các mô hình YOLO Neural Architecture Search (NAS).
- Real-Time Detection Transformers (RT-DETR): Các mô hình Transformer nhận diện thời gian thực (RT-DETR) trên nền tảng PaddlePaddle của Baidu.
- YOLO-World: Các mô hình nhận diện đối tượng theo từ vựng mở (Open Vocabulary) thời gian thực từ Tencent AI Lab.
- YOLOE: Một bộ nhận diện đối tượng từ vựng mở được cải tiến, duy trì hiệu suất thời gian thực của YOLO trong khi vẫn nhận diện được các lớp tùy ý ngoài dữ liệu huấn luyện của nó.
Watch: Run Ultralytics YOLO models in just a few lines of code.
Bắt đầu: Ví dụ sử dụng
Ví dụ này cung cấp các hướng dẫn đơn giản về huấn luyện và suy luận với YOLO. Để có tài liệu đầy đủ về các chế độ này và các chế độ khác, hãy xem các trang tài liệu về Predict, Train, Val và Export.
Lưu ý ví dụ dưới đây làm nổi bật các mô hình Detect của YOLO11 cho nhận diện đối tượng. Để biết thêm các tác vụ được hỗ trợ, hãy xem tài liệu về Segment, Classify và Pose.
PyTorch pretrained *.pt models as well as configuration *.yaml files can be passed to the YOLO(), SAM(), NAS() and RTDETR() classes to create a model instance in Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Display model information (optional)
model.info()
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")Đóng góp mô hình mới
Bạn quan tâm đến việc đóng góp mô hình của mình cho Ultralytics? Tuyệt vời! Chúng tôi luôn sẵn lòng mở rộng danh mục mô hình của mình.
-
Fork kho lưu trữ: Bắt đầu bằng cách fork kho lưu trữ Ultralytics trên GitHub.
-
Clone fork của bạn: Clone fork của bạn về máy cục bộ và tạo một nhánh mới để làm việc.
-
Triển khai mô hình của bạn: Thêm mô hình của bạn theo các tiêu chuẩn mã hóa và hướng dẫn được cung cấp trong Hướng dẫn đóng góp của chúng tôi.
-
Kiểm thử kỹ lưỡng: Hãy đảm bảo kiểm thử mô hình của bạn một cách nghiêm ngặt, cả độc lập lẫn như một phần của quy trình.
-
Tạo Pull Request: Khi bạn hài lòng với mô hình của mình, hãy tạo một pull request vào kho lưu trữ chính để được xem xét.
-
Xem xét mã nguồn & Hợp nhất: Sau khi xem xét, nếu mô hình của bạn đáp ứng các tiêu chí của chúng tôi, nó sẽ được hợp nhất vào kho lưu trữ chính.
Để biết các bước chi tiết, hãy tham khảo Hướng dẫn đóng góp của chúng tôi.
Câu hỏi thường gặp (FAQ)
Đâu là mô hình YOLO mới nhất của Ultralytics?
Mô hình YOLO mới nhất của Ultralytics là YOLO26, được phát hành vào tháng 1 năm 2026. YOLO26 có khả năng suy luận end-to-end không cần NMS, tối ưu hóa cho triển khai ở biên và hỗ trợ nhận diện, phân đoạn cá thể, phân đoạn ngữ nghĩa, phân loại, ước tính tư thế và OBB cộng với các phiên bản từ vựng mở. Đối với các khối lượng công việc sản xuất ổn định, cả YOLO26 và YOLO11 đều là những lựa chọn được khuyến nghị.
Làm thế nào để huấn luyện mô hình YOLO trên dữ liệu tùy chỉnh?
Huấn luyện mô hình YOLO trên dữ liệu tùy chỉnh có thể dễ dàng thực hiện bằng cách sử dụng các thư viện của Ultralytics. Đây là một ví dụ nhanh:
from ultralytics import YOLO
# Load a YOLO model
model = YOLO("yolo26n.pt") # or any other YOLO model
# Train the model on custom dataset
results = model.train(data="custom_data.yaml", epochs=100, imgsz=640)Để có hướng dẫn chi tiết hơn, hãy truy cập trang tài liệu Train.
Những phiên bản YOLO nào được Ultralytics hỗ trợ?
Ultralytics hỗ trợ đầy đủ các phiên bản YOLO (You Only Look Once) từ YOLOv3 đến YOLO26, cùng với các mô hình như YOLO-NAS, SAM và RT-DETR. Mỗi phiên bản được tối ưu hóa cho các tác vụ khác nhau như nhận diện, phân đoạn, phân đoạn ngữ nghĩa và phân loại. Để biết thông tin chi tiết về từng mô hình, hãy tham khảo tài liệu Các mô hình được Ultralytics hỗ trợ.
Tại sao tôi nên sử dụng Ultralytics Platform cho các dự án học máy?
Ultralytics Platform cung cấp một nền tảng end-to-end không cần code để huấn luyện, triển khai và quản lý các mô hình YOLO. Nó đơn giản hóa các quy trình phức tạp, cho phép người dùng tập trung vào hiệu suất mô hình và ứng dụng. HUB cũng cung cấp các khả năng huấn luyện trên đám mây, quản lý tập dữ liệu toàn diện và giao diện thân thiện với người dùng cho cả người mới bắt đầu và các nhà phát triển có kinh nghiệm.
Các mô hình YOLO của Ultralytics có thể thực hiện những loại tác vụ nào?
Các mô hình YOLO của Ultralytics rất linh hoạt và có thể thực hiện các tác vụ bao gồm nhận diện đối tượng, phân đoạn cá thể, phân đoạn ngữ nghĩa, phân loại, ước tính tư thế và nhận diện đối tượng có hướng (OBB). Mô hình mới nhất, YOLO26, hỗ trợ tất cả sáu tác vụ cộng với nhận diện từ vựng mở. Để biết chi tiết về các tác vụ cụ thể, hãy tham khảo các trang Tác vụ.