YOLOv5 so với YOLOv10 So sánh kỹ thuật toàn diện
Lĩnh vực thị giác máy tính thời gian thực đã chứng kiến sự tăng trưởng theo cấp số nhân trong vài năm qua, với nhiều kiến trúc khác nhau liên tục vượt qua giới hạn của những gì có thể thực hiện được trên phần cứng hiện đại. Khi đánh giá các kiến trúc tiên tiến nhất, sự so sánh giữa YOLOv5 và YOLOv10 làm nổi bật một bước tiến hóa đáng kể trong lĩnh vực phát hiện đối tượng. Bài phân tích chuyên sâu về kỹ thuật này sẽ khám phá các mô hình kiến trúc, sự đánh đổi về hiệu năng và cách các nhà phát triển có thể tận dụng những công cụ này trong môi trường sản xuất.
Tìm hiểu sâu về kiến trúc
Hiểu rõ sự khác biệt về cấu trúc giữa các mô hình này là điều vô cùng quan trọng để triển khai chúng một cách hiệu quả trong thực tế.
Ultralytics YOLOv5: Tiêu chuẩn Công nghiệp
Được giới thiệu bởi Ultralytics , YOLOv5 Từ lâu, nó đã được công nhận nhờ sự cân bằng vượt trội giữa tốc độ, độ chính xác và khả năng truy cập.
- Tác giả: Glenn Jocher
- Tổ chức: Ultralytics
- Ngày: 26/06/2020
- GitHub: Kho lưu trữ YOLOv5
- Tài liệu: Tài liệu YOLOv5
YOLOv5 Nền tảng này dựa trên cơ chế phát hiện dựa trên điểm neo kết hợp với kiến trúc CSPDarknet được tối ưu hóa sâu sắc. Kiến trúc này dựa nhiều vào các thao tác tiêu chuẩn được hỗ trợ trên hầu hết các công cụ suy luận, khiến nó cực kỳ linh hoạt. Điểm mạnh chính của nó nằm ở Ultralytics Python SDK , cung cấp trải nghiệm người dùng được tối ưu hóa, API đơn giản và tài liệu đầy đủ. Ngoài ra, YOLOv5 Yêu cầu bộ nhớ thấp hơn của nó so với các mô hình dựa trên Transformer có nghĩa là nó huấn luyện nhanh chóng trên GPU cấp người tiêu dùng mà không cần tốn nhiều VRAM.
YOLOv10 Thúc đẩy mô hình mới
Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 Nhằm giải quyết các điểm nghẽn về độ trễ cụ thể được tìm thấy trong các kiến trúc trước đây.
- Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
- Tổ chức: Đại học Thanh Hoa
- Ngày: 23-05-2024
- ArXiv: 2405.14458
- GitHub: Kho lưu trữ YOLOv10
- Tài liệu: Tài liệu YOLOv10
Đặc điểm xác định của YOLOv10 là bản địa của nó NMS Thiết kế không có (Không loại bỏ tối đa). Bằng cách sử dụng các nhiệm vụ kép nhất quán trong quá trình huấn luyện, mô hình loại bỏ sự cần thiết của NMS Xử lý hậu kỳ trong quá trình suy luận. Việc giảm độ trễ về mặt lý thuyết này rất có lợi cho các triển khai chạy trên phần cứng cao cấp với khả năng tăng tốc NVIDIA TensorRT mạnh mẽ, mặc dù nó có thể gây ra sự phức tạp về cấu trúc cho các thiết bị biên.
Lợi thế hệ sinh thái
Trong khi YOLOv10 Cung cấp những nét mới lạ thú vị về kiến trúc. Ultralytics các mô hình như YOLOv5 và YOLO26 phiên bản mới hơn được hỗ trợ nguyên bản trong Nền tảng Ultralytics , mang lại hiệu quả huấn luyện vượt trội, tự động điều chỉnh siêu tham số và nhiều tùy chọn xuất dữ liệu ngay từ đầu.
Phân tích hiệu suất
Khi so sánh các mô hình này, cần cân bằng giữa độ chính xác ( mAP Các yếu tố như hiệu năng và chi phí tính toán (độ trễ và tham số) sẽ quyết định trường hợp sử dụng tối ưu. Dưới đây là bảng so sánh hiệu năng kỹ thuật trên tập dữ liệu COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv10 rõ ràng đạt được mức cao hơn mAP50-95 ở quy mô kích thước tương đương, tận dụng thiết kế mô hình hiện đại hướng đến hiệu quả và độ chính xác. Tuy nhiên, YOLOv5 Nó duy trì độ trễ cực kỳ cạnh tranh, đặc biệt là ở các phân khúc Nano và Small, giúp nó có độ tin cậy cao trong các môi trường nhúng hạn chế như... NVIDIA Jetson CPU dòng hoặc tiêu chuẩn thông qua OpenVINO.
Phương pháp luận đào tạo và Hệ sinh thái
Giá trị của một mô hình gắn liền mật thiết với hệ sinh thái xung quanh nó. Ultralytics duy trì một hệ sinh thái được bảo trì đặc biệt tốt, hỗ trợ một loạt các nhiệm vụ vô cùng đa dạng. Trong khi đó, YOLOv10 Tập trung hoàn toàn vào phát hiện đối tượng 2D. Ultralytics Hỗ trợ sẵn các chức năng phân đoạn đối tượng , phân loại hình ảnh , ước lượng tư thế và hộp giới hạn định hướng (OBB) .
Hơn nữa, việc đào tạo một Ultralytics Mô hình này yêu cầu lượng bộ nhớ tiêu hao thấp hơn đáng kể so với các phương pháp dựa trên transformer cạnh tranh, giúp chu kỳ phát triển nhanh chóng và tiết kiệm chi phí.
Thực thi mã liền mạch
Việc huấn luyện, xác thực và xuất mô hình được thống nhất trong một API duy nhất. Bạn có thể chuyển đổi giữa các mô hình chỉ bằng cách thay đổi một chuỗi ký tự.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")
# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")
# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Automatically utilizes PyTorch CUDA acceleration
batch=16,
)
# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa YOLOv5 Và YOLOv10 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn YOLOv5
YOLOv5 là một lựa chọn tốt cho:
- Hệ thống sản xuất đã được chứng minh: Các triển khai hiện có trong đó YOLOv5 Dài track Lịch sử hoạt động ổn định, hệ thống tài liệu đầy đủ và sự ủng hộ mạnh mẽ từ cộng đồng được đánh giá cao.
- Đào tạo trong điều kiện nguồn lực hạn chế: Môi trường có nguồn lực hạn chế GPU nguồn lực ở đâu YOLOv5 Quy trình huấn luyện hiệu quả và yêu cầu bộ nhớ thấp hơn là những lợi thế của nó.
- Hỗ trợ định dạng xuất khẩu đa dạng: Các dự án yêu cầu triển khai trên nhiều định dạng khác nhau, bao gồm ONNX , TensorRT , CoreML và TFLite .
Khi nào nên chọn YOLOv10
YOLOv10 được khuyến nghị cho:
- NMS - Phát hiện thời gian thực không cần hệ thống quản lý truy cập (NMS): Các ứng dụng được hưởng lợi từ khả năng phát hiện toàn diện mà không cần hệ thống loại bỏ truy cập không tối đa (Non-Maximum Suppression), giúp giảm độ phức tạp khi triển khai.
- Cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng tốt giữa tốc độ suy luận và độ chính xác phát hiện trên nhiều quy mô mô hình khác nhau.
- Ứng dụng độ trễ ổn định: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như robot hoặc hệ thống tự hành.
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Tương lai: Ultralytics YOLO26
Trong khi YOLOv5 đã cách mạng hóa khả năng tiếp cận và YOLOv10 đã vượt qua các giới hạn của NMS - Với kiến trúc không ràng buộc, công nghệ tiên tiến vẫn tiếp tục phát triển. Đối với các dự án mới, chúng tôi đặc biệt khuyên dùng Ultralytics YOLO26 hiện đại, được phát hành vào tháng 1 năm 2026.
YOLO26 kết hợp độ tin cậy của... Ultralytics hệ sinh thái với những tiến bộ đột phá:
- NMS toàn diện - Thiết kế miễn phí: Tích hợp NMS - mô hình tự do trực tiếp vào Ultralytics Với framework YOLO26, việc triển khai trở nên đơn giản hơn và đảm bảo độ trễ thấp hơn.
- Suy luận CPU nhanh hơn tới 43%: Với việc loại bỏ Distribution Focal Loss (DFL), YOLO26 nhanh hơn đáng kể trên các thiết bị biên không có GPU.
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ những cải tiến trong huấn luyện LLM của Moonshot AI, bộ tối ưu hóa MuSGD mang lại sự ổn định chưa từng có và khả năng hội tụ nhanh chóng.
- ProgLoss + STAL: Các hàm mất mát mới này cải thiện đáng kể khả năng nhận dạng vật thể nhỏ, rất quan trọng đối với các lĩnh vực như ảnh chụp từ máy bay không người lái và robot.
Bạn có thể quản lý, đào tạo và triển khai YOLO26 trực tiếp thông qua Nền tảng Ultralytics .
Kết luận
Lựa chọn giữa YOLOv5 Và YOLOv10 Thường thì vấn đề nằm ở những ràng buộc cụ thể của dự án. YOLOv10 cung cấp tuyệt vời mAP dành cho các nhà nghiên cứu và ứng dụng tận dụng dữ liệu thô GPU thông lượng. Ngược lại, YOLOv5 Nó vẫn là một công cụ đáng tin cậy, có khả năng tương thích cao cho các triển khai tiêu chuẩn.
Tuy nhiên, lĩnh vực thị giác máy tính rất năng động. Để đạt được sự cân bằng hiệu năng, tính linh hoạt và dễ sử dụng tốt nhất, các nhà phát triển nên xem xét Ultralytics YOLO26 . Nó gói gọn tốc độ của... NMS suy luận không cần tham số với phương pháp mạnh mẽ, được ghi chép đầy đủ. Ultralytics Hệ sinh thái này đảm bảo các giải pháp AI thị giác của bạn có khả năng đáp ứng nhu cầu trong tương lai. Đối với các trường hợp sử dụng chuyên biệt, các nhà phát triển cũng có thể tìm hiểu YOLO11 để có độ ổn định tổng thể, hoặc RT-DETR để có độ chính xác dựa trên bộ chuyển đổi.