Chuyển đến nội dung

YOLOv5 so với YOLOv10 So sánh kỹ thuật toàn diện

Lĩnh vực thị giác máy tính thời gian thực đã chứng kiến ​​sự tăng trưởng theo cấp số nhân trong vài năm qua, với nhiều kiến ​​trúc khác nhau liên tục vượt qua giới hạn của những gì có thể thực hiện được trên phần cứng hiện đại. Khi đánh giá các kiến ​​trúc tiên tiến nhất, sự so sánh giữa YOLOv5YOLOv10 làm nổi bật một bước tiến hóa đáng kể trong lĩnh vực phát hiện đối tượng. Bài phân tích chuyên sâu về kỹ thuật này sẽ khám phá các mô hình kiến ​​trúc, sự đánh đổi về hiệu năng và cách các nhà phát triển có thể tận dụng những công cụ này trong môi trường sản xuất.

Tìm hiểu sâu về kiến trúc

Hiểu rõ sự khác biệt về cấu trúc giữa các mô hình này là điều vô cùng quan trọng để triển khai chúng một cách hiệu quả trong thực tế.

Ultralytics YOLOv5: Tiêu chuẩn Công nghiệp

Được giới thiệu bởi Ultralytics , YOLOv5 Từ lâu, nó đã được công nhận nhờ sự cân bằng vượt trội giữa tốc độ, độ chính xác và khả năng truy cập.

Tìm hiểu thêm về YOLOv5

YOLOv5 Nền tảng này dựa trên cơ chế phát hiện dựa trên điểm neo kết hợp với kiến ​​trúc CSPDarknet được tối ưu hóa sâu sắc. Kiến trúc này dựa nhiều vào các thao tác tiêu chuẩn được hỗ trợ trên hầu hết các công cụ suy luận, khiến nó cực kỳ linh hoạt. Điểm mạnh chính của nó nằm ở Ultralytics Python SDK , cung cấp trải nghiệm người dùng được tối ưu hóa, API đơn giản và tài liệu đầy đủ. Ngoài ra, YOLOv5 Yêu cầu bộ nhớ thấp hơn của nó so với các mô hình dựa trên Transformer có nghĩa là nó huấn luyện nhanh chóng trên GPU cấp người tiêu dùng mà không cần tốn nhiều VRAM.

YOLOv10 Thúc đẩy mô hình mới

Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 nhằm mục đích giải quyết các nút thắt cổ chai về độ trễ cụ thể được tìm thấy trong các kiến trúc trước đây.

Tìm hiểu thêm về YOLOv10

Đặc điểm xác định của YOLOv10 là bản địa của nó NMS Thiết kế không có (Không loại bỏ tối đa). Bằng cách sử dụng các nhiệm vụ kép nhất quán trong quá trình huấn luyện, mô hình loại bỏ sự cần thiết của NMS Xử lý hậu kỳ trong quá trình suy luận. Việc giảm độ trễ về mặt lý thuyết này rất có lợi cho các triển khai chạy trên phần cứng cao cấp với khả năng tăng tốc NVIDIA TensorRT mạnh mẽ, mặc dù nó có thể gây ra sự phức tạp về cấu trúc cho các thiết bị biên.

Lợi thế hệ sinh thái

Trong khi YOLOv10 Cung cấp những nét mới lạ thú vị về kiến ​​trúc. Ultralytics các mô hình như YOLOv5 và YOLO26 phiên bản mới hơn được hỗ trợ nguyên bản trong Nền tảng Ultralytics , mang lại hiệu quả huấn luyện vượt trội, tự động điều chỉnh siêu tham số và nhiều tùy chọn xuất dữ liệu ngay từ đầu.

Phân tích hiệu suất

Khi so sánh các mô hình này, cần cân bằng giữa độ chính xác ( mAP Các yếu tố như hiệu năng và chi phí tính toán (độ trễ và tham số) sẽ quyết định trường hợp sử dụng tối ưu. Dưới đây là bảng so sánh hiệu năng kỹ thuật trên tập dữ liệu COCO .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 rõ ràng đạt được mức cao hơn mAP50-95 ở các quy mô kích thước tương đương, tận dụng thiết kế mô hình hiện đại hóa, hướng đến hiệu quả và độ chính xác. Tuy nhiên, YOLOv5 duy trì độ trễ cực kỳ cạnh tranh, đặc biệt ở các cấp độ Nano và Small, khiến nó rất đáng tin cậy cho các môi trường nhúng bị hạn chế như NVIDIA Jetson CPU dòng hoặc tiêu chuẩn thông qua OpenVINO.

Phương pháp luận đào tạo và Hệ sinh thái

Giá trị của một mô hình gắn liền sâu sắc với hệ sinh thái xung quanh nó. Ultralytics duy trì một hệ sinh thái được bảo trì đặc biệt tốt, hỗ trợ một loạt các tác vụ vô cùng rộng lớn. Trong khi YOLOv10 chỉ tập trung nghiêm ngặt vào phát hiện đối tượng 2D, Ultralytics hỗ trợ nguyên bản segmentation thể hiện, phân loại hình ảnh, ước tính tư thếoriented bounding boxes (OBB).

Hơn nữa, việc đào tạo một Ultralytics Mô hình này yêu cầu lượng bộ nhớ tiêu hao thấp hơn đáng kể so với các phương pháp dựa trên transformer cạnh tranh, giúp chu kỳ phát triển nhanh chóng và tiết kiệm chi phí.

Thực thi mã liền mạch

Việc huấn luyện, xác thực và xuất mô hình được thống nhất trong một API duy nhất. Bạn có thể chuyển đổi giữa các mô hình chỉ bằng cách thay đổi một chuỗi ký tự.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")

# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")

# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes PyTorch CUDA acceleration
    batch=16,
)

# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa YOLOv5 và YOLOv10 phụ thuộc vào các yêu cầu dự án cụ thể, ràng buộc triển khai và sở thích hệ sinh thái của bạn.

Khi nào nên chọn YOLOv5

YOLOv5 là một lựa chọn tốt cho:

  • Hệ thống sản xuất đã được chứng minh: Các triển khai hiện có nơi hồ sơ track ổn định lâu dài, tài liệu phong phú và sự hỗ trợ cộng đồng lớn của YOLOv5 được đánh giá cao.
  • Huấn luyện hạn chế tài nguyên: Môi trường có tài nguyên GPU hạn chế, nơi quy trình huấn luyện hiệu quả và yêu cầu bộ nhớ thấp hơn của YOLOv5 là một lợi thế.
  • Hỗ trợ định dạng xuất rộng rãi: Các dự án yêu cầu triển khai trên nhiều định dạng, bao gồm ONNX, TensorRT, CoreMLTFLite.

Khi nào nên chọn YOLOv10

YOLOv10 được khuyến nghị cho:

  • detect thời gian thực không NMS: Các ứng dụng hưởng lợi từ detect end-to-end mà không cần Non-Maximum Suppression, giảm độ phức tạp khi triển khai.
  • Đánh đổi cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng mạnh mẽ giữa tốc độ suy luận và độ chính xác detect trên các quy mô mô hình khác nhau.
  • Ứng dụng có độ trễ nhất quán: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như trong robot học hoặc các hệ thống tự hành.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • Triển khai biên không NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của xử lý hậu kỳ Non-Maximum Suppression.
  • Môi trường chỉ có CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi khả năng suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Detect đối tượng nhỏ: Các kịch bản đầy thách thức như hình ảnh từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các đối tượng rất nhỏ.

Tương lai: Ultralytics YOLO26

Trong khi YOLOv5 đã cách mạng hóa khả năng tiếp cận và YOLOv10 đã vượt qua các giới hạn của NMS - Với kiến ​​trúc không ràng buộc, công nghệ tiên tiến vẫn tiếp tục phát triển. Đối với các dự án mới, chúng tôi đặc biệt khuyên dùng Ultralytics YOLO26 hiện đại, được phát hành vào tháng 1 năm 2026.

YOLO26 kết hợp độ tin cậy của... Ultralytics hệ sinh thái với những tiến bộ đột phá:

  • Thiết kế NMS-Free End-to-End: Bằng cách tích hợp mô hình NMS-free trực tiếp vào framework Ultralytics, YOLO26 đơn giản hóa việc triển khai và đảm bảo độ trễ thấp hơn.
  • Tăng tốc suy luận trên CPU lên đến 43%: Với việc loại bỏ Distribution Focal Loss (DFL), YOLO26 nhanh hơn đáng kể trên các thiết bị biên không có GPU.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ những đổi mới trong huấn luyện LLM từ Moonshot AI, trình tối ưu hóa MuSGD mang lại sự ổn định chưa từng có và khả năng hội tụ nhanh chóng.
  • ProgLoss + STAL: Các hàm mất mát mới này cải thiện đáng kể khả năng nhận diện vật thể nhỏ, rất quan trọng cho các lĩnh vực như hình ảnh từ máy bay không người lái và robot.

Bạn có thể quản lý, đào tạo và triển khai YOLO26 trực tiếp thông qua Nền tảng Ultralytics .

Kết luận

Việc lựa chọn giữa YOLOv5 và YOLOv10 thường phụ thuộc vào các ràng buộc dự án cụ thể. YOLOv10 cung cấp mAP vượt trội cho các nhà nghiên cứu và ứng dụng tận dụng thông lượng GPU thô. Ngược lại, YOLOv5 vẫn là một công cụ đáng tin cậy, có khả năng tương thích cao cho các triển khai tiêu chuẩn.

Tuy nhiên, lĩnh vực thị giác máy tính rất năng động. Để đạt được sự cân bằng hiệu năng, tính linh hoạt và dễ sử dụng tốt nhất, các nhà phát triển nên xem xét Ultralytics YOLO26 . Nó gói gọn tốc độ của... NMS suy luận không cần tham số với phương pháp mạnh mẽ, được ghi chép đầy đủ. Ultralytics Hệ sinh thái này đảm bảo các giải pháp AI thị giác của bạn có khả năng đáp ứng nhu cầu trong tương lai. Đối với các trường hợp sử dụng chuyên biệt, các nhà phát triển cũng có thể tìm hiểu YOLO11 để có độ ổn định tổng thể, hoặc RT-DETR để có độ chính xác dựa trên bộ chuyển đổi.


Bình luận