Chuyển đến nội dung

YOLOv8 so với YOLOv5 So sánh kỹ thuật toàn diện

Việc lựa chọn kiến ​​trúc thị giác máy tính phù hợp là một bước quan trọng trong việc xây dựng các quy trình học máy mạnh mẽ. Trong bài so sánh kỹ thuật chi tiết này, chúng ta sẽ khám phá sự khác biệt giữa hai mô hình phổ biến nhất trong hệ sinh thái AI thị giác: YOLOv8YOLOv5 . Cả hai mô hình đều được phát triển bởi Ultralytics và đã góp phần định hình đáng kể lĩnh vực phát hiện đối tượng theo thời gian thực, thiết lập các tiêu chuẩn ngành về tốc độ, độ chính xác và tính dễ sử dụng.

Cho dù bạn đang triển khai trên các thiết bị biên hay mở rộng quy mô suy luận trên đám mây, việc hiểu rõ những thay đổi về kiến ​​trúc, các chỉ số hiệu suất và phương pháp huấn luyện của các mô hình này sẽ giúp bạn đưa ra quyết định sáng suốt cho các dự án thị giác máy tính của mình.

Ultralytics YOLOv8: Tiêu chuẩn Đa năng

Được phát hành vào đầu năm 2023, YOLOv8 Nó đánh dấu một sự thay đổi lớn về kiến ​​trúc so với các thế hệ trước. Nó được thiết kế từ đầu để trở thành một khung thống nhất có khả năng xử lý nhiều tác vụ thị giác một cách tự nhiên, bao gồm phân đoạn đối tượng , phân loại hình ảnh và ước lượng tư thế .

Kiến trúc và Phương pháp luận

YOLOv8 Đã giới thiệu một đầu phát hiện không cần neo , giúp đơn giản hóa quá trình huấn luyện bằng cách loại bỏ nhu cầu cấu hình thủ công các hộp neo dựa trên phân bố dữ liệu. Điều này làm cho mô hình mạnh mẽ hơn khi khái quát hóa sang các tập dữ liệu tùy chỉnh và giảm số lượng dự đoán hộp, tăng tốc độ loại bỏ cực đại không cần thiết ( NMS ) .

Kiến trúc này có mô-đun C2f (Cross-Stage Partial bottleneck with two convolutions), thay thế cho mô-đun C3 được tìm thấy trong... YOLOv5 Mô-đun C2f cải thiện luồng gradient và cho phép mô hình học được các biểu diễn đặc trưng phong phú hơn mà không làm tăng đáng kể chi phí tính toán. Hơn nữa, YOLOv8 Nó sử dụng cấu trúc đầu tách rời , phân tách các nhiệm vụ nhận dạng đối tượng, phân loại và hồi quy, điều này đã được chứng minh là giúp cải thiện tốc độ hội tụ và độ chính xác.

Hiệu quả bộ nhớ

Ultralytics YOLO các mô hình, bao gồm YOLOv8 được tối ưu hóa cho mức thấp hơn CUDA Mức sử dụng bộ nhớ trong quá trình huấn luyện thấp hơn so với nhiều phương pháp thay thế dựa trên Transformer như RT-DETR . Điều này cho phép các nhà phát triển sử dụng kích thước batch lớn hơn trên các GPU tiêu chuẩn dành cho người tiêu dùng. NVIDIA Dòng RTX.

Điểm mạnh và Điểm yếu

Điểm mạnh:

  • Khả năng thích ứng vượt trội trên nhiều tác vụ khác nhau, không chỉ đơn thuần là phát hiện khung giới hạn.
  • Được tinh giản Python API thông qua ultralytics Gói phần mềm này giúp việc đào tạo và xuất dữ liệu trở nên vô cùng trực quan.
  • Độ chính xác trung bình ( mAP ) cao hơn trên tất cả các biến thể kích thước so với YOLOv5 .

Điểm yếu:

  • Việc tách rời đầu đọc và mô-đun C2f dẫn đến sự gia tăng nhẹ về số lượng tham số và FLOPs đối với một số biến thể so với phiên bản chính xác của chúng. YOLOv5 đối tác.

Tìm hiểu thêm về YOLOv8

Ultralytics YOLOv5 Người tiên phong trong phương pháp Agile

Được giới thiệu vào năm 2020, YOLOv5 đem lại YOLO Đóng góp đáng kể vào hệ sinh thái PyTorch , giúp cải thiện khả năng tiếp cận cho các nhà phát triển. Nó nhanh chóng trở thành tiêu chuẩn ngành cho các mô hình phát hiện đối tượng nhanh, đáng tin cậy và dễ triển khai.

Kiến trúc và Phương pháp luận

YOLOv5 Mô hình này dựa trên kiến ​​trúc dựa trên điểm neo và sử dụng mạng xương sống CSPDarknet53 đã được sửa đổi. Mặc dù các phương pháp dựa trên điểm neo yêu cầu phân cụm cẩn thận các hộp giới hạn của tập dữ liệu để xác định các điểm neo tối ưu trước khi huấn luyện, nhưng chúng rất hiệu quả đối với các tập dữ liệu cụ thể, được xác định rõ ràng.

YOLOv5 Nó tích hợp mô-đun C3 , giúp trích xuất các đặc trưng một cách hiệu quả trong khi vẫn duy trì số lượng tham số thấp. Hàm mất mát của nó dựa nhiều vào mất mát Objectness kết hợp với mất mát phân loại và hồi quy hộp giới hạn để hướng dẫn mạng đến các dự đoán chính xác.

Điểm mạnh và Điểm yếu

Điểm mạnh:

  • Với trọng lượng cực nhẹ, các phiên bản Nano (YOLOv5n) và Small (YOLOv5s) rất phù hợp cho việc triển khai AI biên trong môi trường hạn chế tài nguyên.
  • Tốc độ suy luận cực nhanh, đặc biệt là trên CPU.
  • Một hệ sinh thái đã được thiết lập vững chắc với kho tài liệu hướng dẫn khổng lồ từ cộng đồng và khả năng tích hợp với bên thứ ba.

Điểm yếu:

  • Yêu cầu cấu hình hộp neo, điều này có thể làm phức tạp quá trình thiết lập đối với các tập dữ liệu rất đa dạng hoặc tùy chỉnh.
  • Độ chính xác tổng thể thấp hơn ( mAP so với các kiến ​​trúc hiện đại không cần neo như YOLOv8 và YOLO26.

Tìm hiểu thêm về YOLOv5

So sánh hiệu suất

Khi đánh giá các mô hình này, việc đạt được sự cân bằng tối ưu giữa tốc độ và độ chính xác là vô cùng quan trọng. Bảng dưới đây trình bày các chỉ số hiệu năng của cả hai kiến ​​trúc được đánh giá trên tập dữ liệu COCO . CPU Tốc độ được đo bằng ONNX , trong khi GPU Tốc độ được kiểm tra bằng TensorRT .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Trong khi YOLOv5 Nó vẫn giữ được ưu thế nhỏ về số lượng tham số và tốc độ xử lý thô tuyệt đối đối với phiên bản Nano của nó. YOLOv8 mang lại một bước nhảy vọt đáng kể mAP Trên diện rộng, điều này mang lại sự cân bằng hiệu năng mạnh mẽ hơn nhiều cho các kịch bản triển khai thực tế đòi hỏi khắt khe.

Dễ sử dụng và Ultralytics Hệ sinh thái

Một đặc điểm nổi bật của thời hiện đại Ultralytics Điểm khác biệt của các mô hình chính là hệ sinh thái được duy trì tốt xung quanh chúng. Quá trình chuyển đổi từ YOLOv5 ĐẾN YOLOv8 đã dẫn đến sự ra đời của hệ thống thống nhất. ultralytics Gói pip, tạo ra trải nghiệm người dùng được tối ưu hóa cao.

Các nhà phát triển có thể dễ dàng xử lý việc huấn luyện, xác thực, dự đoán và xuất mô hình chỉ với một vài dòng mã. Python mã nguồn, bỏ qua các đoạn mã phức tạp thường cần thiết trong các dự án học sâu trước đây.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the model to ONNX for production deployment
path = model.export(format="onnx")

Hơn nữa, việc tích hợp với các công cụ như Ultralytics Platform giúp đơn giản hóa việc quản lý tập dữ liệu, đào tạo trên nền tảng đám mây và triển khai, đảm bảo sự phát triển tích cực và hỗ trợ mạnh mẽ từ cộng đồng.

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn YOLOv5 : Nếu bạn đang bảo trì các hệ thống cũ, chạy suy luận trên các CPU bị hạn chế nghiêm trọng như Raspberry Pi , hoặc đang làm việc trên một dự án mà việc tiết kiệm từng phần nhỏ của megabyte trong kích thước mô hình là vô cùng quan trọng, YOLOv5 vẫn là một cỗ máy làm việc đáng tin cậy.

Khi nào nên chọn YOLOv8 : Phù hợp với hầu hết các dự án mới bắt đầu từ hôm nay. YOLOv8 được đánh giá cao hơn YOLOv5 Kiến trúc tiên tiến của nó xử lý việc theo dõi phức tạp, hộp giới hạn định hướng (OBB) và phân đoạn một cách dễ dàng. Nó lý tưởng cho các ứng dụng hiện đại, từ robot tự hành đến phân tích hình ảnh y tế và cơ sở hạ tầng thành phố thông minh.

Bạn đang tìm kiếm công nghệ tiên tiến nhất?

Trong khi YOLOv8 Với khả năng vượt trội, các nhà phát triển đang tìm kiếm hiệu năng tối ưu nhất nên cân nhắc YOLO26 . Được phát hành vào năm 2026, nó giới thiệu một số cải tiến đột phá:

  • Thiết kế NMS từ đầu đến cuối - Miễn phí: Loại bỏ NMS xử lý hậu kỳ để triển khai nhanh hơn, đơn giản hơn, một khái niệm lần đầu tiên được tiên phong trong YOLOv10 .
  • MuSGD Optimizer: Một sự kết hợp của... SGD và Muon, công nghệ mang đến những cải tiến trong huấn luyện LLM cho thị giác máy tính, cho phép huấn luyện ổn định hơn và hội tụ nhanh hơn.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho môi trường điện toán biên không có GPU chuyên dụng.
  • Loại bỏ DFL: Hiện tượng mất nét phân bổ (Distribution Focal Loss - DFL) đã được loại bỏ để đơn giản hóa quá trình xuất dữ liệu và tăng cường khả năng tương thích với thiết bị biên.
  • ProgLoss + STAL: Các hàm mất mát nâng cao mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ, điều này rất quan trọng đối với ảnh chụp từ trên không và IoT.

Bằng cách tận dụng nguồn tài liệu và công cụ toàn diện được cung cấp bởi Ultralytics Bạn có thể dễ dàng triển khai. YOLOv8 Hoặc khám phá YOLO26 tiên tiến, để giải quyết các thách thức hình ảnh phức tạp với tốc độ và độ chính xác chưa từng có. Để tìm hiểu thêm, hãy xem các hướng dẫn của chúng tôi về điều chỉnh siêu tham sốcác phương pháp triển khai mô hình .


Bình luận