Chuyển đến nội dung

YOLOv6 -3.0 so với YOLOv5 So sánh kỹ thuật toàn diện

Sự phát triển của công nghệ phát hiện đối tượng thời gian thực đã chứng kiến ​​nhiều kiến ​​trúc được tối ưu hóa cho các kịch bản triển khai khác nhau. Trong bài phân tích chuyên sâu này, chúng ta sẽ so sánh hai mô hình nổi bật: YOLOv6 tập trung vào ngành công nghiệp và Ultralytics YOLOv5 , một mô hình nền tảng có tính linh hoạt cao. Hiểu rõ các lựa chọn kiến ​​trúc, số liệu hiệu năng và sự hỗ trợ hệ sinh thái của từng mô hình sẽ giúp bạn chọn được khung xử lý hình ảnh tối ưu cho các ứng dụng thực tế của mình.

YOLOv6 -3.0: Tối ưu hóa hiệu suất công nghiệp và phần cứng

Được phát triển bởi bộ phận Trí tuệ nhân tạo thị giác tại Meituan , YOLOv6 -3.0 được thiết kế đặc biệt cho môi trường công nghiệp có thông lượng cao. Nó tập trung vào việc tối đa hóa tốc độ khung hình trên các bộ tăng tốc phần cứng như máy tính chuyên dụng. NVIDIA GPU.

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
  • Tổ chức: Meituan
  • Ngày: 2023-01-13
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6
  • Tài liệu:Tài liệu YOLOv6

Điểm mạnh về kiến trúc

YOLOv6 -3.0 giới thiệu một số tối ưu hóa cấu trúc được thiết kế để tăng tốc độ. Mô hình sử dụng kiến ​​trúc xương sống EfficientRep , được thiết kế đặc biệt để thân thiện với phần cứng trong quá trình xử lý. GPU suy luận. Điều này làm cho kiến ​​trúc này đặc biệt mạnh mẽ đối với các tác vụ xử lý hàng loạt ngoại tuyến.

Trong giai đoạn huấn luyện, mô hình tích hợp chiến lược Huấn luyện Hỗ trợ Anchor (AAT) . Phương pháp này cố gắng kết hợp tính ổn định của huấn luyện dựa trên anchor với tốc độ suy luận không dựa trên anchor. Ngoài ra, kiến ​​trúc phần cổ của nó sử dụng mô- đun Nối Hai chiều (BiC) để cải thiện việc kết hợp đặc trưng trên các quy mô khác nhau. Mặc dù được tối ưu hóa cao cho GPU máy chủ cao cấp sử dụng TensorRT , sự chuyên biệt hóa này đôi khi có thể dẫn đến độ trễ tăng lên. CPU - Chỉ dành cho các thiết bị biên hoặc thiết bị biên công suất thấp.

Tìm hiểu thêm về YOLOv6

Ultralytics YOLOv5 Người tiên phong trong lĩnh vực Trí tuệ nhân tạo thị giác dễ tiếp cận

Được phát hành bởi Ultralytics , YOLOv5 Nó đã thiết lập một tiêu chuẩn mới về tính dễ sử dụng, hiệu quả đào tạo và khả năng triển khai mạnh mẽ. Nó đã dân chủ hóa việc phát hiện đối tượng hiệu suất cao bằng cách tích hợp sâu rộng với các quy trình học sâu hiện đại.

Hệ sinh thái và tính linh hoạt

Đặc điểm xác định của YOLOv5 Điểm nổi bật của nó là tính dễ sử dụng . Được xây dựng nguyên bản trên nền tảng PyTorch , kho lưu trữ này cung cấp một giao diện thống nhất. Python API này đơn giản hóa đáng kể vòng đời của học máy . Từ cấu hình tập dữ liệu đến triển khai cuối cùng, hệ sinh thái tích hợp đảm bảo các nhà phát triển dành ít thời gian hơn cho việc gỡ lỗi môi trường và nhiều thời gian hơn cho việc xây dựng ứng dụng.

YOLOv5 Không chỉ giới hạn ở việc phát hiện đối tượng . Nó sở hữu tính linh hoạt vượt trội, hỗ trợ phân loại hình ảnhphân đoạn đối tượng một cách tự nhiên. Hơn nữa, nó cung cấp hiệu quả đào tạo chưa từng có, với bộ nhớ đệm thông minh, trình tải dữ liệu tự động và hỗ trợ tích hợp cho đa phân tán. GPU đào tạo.

Hiệu quả bộ nhớ trong Ultralytics Mô hình

Khi so sánh các kiến ​​trúc mô hình, mức tiêu thụ bộ nhớ là một yếu tố quan trọng. Ultralytics YOLO Các mô hình này duy trì yêu cầu VRAM thấp hơn đáng kể trong cả quá trình huấn luyện và suy luận so với các mô hình transformer phức tạp, giúp chúng dễ tiếp cận hơn đối với các nhà phát triển sử dụng phần cứng cấp người tiêu dùng hoặc sổ tay đám mây như Google Colab .

Tìm hiểu thêm về YOLOv5

So sánh hiệu năng và kiến ​​trúc

Bảng dưới đây trình bày các chỉ số hiệu năng của cả hai kiến ​​trúc khi được đánh giá trên tập dữ liệu COCO chuẩn. Hãy chú ý cách các mô hình cân bằng giữa độ chính xác trung bình và tốc độ suy luận trong các môi trường khác nhau.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Phân tích

YOLOv6 -3.0 đạt được kết quả ấn tượng mAP điểm số và được tối ưu hóa cao cho TensorRT các đường ống trên GPU T4. Tuy nhiên, YOLOv5 Các quầy hàng có hệ sinh thái được duy trì cực kỳ tốt , hỗ trợ xuất dữ liệu ngay lập tức sang nhiều định dạng, bao gồm ONNX , CoreML , Và TFLite Sự cân bằng hiệu suất này đảm bảo rằng YOLOv5 Hoạt động ổn định không chỉ trên các máy chủ chuyên dụng mà còn trên các thiết bị di động và môi trường điện toán biên như Raspberry Pi .

Ví dụ mã: Đào tạo liền mạch với Ultralytics

Một trong những ưu điểm lớn nhất của Ultralytics Hệ sinh thái mang đến trải nghiệm người dùng được tối ưu hóa. Việc huấn luyện mô hình, đánh giá và xuất mô hình chỉ cần một vài dòng lệnh. Python .

from ultralytics import YOLO

# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format for flexible deployment
model.export(format="onnx")

Các trường hợp sử dụng lý tưởng và kịch bản triển khai

Việc lựa chọn giữa các kiến ​​trúc này thường phụ thuộc vào những hạn chế cụ thể về cơ sở hạ tầng của bạn:

  • Khi nào nên triển khai YOLOv6 -3.0: Lý tưởng cho các dây chuyền sản xuất tự động và phân tích máy chủ hiệu suất cao, nơi cần có các tính năng chuyên dụng. NVIDIA GPU có sẵn và độ trễ phải ở mức tối thiểu. Kiến trúc của nó phát huy tối đa hiệu quả trong các môi trường mà... TensorRT Các biện pháp tối ưu hóa có thể được tận dụng tối đa.
  • Khi nào nên triển khai YOLOv5 : Lựa chọn hoàn hảo cho việc tạo mẫu nhanh, triển khai đa nền tảng và các nhóm đang tìm kiếm một quy trình thống nhất. Khả năng xuất dữ liệu đa dạng của nó làm cho nó trở nên lý tưởng cho phân tích bán lẻ trên thiết bị biên, giám sát máy bay không người lái trong nông nghiệp và ước tính tư thế trong các ứng dụng thể dục.

Tương lai của nhận diện đối tượng: Hãy cùng chào đón YOLO26!

Trong khi YOLOv5 Và YOLOv6 Đại diện cho những cột mốc quan trọng, lĩnh vực thị giác máy tính đang phát triển nhanh chóng. Đối với các nhà phát triển bắt đầu dự án mới hoặc tìm kiếm công nghệ tiên tiến nhất, chúng tôi đặc biệt khuyên bạn nên nâng cấp lên Ultralytics YOLO26 (phát hành tháng 1 năm 2026).

YOLO26 định nghĩa lại AI thị giác ưu tiên thiết bị đầu cuối bằng cách giới thiệu thiết kế đột phá không cần hệ thống quản lý mạng NMS . Bằng cách loại bỏ nhu cầu xử lý hậu kỳ loại bỏ các điểm không tối đa (Non-Maximum Suppression), nó đơn giản hóa logic triển khai và giảm đáng kể sự biến đổi độ trễ.

Những cải tiến chính trong YOLO26 bao gồm:

  • MuSGD Optimizer: Một sự kết hợp của... SGD và Muon, mang lại sự ổn định huấn luyện LLM tiên tiến cho thị giác máy tính để hội tụ nhanh hơn và đáng tin cậy hơn.
  • Tăng tốc độ suy luận CPU lên đến 43%: Được tối ưu hóa mạnh mẽ cho các môi trường không có bộ tăng tốc chuyên dụng.
  • Loại bỏ DFL: Việc loại bỏ hiện tượng suy hao tiêu điểm phân phối (Distribution Focal Loss - DFL) giúp đơn giản hóa quy trình xuất khẩu và tăng cường khả năng tương thích với các thiết bị biên công suất thấp.
  • ProgLoss + STAL: Các hàm mất mát nâng cao giúp tăng cường đáng kể khả năng nhận dạng vật thể nhỏ, rất quan trọng đối với ảnh chụp từ trên không và các cảm biến IoT trong thành phố thông minh.

Đối với các tác vụ thông thường, YOLO11 vẫn là một lựa chọn tuyệt vời và được hỗ trợ đầy đủ. Ultralytics gia đình.

Tìm hiểu thêm về YOLO26

Kết luận

Cả hai YOLOv6 -3.0 và YOLOv5 đã đóng vai trò then chốt trong việc thúc đẩy khả năng phát hiện theo thời gian thực. YOLOv6 -3.0 cung cấp một kiến ​​trúc chuyên biệt cao cho GPU -tăng tốc độ xử lý, trong khi YOLOv5 Cung cấp trải nghiệm phát triển phần mềm tuyệt vời nhờ tài liệu hướng dẫn chi tiết, dễ sử dụng và khả năng xử lý đa nhiệm.

Đối với các ứng dụng hiện đại, việc tận dụng sự tích hợp là rất quan trọng. Ultralytics Hệ sinh thái này đảm bảo quy trình làm việc bền vững trong tương lai. Bằng cách áp dụng các kiến ​​trúc mới nhất như YOLO26, bạn đảm bảo rằng các quy trình triển khai của mình được hưởng lợi từ những đột phá mới nhất về tốc độ, độ chính xác và sự đơn giản của thuật toán.


Bình luận