Chuyển đến nội dung

YOLOv5 so với YOLOv6 -3.0: Cân bằng giữa sự trưởng thành của hệ sinh thái và độ chính xác của công nghiệp

Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn kiến trúc phát hiện đối tượng phù hợp là một quyết định then chốt đối với các nhà phát triển và nhà nghiên cứu. Bài so sánh này đi sâu vào những khác biệt kỹ thuật giữa Ultralytics YOLOv5 , một mô hình huyền thoại nổi tiếng với khả năng truy cập và hệ sinh thái mạnh mẽ, và Meituan YOLOv6 , một nền tảng được thiết kế riêng cho các ứng dụng công nghiệp. Mặc dù cả hai mô hình đều xuất sắc trong việc phát hiện đối tượng , chúng đáp ứng các nhu cầu triển khai và tùy chọn quy trình làm việc khác nhau.

Ultralytics YOLOv5

Tác giả : Glenn Jocher
Tổ chức : Ultralytics
Ngày : 26-06-2020
GitHub : https://github.com/ ultralytics / yolov5
Tài liệu : https://docs. ultralytics .com/models/ yolov5 /

Kể từ khi phát hành vào năm 2020, YOLOv5 đã khẳng định vị thế là một trong những mô hình AI phổ biến và đáng tin cậy nhất trên thế giới. Được xây dựng trên nền tảng PyTorch , PyTorch ưu tiên khả năng sử dụng, khả năng xuất khẩu và hiệu suất "sẵn sàng sử dụng", giúp mọi người dễ dàng tiếp cận AI thị giác tiên tiến.

Kiến trúc và Hệ sinh thái

YOLOv5 sử dụng xương sống CSPDarknet kết hợp với cổ PANet và đầu kiểu YOLOv3. Kiến trúc của nó dựa trên mô hình neo, sử dụng hộp neo để dự đoán vị trí đối tượng. Điểm khác biệt chính là sự tích hợp vào một hệ sinh thái hoàn thiện. Không giống như nhiều cơ sở dữ liệu mã nghiên cứu khác, YOLOv5 được thiết kế như một sản phẩm dành cho các kỹ sư, có tính năng xuất liền mạch sang các định dạng như ONNX , CoreML , Và TFLite , khiến nó trở nên cực kỳ linh hoạt khi triển khai trên thiết bị di động và biên.

Điểm mạnh chính

  • Dễ sử dụng : " YOLOv5 "Trải nghiệm" được định nghĩa bởi tính đơn giản của nó. Từ việc đào tạo các tập dữ liệu tùy chỉnh đến việc chạy suy luận, quy trình làm việc được sắp xếp hợp lý và ghi chép đầy đủ.
  • Hệ sinh thái được bảo trì tốt : Người dùng được hưởng lợi từ việc bảo trì tích cực, cập nhật thường xuyên và cộng đồng đông đảo. Tích hợp với các công cụ MLOps như Weights & BiasesComet là công cụ gốc.
  • Tính linh hoạt : Ngoài khả năng phát hiện tiêu chuẩn, kho lưu trữ còn hỗ trợ phân đoạn phiên bảnphân loại hình ảnh , cung cấp giải pháp đa nhiệm trong một cơ sở mã duy nhất.
  • Hiệu quả bộ nhớ : YOLOv5 được biết đến với dung lượng bộ nhớ tương đối thấp trong quá trình đào tạo so với các mô hình dựa trên máy biến áp, khiến nó có thể truy cập được trên GPU dành cho người tiêu dùng.

Triển khai liền mạch

YOLOv5 Tập trung vào khả năng xuất khẩu cho phép các nhà phát triển triển khai các mô hình một cách dễ dàng đến nhiều môi trường khác nhau, từ máy chủ đám mây đến các thiết bị biên như Raspberry Pi hoặc NVIDIA Jetson.

Tìm hiểu thêm về YOLOv5

Meituan YOLOv6 -3.0

Tác giả : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
Tổ chức : Meituan
Ngày : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/ YOLOv6
Tài liệu : https://docs. ultralytics .com/models/yolov6/

YOLOv6 -3.0, được phát triển bởi nhóm AI tầm nhìn tại Meituan, tự định vị mình là một đối thủ cạnh tranh trong ngành, tập trung vào việc cân bằng tốc độ và độ chính xác, đặc biệt cho các ứng dụng nhận biết phần cứng. Nó được thiết kế để tối đa hóa thông lượng trên GPU bằng cách sử dụng tối ưu hóa TensorRT .

Kiến trúc và Tập trung Công nghiệp

YOLOv6 sử dụng xương sống EfficientRep và cổ Rep-PAN, tận dụng các kỹ thuật tham số hóa lại (kiểu RepVGG) để cải thiện tốc độ suy luận mà không làm giảm độ chính xác. Trong quá trình huấn luyện, mô hình sử dụng cấu trúc nhiều nhánh, sau đó được thu gọn thành cấu trúc một nhánh trong quá trình suy luận. Phiên bản 3.0 đã giới thiệu các chiến lược như tự chưng cất để tăng cường hơn nữa Độ chính xác trung bình ( mAP ) .

Điểm mạnh và Điểm yếu

  • Tối ưu hóa GPU : Kiến trúc được tinh chỉnh mạnh mẽ cho tiêu chuẩn GPU suy luận, thường đạt được điểm chuẩn FPS cao trên NVIDIA Thẻ T4 khi sử dụng TensorRT .
  • Thân thiện với lượng tử hóa : Meituan cung cấp hỗ trợ cụ thể cho lượng tử hóa sau đào tạo (PTQ) và đào tạo nhận biết lượng tử hóa (QAT), điều này rất quan trọng đối với một số tình huống triển khai công nghiệp.
  • Tính linh hoạt hạn chế : Mặc dù có khả năng phát hiện tuyệt vời, YOLOv6 thiếu sự hỗ trợ đa nhiệm rộng rãi, bản địa (như Ước tính tư thế hoặc OBB) được tìm thấy trong toàn diện Ultralytics phòng suite.
  • Độ phức tạp : Các bước tham số hóa lại và các đường ống đào tạo cụ thể có thể tạo ra độ phức tạp so với bản chất cắm và chạy của Ultralytics các mô hình.

Tìm hiểu thêm về YOLOv6

So sánh trực tiếp hiệu năng

Sự so sánh dưới đây nêu bật sự đánh đổi về hiệu suất. YOLOv6 -3.0 hướng đến độ chính xác cao nhất trên phần cứng mạnh mẽ, thường đánh đổi hiệu quả tham số. Ngược lại, Ultralytics YOLOv5 duy trì sự cân bằng đáng chú ý, cung cấp các mô hình nhẹ vượt trội trong CPU -môi trường dựa trên và suy luận thời gian thực trên các thiết bị biên.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv6 -3.0n64037.5-1.174.711.4
YOLOv6 -3.0 giây64045.0-2.6618.545.3
YOLOv6 -3,0m64050.0-5.2834.985.8
YOLOv6 -3.0l64052.8-8.9559.6150.7

Phân tích

YOLOv5n nổi bật là một giải pháp cực kỳ hiệu quả cho các ứng dụng di động, yêu cầu ít tham số hơn đáng kể (2,6M) so với giải pháp nhỏ nhất YOLOv6 biến thể (4,7M). Trong khi YOLOv6 -3.0 đạt đỉnh cao hơn mAP ở kích thước lớn hơn, nó làm như vậy với cái giá phải trả là kích thước mô hình tăng lên (FLOP và Tham số). Đối với các nhà phát triển nhắm mục tiêu CPU triển khai (phổ biến trong robot hoặc giám sát công suất thấp), YOLOv5 'S CPU tốc độ được đánh giá chuẩn và tối ưu hóa rõ ràng, trong khi YOLOv6 tập trung nhiều vào GPU gia tốc.

Phương pháp đào tạo và kinh nghiệm

Trải nghiệm đào tạo có sự khác biệt đáng kể giữa hai hệ sinh thái. Ultralytics ưu tiên phương pháp mã thấp, tính linh hoạt cao.

Ultralytics Quy trình làm việc

YOLOv5 có thể được tích hợp trực tiếp thông qua PyTorch Hub cho phép người dùng tải và chạy mô hình với mã nguồn tối thiểu. Tập lệnh đào tạo xử lý mọi thứ, từ tăng cường dữ liệu đến ghi nhật ký tự động.

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference
img = "https://ultralytics.com/images/zidane.jpg"
results = model(img)
results.print()

Quy trình làm việc công nghiệp

YOLOv6 thường yêu cầu thiết lập thủ công hơn, bao gồm sao chép kho lưu trữ, thiết lập các tệp cấu hình cụ thể cho xương sống tham số hóa và chạy các tập lệnh ít được tích hợp với các công cụ MLOps bên ngoài ngay khi cài đặt. Mặc dù mạnh mẽ, nhưng nó đòi hỏi sự hiểu biết sâu sắc hơn về các ràng buộc kiến trúc cụ thể (như các tham số tự tinh lọc) để đạt được các điểm chuẩn đã báo cáo.

Các trường hợp sử dụng lý tưởng

Việc lựa chọn giữa các mô hình này phụ thuộc vào những hạn chế cụ thể của bạn về phần cứng, độ chính xác và tốc độ phát triển.

  • Ultralytics YOLOv5 : Lựa chọn hàng đầu cho việc tạo mẫu nhanh, triển khai biên và hỗ trợ cộng đồng . Nếu bạn cần triển khai trên Raspberry Pi, điện thoại di động hoặc CPU máy chủ, YOLOv5 Tính nhẹ nhàng và khả năng hỗ trợ xuất dữ liệu của nó là vô song. Nó cũng lý tưởng cho các nhà nghiên cứu cần một cơ sở mã đa năng, hỗ trợ phân đoạn và phân loại cùng với phát hiện.
  • Meituan YOLOv6 -3.0 : Phù hợp nhất cho môi trường công nghiệp cố định, nơi có sẵn GPU cao cấp và tối đa hóa mAP là ưu tiên duy nhất. Nếu bạn đang xây dựng một hệ thống đảm bảo chất lượng nhà máy đang chạy trên NVIDIA Máy chủ T4/A10 và có các nguồn lực kỹ thuật để tinh chỉnh các mô hình được tham số hóa lại, YOLOv6 là một ứng cử viên mạnh.

Kết luận

Ultralytics YOLOv5 vẫn là nền tảng của cộng đồng thị giác máy tính, được ca ngợi vì sự cân bằng hiệu suất , dễ sử dụng và hệ sinh thái phát triển mạnh mẽ. Khả năng cung cấp kết quả đáng tin cậy trên nhiều loại phần cứng - từ biên đến đám mây - khiến nó trở thành lựa chọn ưu tiên cho hầu hết các nhà phát triển ưu tiên tính linh hoạt và thời gian đưa sản phẩm ra thị trường.

Trong khi YOLOv6 -3.0 giới thiệu những cải tiến kiến trúc ấn tượng cho công nghiệp GPU suy luận, nó thiếu hệ sinh thái toàn diện và khả năng thích ứng đa nền tảng của Ultralytics mô hình. Đối với những người tìm kiếm hiệu suất và hiệu quả mới nhất tuyệt đối, chúng tôi khuyên bạn nên khám phá Ultralytics YOLO11 , vượt trội cả hai YOLOv5 Và YOLOv6 về độ chính xác và tốc độ trong khi vẫn giữ được sự thân thiện với người dùng Ultralytics Giao diện lập trình ứng dụng (API).

Đối với các nhiệm vụ chuyên biệt, các nhà phát triển cũng có thể xem xét các mô hình khác trong Ultralytics tài liệu, chẳng hạn như YOLOv8 , YOLOv9 , YOLOv10 hoặc RT-DETR dựa trên máy biến áp.

Khám phá toàn bộ tiềm năng của AI thị giác tại Tài liệu mô hình Ultralytics .


Bình luận