Chuyển đến nội dung

So sánh chi tiết về mặt kỹ thuật giữa PP-YOLOE+ và YOLOv5

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, cân bằng giữa độ chính xác, tốc độ và tính dễ triển khai. Trang này cung cấp so sánh kỹ thuật chuyên sâu giữa PP-YOLOE+, một mô hình hiệu quả từ Baidu và Ultralytics YOLOv5, một mô hình được áp dụng rộng rãi và đã được chứng minh trong ngành. Chúng ta sẽ khám phá kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng của chúng để giúp bạn đưa ra lựa chọn sáng suốt cho các dự án thị giác máy tính của mình.

PP-YOLOE+: Độ chính xác cao trong hệ sinh thái PaddlePaddle

PP-YOLOE+ là một detector không neo một giai đoạn được phát triển bởi Baidu. Được phát hành vào năm 2022, nó được xây dựng dựa trên mô hình PP-YOLOE, tập trung vào việc đạt được sự cân bằng vượt trội giữa độ chính xác và tốc độ, đặc biệt là trong PaddlePaddle framework deep learning.

Chi tiết kỹ thuật:

Kiến trúc và các tính năng chính

PP-YOLOE+ giới thiệu một số cải tiến kiến trúc để cải thiện hiệu suất:

  • Thiết kế không mỏ neo (Anchor-Free): Bằng cách loại bỏ các hộp mỏ neo được xác định trước, PP-YOLOE+ đơn giản hóa quy trình dò tìm và giảm số lượng siêu tham số cần điều chỉnh.
  • Backbone và Neck hiệu quả: Sử dụng backbone hiệu quả như CSPRepResNet và Mạng tổng hợp đường dẫn (Path Aggregation Network - PAN) để hợp nhất đặc trưng hiệu quả trên nhiều tỷ lệ.
  • Decoupled Head (Đầu tách lớp): Mô hình sử dụng một đầu tách lớp (ET-Head) để tách biệt các nhiệm vụ phân loại và hồi quy, điều này thường dẫn đến cải thiện độ chính xác.
  • Hàm mất mát nâng cao: Nó sử dụng Task Alignment Learning (TAL) và VariFocal Loss để liên kết tốt hơn điểm phân loại và độ chính xác định vị, dẫn đến phát hiện chính xác hơn. Bạn có thể khám phá các hàm mất mát khác trong tài liệu Ultralytics.

Điểm mạnh và Điểm yếu

  • Điểm mạnh:
    • Tiềm năng độ chính xác cao, thường vượt trội hơn các mô hình khác về mAP trên các bộ dữ liệu chuẩn.
    • Tốc độ suy luận hiệu quả, đặc biệt khi được tối ưu hóa với TensorRT trên GPU.
    • Phương pháp không neo có thể đơn giản hóa quy trình huấn luyện trong một số trường hợp nhất định.
  • Điểm yếu:
    • Khóa hệ sinh thái: Được thiết kế chủ yếu cho và tối ưu hóa trong framework PaddlePaddle, điều này có thể tạo ra một rào cản đáng kể cho các nhà phát triển đã quen với PyTorch hoặc các hệ sinh thái khác.
    • Cộng Đồng Nhỏ Hơn: Cộng đồng và các tài nguyên có sẵn ít mở rộng hơn so với hệ sinh thái rộng lớn xung quanh các mô hình Ultralytics YOLO.
    • Độ phức tạp: Việc tích hợp vào các quy trình làm việc không phải PaddlePaddle có thể phức tạp và tốn thời gian.

Các Trường hợp Sử dụng

PP-YOLOE+ là một lựa chọn mạnh mẽ cho các ứng dụng mà việc đạt được độ chính xác cao nhất có thể là ưu tiên hàng đầu, đặc biệt đối với các nhóm đã hoạt động trong hệ sinh thái PaddlePaddle.

  • Kiểm tra chất lượng công nghiệp: Độ chính xác cao của nó rất có lợi cho việc phát hiện các lỗi nhỏ trong sản xuất.
  • Bán lẻ thông minh: Có thể được sử dụng để quản lý hàng tồn kho chính xác và phân tích khách hàng.
  • Nghiên cứu: Một mô hình có giá trị cho các nhà nghiên cứu khám phá các kiến trúc không mỏ neo và các hàm mất mát nâng cao.

Tìm hiểu thêm về PP-YOLOE+

Ultralytics YOLOv5: Tiêu chuẩn công nghiệp đã được thiết lập

Ultralytics YOLOv5, được phát hành vào năm 2020 bởi Glenn Jocher, đã nhanh chóng trở thành chuẩn mực của ngành nhờ sự kết hợp đặc biệt giữa tốc độ, độ chính xác và sự thân thiện với nhà phát triển. Được xây dựng bằng PyTorch, nó nổi tiếng với quy trình đào tạo và triển khai đơn giản, giúp cả người mới bắt đầu và chuyên gia đều có thể tiếp cận được.

Chi tiết kỹ thuật:

Kiến trúc và các tính năng chính

Kiến trúc của YOLOv5 được tối ưu hóa cao cho hiệu quả và hiệu suất:

  • Backbone: Sử dụng backbone CSPDarknet53, cân bằng hiệu quả giữa tải tính toán và khả năng trích xuất đặc trưng.
  • Neck: Một bộ tổng hợp đặc trưng PANet tăng cường khả năng phát hiện vật thể ở nhiều tỷ lệ khác nhau của mô hình.
  • Head: Nó sử dụng một detection head dựa trên anchor, mạnh mẽ và đã được chứng minh là hiệu quả trên một loạt các tác vụ phát hiện đối tượng.
  • Khả năng mở rộng: YOLOv5 có nhiều kích thước khác nhau (n, s, m, l, x), cho phép các nhà phát triển lựa chọn sự cân bằng hoàn hảo giữa tốc độ và độ chính xác cho các nhu cầu cụ thể của họ, từ các thiết bị biên nhẹ đến các máy chủ đám mây mạnh mẽ.

Điểm mạnh và Điểm yếu

  • Điểm mạnh:
    • Dễ sử dụng: YOLOv5 nổi tiếng với trải nghiệm người dùng được tối ưu hóa, với Python API đơn giản, CLI dễ sử dụng và tài liệu phong phú.
    • Hệ sinh thái được duy trì tốt: Được hỗ trợ bởi hệ sinh thái Ultralytics toàn diện, bao gồm phát triển tích cực, một cộng đồng lớn và hữu ích, cập nhật thường xuyên và các công cụ như Ultralytics HUB để huấn luyện và triển khai không cần code.
    • Cân bằng hiệu suất: Nó cung cấp sự cân bằng vượt trội giữa tốc độ suy luận và độ chính xác, làm cho nó lý tưởng cho các ứng dụng thời gian thực.
    • Hiệu Quả Huấn Luyện: YOLOv5 có quy trình huấn luyện hiệu quả với các trọng số đã được huấn luyện trước có sẵn, cho phép hội tụ nhanh hơn và giảm thời gian phát triển.
    • Tính linh hoạt: Vượt xa khả năng phát hiện đối tượng, YOLOv5 còn hỗ trợ phân đoạn thể hiệnphân loại ảnh, cung cấp một giải pháp linh hoạt cho nhiều tác vụ thị giác.
  • Điểm yếu:
    • Mặc dù có độ chính xác cao, các mô hình PP-YOLOE+ lớn nhất có thể đạt được mAP cao hơn một chút trên một số điểm chuẩn nhất định.
    • Cách tiếp cận dựa trên anchor của nó có thể yêu cầu hiệu chỉnh đối với các tập dữ liệu có tỷ lệ khung hình đối tượng không thông thường.

Các Trường hợp Sử dụng

Tốc độ, hiệu quả và dễ triển khai của YOLOv5 làm cho nó trở thành lựa chọn hàng đầu cho vô số ứng dụng:

  • Phân tích video theo thời gian thực: Hoàn hảo cho hệ thống an ninh, giám sát giao thông và giám sát.
  • Triển khai biên: Các mô hình nhỏ hơn (YOLOv5n, YOLOv5s) được tối ưu hóa cao cho các thiết bị bị hạn chế về tài nguyên như Raspberry PiNVIDIA Jetson.
  • Tự động hóa công nghiệp: Được sử dụng rộng rãi để kiểm soát chất lượng, phát hiện lỗi và robot trong môi trường tự động.

Tìm hiểu thêm về YOLOv5

Phân tích hiệu năng: PP-YOLOE+ so với YOLOv5

Hiệu năng của PP-YOLOE+ và YOLOv5 làm nổi bật các triết lý thiết kế khác nhau của chúng. Các mô hình PP-YOLOE+ thường đạt được điểm mAP cao hơn, thể hiện sức mạnh của chúng về độ chính xác. Ví dụ: PP-YOLOE+l đạt 52.9 mAP, vượt qua 49.0 mAP của YOLOv5l. Tuy nhiên, độ chính xác này phải trả giá.

Mặt khác, YOLOv5 là một lựa chọn hàng đầu rõ ràng về tốc độ suy luận và hiệu quả. Các mô hình nhỏ hơn của nó đặc biệt nhanh, làm cho chúng lý tưởng cho các ứng dụng thời gian thực trên cả CPU và GPU. Bảng dưới đây cho thấy rằng trong khi PP-YOLOE+ rất nhanh trên GPU với TensorRT, YOLOv5 cung cấp một giải pháp dễ tiếp cận hơn và thường nhanh hơn, đặc biệt đối với các nhà phát triển cần triển khai trên nhiều loại phần cứng mà không cần tối ưu hóa nhiều.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Kết luận: Bạn nên chọn mô hình nào?

Việc lựa chọn giữa PP-YOLOE+ và YOLOv5 phụ thuộc nhiều vào các ưu tiên của dự án và hệ thống kỹ thuật hiện có.

  • PP-YOLOE+ là một lựa chọn tuyệt vời nếu mục tiêu chính của bạn là tối đa hóa độ chính xác phát hiện và bạn đã làm việc trong hoặc sẵn sàng áp dụng hệ sinh thái Baidu PaddlePaddle. Thiết kế không neo hiện đại và các hàm mất mát nâng cao của nó đẩy lùi ranh giới của hiệu suất.

  • Ultralytics YOLOv5 là lựa chọn được khuyến nghị cho phần lớn các nhà phát triển và ứng dụng. Sự dễ sử dụng vô song, sự cân bằng hiệu suất vượt trội và tính linh hoạt trong triển khai đáng kinh ngạc của nó làm cho nó trở thành một giải pháp thiết thực và hiệu quả hơn. Hệ sinh thái Ultralytics mạnh mẽ và được duy trì tốt cung cấp sự hỗ trợ vô song, từ huấn luyện đến sản xuất, đảm bảo chu kỳ phát triển suôn sẻ và nhanh hơn. Đối với các dự án đòi hỏi tốc độ thời gian thực, triển khai đơn giản và sự hỗ trợ mạnh mẽ từ cộng đồng, YOLOv5 vẫn là lựa chọn vượt trội.

Khám phá các Mô hình Khác

Trong khi YOLOv5 là một mô hình mạnh mẽ và hoàn thiện, Ultralytics vẫn tiếp tục đổi mới. Đối với những ai đang tìm kiếm những tiến bộ mới nhất, hãy cân nhắc khám phá các mô hình mới hơn như YOLOv8, YOLOv10YOLO11 hiện đại nhất. Các mô hình này xây dựng dựa trên thế mạnh của YOLOv5, mang lại hiệu suất tốt hơn và nhiều tính năng hơn. Để có phân tích chi tiết hơn, hãy truy cập trang so sánh mô hình của Ultralytics.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận