Chuyển đến nội dung

YOLOv5 So sánh kỹ thuật giữa PP-YOLOE+ và các thiết bị phát hiện vật thể thời gian thực.

Việc lựa chọn kiến ​​trúc tối ưu cho phát hiện đối tượng là một quyết định quan trọng, ảnh hưởng đến hiệu quả, độ chính xác và khả năng mở rộng của các ứng dụng thị giác máy tính. Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết giữa YOLOv5 , tiêu chuẩn được áp dụng toàn cầu cho trí tuệ nhân tạo dễ tiếp cận, và PP-YOLOE+ , một kiến ​​trúc đang phát triển từ... PaddlePaddle hệ sinh thái.

Mặc dù PP-YOLOE+ giới thiệu những khái niệm thú vị về lập trình không cần neo, YOLOv5 vẫn giữ vững vị thế thống trị nhờ hệ sinh thái vượt trội, độ ổn định và sự cân bằng giữa tốc độ và độ chính xác. Đối với các nhà phát triển hướng đến tương lai, chúng tôi cũng đề cập đến YOLO26 , phiên bản định nghĩa lại hiệu năng tiên tiến nhất. NMS - suy luận tự do.

Các chỉ số hiệu suất và điểm chuẩn

Sự đánh đổi giữa độ chính xác trung bình ( mAP )độ trễ suy luận quyết định tính hữu ích của một mô hình. Bảng dưới đây so sánh hiệu suất của YOLOv5 chống lại PP-YOLOE+ trên COCO tập dữ liệu.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Ultralytics YOLOv5 Tổng quan

Được Glenn Jocher và Ultralytics phát hành vào năm 2020, YOLOv5 đã cách mạng hóa lĩnh vực này bằng cách giúp mọi người dễ dàng tiếp cận với việc phát hiện đối tượng hiệu năng cao. Được xây dựng hoàn toàn bằng PyTorch , nó ưu tiên tính khả dụng "từ đầu đến cuối", cho phép các nhà phát triển chuyển từ tập dữ liệu đến triển khai trong thời gian kỷ lục.

Kiến trúc và Thiết kế

YOLOv5 Nó sử dụng kiến ​​trúc xương sống CSPDarknet (Cross Stage Partial Network) để tối đa hóa luồng gradient đồng thời giảm thiểu chi phí tính toán. Nó sử dụng đầu phát hiện dựa trên neo , sử dụng các hộp neo được xác định trước để dự đoán vị trí đối tượng. Phương pháp này đã được kiểm chứng và cung cấp sự hội tụ ổn định trên nhiều tập dữ liệu khác nhau, từ ảnh chụp từ trên không đến ảnh quét y tế.

Ưu điểm chính

  • Sẵn sàng sản xuất: YOLOv5 được triển khai trong hàng triệu ứng dụng trên toàn thế giới, đảm bảo tính ổn định cực cao.
  • Tính linh hoạt: Ngoài detect, nó còn hỗ trợ nguyên bản phân đoạn đối tượng (instance segmentation)phân loại hình ảnh.
  • Khả năng xuất khẩu: Mô hình này cho phép xuất khẩu liền mạch sang... ONNX , TensorRT , CoreML , Và TFLite Dành cho nhiều mục tiêu phần cứng khác nhau.

Tìm hiểu thêm về YOLOv5

Tổng quan về PP-YOLOE+

PP-YOLOE+ là phiên bản nâng cấp của PP-YOLOE, được phát triển bởi... PaddlePaddle Các tác giả tại Baidu. Được phát hành vào tháng 4 năm 2022, phần mềm này tập trung vào việc cải thiện cơ chế không cần neo và tinh chỉnh kiến ​​trúc xương sống cho môi trường điện toán hiệu năng cao.

Kiến trúc và Thiết kế

PP-YOLOE+ áp dụng mô hình không cần anchor , loại bỏ nhu cầu điều chỉnh siêu tham số anchor box. Nó sử dụng kiến ​​trúc xương sống CSPRepResStage , kết hợp các kết nối dư với các kỹ thuật tái tham số hóa (kiểu RepVGG) để tăng tốc độ suy luận trong khi vẫn duy trì khả năng trích xuất đặc trưng. Nó cũng sử dụng Học căn chỉnh nhiệm vụ (TAL) để căn chỉnh tốt hơn các nhiệm vụ phân loại và định vị trong quá trình huấn luyện.

Các yếu tố cần xem xét khi sử dụng

Trong khi PP-YOLOE+ đạt được mức cao mAP trên COCO tiêu chuẩn này có mối liên hệ chặt chẽ với... PaddlePaddle khung. Điều này có thể gây ra thách thức cho các nhóm có cơ sở hạ tầng dựa trên tiêu chuẩn. PyTorch hoặc TensorFlow quy trình làm việc. Ưu điểm chính của nó nằm ở những trường hợp ưu tiên độ chính xác tối đa hơn là tính linh hoạt trong triển khai hoặc sự dễ dàng trong đào tạo.

Tìm hiểu thêm về PP-YOLOE+

So sánh kỹ thuật chi tiết

1. Phương pháp đào tạo và tính dễ sử dụng

Một trong những điểm khác biệt quan trọng nằm ở trải nghiệm người dùng. YOLOv5 nổi tiếng với quy trình làm việc "Từ con số 0 đến người hùng". Hệ sinh thái Ultralytics tự động hóa các tác vụ phức tạp như tăng cường dữ liệu (Mosaic, MixUp ) và sự tiến hóa siêu tham số.

  • YOLOv5 : Sử dụng giao diện dòng lệnh trực quan ( CLI ) hoặc Python API này tự động xử lý các phép tính hộp neo bằng AutoAnchor, đảm bảo mô hình thích ứng với các tập dữ liệu tùy chỉnh mà không cần can thiệp thủ công.
  • PP-YOLOE+: Dựa trên hệ thống cấu hình PaddleDetection. Mặc dù mạnh mẽ, nó thường đòi hỏi sự hiểu biết sâu sắc hơn về các tệp cấu hình cụ thể và... PaddlePaddle một hệ sinh thái có đường cong học tập dốc hơn đối với nhiều nhà phát triển.

2. Tốc độ suy luận và triển khai

YOLOv5 Nó vượt trội về tốc độ suy luận CPU , khiến nó trở thành lựa chọn ưu việt cho các ứng dụng AI biên trên các thiết bị như Raspberry Pi hoặc điện thoại di động. Như bảng hiển thị, mô hình YOLOv5n (Nano) đạt được tốc độ đáng kinh ngạc, rất quan trọng cho việc theo dõi thời gian thực.

PP-YOLOE+ tập trung mạnh vào... GPU thông lượng sử dụng TensorRT Mặc dù nó hoạt động tốt trên phần cứng cấp máy chủ (như T4). GPU ), nó thường thiếu sự tối ưu hóa nhẹ cần thiết cho các ứng dụng không phải là ứng dụng chuyên dụng. GPU so sánh với môi trường được tối ưu hóa cao Ultralytics đội hình.

3. Hiệu quả bộ nhớ

Ultralytics Các mẫu được thiết kế để tiết kiệm bộ nhớ. YOLOv5 Quá trình huấn luyện của được tối ưu hóa để chạy trên GPU dành cho người tiêu dùng, giúp dân chủ hóa việc tiếp cận AI. Ngược lại, các thiết kế kiến ​​trúc phức tạp hoặc dựa trên Transformer mới hơn thường yêu cầu cấu hình mạnh hơn. CUDA bộ nhớ, nâng cao rào cản gia nhập. YOLOv5 Kiến trúc cân bằng của nó đảm bảo quá trình trích xuất đặc trưng vẫn mạnh mẽ mà không làm tăng số lượng tham số không cần thiết.

Các ứng dụng thực tế

  • YOLOv5 là lựa chọn hàng đầu cho công nghệ nông nghiệp (ví dụ: phát hiện bệnh cây trồng ) và phân tích bán lẻ nhờ khả năng hoạt động trên các thiết bị biên ở các địa điểm hoặc cửa hàng từ xa mà không cần máy chủ chuyên dụng.
  • PP-YOLOE+ thường phù hợp cho việc kiểm tra công nghiệp trong môi trường được kiểm soát, nơi có công suất mạnh. GPU Các máy chủ có sẵn để xử lý các phép tính phức tạp hơn một chút nhằm đạt được độ chính xác cao hơn một chút.

Mẹo về quy trình làm việc: The Ultralytics Lợi thế

Khi sử dụng Ultralytics Với các mô hình này, bạn có quyền truy cập vào Nền tảng Ultralytics . Giao diện thống nhất này cho phép bạn quản lý tập dữ liệu, huấn luyện trên đám mây và triển khai ở bất kỳ định dạng nào ( ONNX , TFLite (v.v.) chỉ với một cú nhấp chuột, giúp giảm đáng kể gánh nặng cho MLOps so với việc quản lý các tập lệnh khung thô.

Tương lai: Nâng cấp lên YOLO26

Trong khi YOLOv5 YOLO26 là một mô hình huyền thoại, và lĩnh vực này đã tiến bộ rất nhiều. Đối với các nhà phát triển đang tìm kiếm hiệu năng tốt nhất tuyệt đối, chúng tôi khuyên dùng YOLO26 .

YOLO26 đại diện cho một sự thay đổi mang tính đột phá với thiết kế không sử dụng NMS từ đầu đến cuối . Bằng cách loại bỏ cơ chế loại bỏ cực đại không tương thích ( NMS ) , YOLO26 giảm độ trễ suy luận và độ phức tạp khi triển khai. Nó cũng có các tính năng sau:

  • MuSGD Optimizer: Một sự kết hợp của... SGD và Muon để đảm bảo độ ổn định trong quá trình huấn luyện ở cấp độ LLM.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa đặc biệt cho điện toán biên.
  • ProgLoss + STAL: Các hàm mất mát nâng cao giúp cải thiện khả năng phát hiện vật thể nhỏ , một lĩnh vực quan trọng đối với các ứng dụng máy bay không người lái và IoT.

Tìm hiểu thêm về YOLO26

Dễ dàng nâng cấp

Di cư từ YOLOv5 đến những người mới hơn Ultralytics Việc tạo mô hình trở nên dễ dàng nhờ vào sự thống nhất. Python API.

from ultralytics import YOLO

# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")

# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Kết luận

Cả hai kiến ​​trúc đều có ưu điểm riêng. PP-YOLOE+ mang lại hiệu năng lý thuyết mạnh mẽ trên... COCO tiêu chuẩn cho GPU các khối lượng công việc tập trung. Tuy nhiên, YOLOv5 vẫn là nhà vô địch về khả năng sử dụng, tính linh hoạt triển khai và hiệu năng tại biên.

Đối với hầu hết các nhà phát triển và nhà nghiên cứu, việc gắn bó với hệ sinh thái Ultralytics đảm bảo khả năng bảo trì lâu dài và tiếp cận những đột phá mới nhất. Cho dù bạn tiếp tục sử dụng hệ sinh thái đáng tin cậy này hay không. YOLOv5 Hoặc nâng cấp lên YOLO26 tiên tiến, bạn sẽ được hưởng lợi từ một nền tảng được cộng đồng hỗ trợ, tối ưu hóa cao, được thiết kế để mang lại thành công trong thế giới thực.

Để tìm hiểu các lựa chọn khác, hãy xem xét YOLO11 hoặc các mô hình chuyên dụng như RT-DETR để có độ chính xác dựa trên biến áp.


Bình luận