PP-YOLOE+ so với... YOLOv10 So sánh các thiết bị dò vật thể hiện đại

Lĩnh vực phát hiện đối tượng thời gian thực đã phát triển nhanh chóng, được thúc đẩy bởi nhu cầu về các mô hình cân bằng giữa độ chính xác cao và độ trễ thấp. Hai đóng góp quan trọng cho lĩnh vực này là PP-YOLOE+ , được Baidu phát triển như một phần của bộ phần mềm PaddleDetection, và YOLOv10 , một phiên bản học thuật từ Đại học Thanh Hoa, đã giới thiệu... NMS - Đào tạo miễn phí.

Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết về các kiến trúc này, xem xét các chỉ số hiệu năng, phương pháp huấn luyện và tính phù hợp của chúng đối với các ứng dụng thị giác máy tính khác nhau. Mặc dù cả hai mô hình đều cung cấp những khả năng ấn tượng, chúng tôi cũng nhấn mạnh cách hệ sinh thái Ultralytics và các mô hình mới hơn như YOLO26 cung cấp một lộ trình triển khai thống nhất và hiệu quả hơn.

Tổng quan về mẫu sản phẩm và thông số kỹ thuật

Hiểu rõ nguồn gốc và triết lý thiết kế của từng mẫu sản phẩm sẽ giúp bạn lựa chọn công cụ phù hợp với những yêu cầu kỹ thuật cụ thể của mình.

PP-YOLOE+

PP-YOLOE+ là phiên bản nâng cấp của PP-YOLOE, tập trung vào việc hoàn thiện cơ chế không cần neo và nâng cao hiệu quả huấn luyện. Nó được tích hợp sâu vào... PaddlePaddle khung.

Tác giả: PaddlePaddle Authors
Tổ chức:Baidu
Ngày: Tháng 4 năm 2022
Tham khảo: arXiv:2203.16250
Kiến trúc chính: Sử dụng mạng xương sống CSPRepResNet với chiến lược gán nhãn Học căn chỉnh nhiệm vụ (TAL). Nó dựa trên thiết kế đầu không có anchor tiêu chuẩn.

Tìm hiểu thêm về PP-YOLOE+

YOLOv10

YOLOv10 đánh dấu một sự thay đổi đáng kể trong... YOLO dòng dõi bằng cách giới thiệu thiết kế từ đầu đến cuối, loại bỏ nhu cầu sử dụng phương pháp loại bỏ tối đa không cần thiết ( NMS ) trong quá trình suy luận.

Tác giả: Ao Wang, Hui Chen, et al.
Tổ chức:Đại học Thanh Hoa
Ngày: Tháng 5 năm 2024
Tham khảo: arXiv:2405.14458
Kiến trúc chính: Có các tính năng phân công kép nhất quán cho NMS - Đào tạo miễn phí và thiết kế mô hình toàn diện hướng đến hiệu quả và độ chính xác.

Tìm hiểu thêm về YOLOv10

Điểm chuẩn hiệu suất

Bảng sau đây so sánh các mô hình trên tập dữ liệu COCO . Các chỉ số chính bao gồm Độ chính xác trung bình (Mean Average Precision) mAP ) và tốc độ suy luận trên các cấu hình phần cứng khác nhau. Lưu ý những cải thiện đáng kể về hiệu quả trong YOLOv10 kiến trúc, đặc biệt là về số lượng tham số.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

Phân tích hiệu suất

YOLOv10 Thể hiện hiệu quả vượt trội, thường đạt được độ chính xác tương tự hoặc tốt hơn với số lượng tham số ít hơn đáng kể. Ví dụ, YOLOv10x đạt được kết quả gần như tương tự. mAP Tương tự như PP-YOLOE+x nhưng với số lượng tham số ít hơn khoảng 42% , do đó phù hợp hơn nhiều cho việc triển khai ở biên mạng có bộ nhớ hạn chế.

Phân tích chuyên sâu kiến trúc

Thiết kế PP-YOLOE+

PP-YOLOE+ được xây dựng trên nền tảng vững chắc của PP-YOLOv2 . Nó sử dụng một kiến trúc mạng lưới có khả năng mở rộng gọi là CSPRepResNet, kết hợp các kết nối dư với các mạng lưới một phần xuyên giai đoạn để cải thiện luồng gradient. Phần đầu không sử dụng anchor, giúp đơn giản hóa không gian tìm kiếm siêu tham số so với các phiên bản tiền nhiệm dựa trên anchor như YOLOv4 .

Tuy nhiên, PP-YOLOE+ dựa vào các bước xử lý hậu kỳ phức tạp. Mặc dù chính xác, nhưng sự phụ thuộc vào... NMS có thể gây ra tắc nghẽn độ trễ trong các cảnh đông đúc, nơi nhiều khung bao chồng chéo lên nhau.

YOLOv10 Đổi mới: Quy trình xử lý toàn diện từ đầu đến cuối

YOLOv10 giới thiệu một sự thay đổi mô hình bằng cách loại bỏ NMS hoàn toàn. Nó đạt được điều này thông qua việc thực hiện đồng thời hai nhiệm vụ :

Phân công một-nhiều: Được sử dụng trong quá trình đào tạo để cung cấp các tín hiệu giám sát chi tiết.
Gán một-đối-một: Được sử dụng để suy luận nhằm đảm bảo dự đoán duy nhất cho mỗi đối tượng.

Sự sắp xếp này cho phép mô hình được triển khai mà không cần tốn thêm chi phí tính toán cho việc sắp xếp và lọc các hộp, một lợi thế lớn cho các ứng dụng thời gian thực .

Hệ sinh thái và Dễ sử dụng

Hệ sinh thái xung quanh một mô hình thường quan trọng không kém gì chính kiến trúc của nó. Đây chính là điểm khác biệt giữa... PaddlePaddle các mô hình dựa trên và Ultralytics Các mô hình được hỗ trợ trở nên rõ ràng nhất.

Lợi thế của Ultralytics

Cả hai YOLOv10 và YOLO26 phiên bản mới hơn được hỗ trợ trong phạm vi này. Ultralytics Python gói phần mềm này mang đến trải nghiệm liền mạch cho các nhà phát triển.

API thống nhất: Chuyển đổi giữa các mô hình (ví dụ: từ) YOLOv8 ĐẾN YOLOv10 hoặc YOLO26) bằng cách thay đổi một đối số chuỗi duy nhất.
Tích hợp nền tảng: Người dùng có thể tận dụng Nền tảng Ultralytics để quản lý tập dữ liệu, trực quan hóa các lần chạy huấn luyện và triển khai mô hình đến các điểm cuối web và biên chỉ với vài cú nhấp chuột.
Hỗ trợ xuất khẩu rộng rãi: Mặc dù PP-YOLOE+ được tối ưu hóa cho suy luận Paddle, Ultralytics Các mô hình được xuất trực tiếp sang ONNX , TensorRT , CoreML và OpenVINO , bao phủ phạm vi phần cứng triển khai rộng hơn.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
path = model.export(format="onnx")

Quy trình làm việc của PP-YOLOE+

PP-YOLOE+ thường yêu cầu cài đặt PaddlePaddle và việc sao chép kho lưu trữ PaddleDetection. Hệ sinh thái này mạnh mẽ nhưng có thể khó tiếp cận hơn đối với người dùng quen thuộc với các tiêu chuẩn thông thường. PyTorch quy trình làm việc. Quá trình xuất thường ưu tiên công cụ Paddle Inference, điều này có thể yêu cầu các bước chuyển đổi bổ sung để triển khai chung.

Tương lai: YOLO26

Trong khi YOLOv10 giới thiệu NMS Dựa trên ý tưởng -free, mẫu YOLO26 vừa được ra mắt đã tinh chỉnh và mở rộng những cải tiến này.

YOLO26 hoàn toàn không cần NMS từ đầu đến cuối , đảm bảo tốc độ suy luận nhanh nhất có thể mà không có độ trễ xử lý hậu kỳ. Nó tích hợp trình tối ưu hóa MuSGD , một sự kết hợp giữa... SGD và Muon (lấy cảm hứng từ quá trình huấn luyện LLM), đảm bảo sự hội tụ ổn định. Hơn nữa, với việc loại bỏ Distribution Focal Loss (DFL), YOLO26 dễ dàng xuất và chạy hơn đáng kể trên các thiết bị biên công suất thấp.

Đối với các nhà phát triển đang tìm kiếm tốc độ và độ chính xác tốt nhất tuyệt đối — đặc biệt là trong việc phát hiện các vật thể nhỏ thông qua ProgLoss và STAL — YOLO26 là lựa chọn nâng cấp được khuyến nghị.

Tìm hiểu thêm về YOLO26

Các trường hợp sử dụng thực tế

Khi nào nên chọn PP-YOLOE+

Triển khai trên Baidu Cloud: Nếu cơ sở hạ tầng của bạn đã được xây dựng trên Baidu Cloud hoặc sử dụng Paddle serving, PP-YOLOE+ cung cấp khả năng tối ưu hóa gốc.
Phần cứng chuyên dụng: Một số chip AI dành cho thị trường châu Á có hỗ trợ chuyên biệt cho... PaddlePaddle các mô hình được định dạng.

Khi nào nên lựa chọn Ultralytics ( YOLOv10 / YOLO26)

Điện toán biên: Với khả năng suy luận CPU nhanh hơn tới 43% trong YOLO26, các mô hình này lý tưởng cho Raspberry Pi, Jetson Nano hoặc các triển khai trên thiết bị di động.
Nhiệm vụ phức tạp: Vượt ra ngoài khả năng phát hiện, Ultralytics Thư viện này hỗ trợ ước lượng tư thế , phân đoạn đối tượng và phát hiện đối tượng định hướng (OBB) , cho phép bạn giải quyết nhiều vấn đề khác nhau chỉ với một công cụ duy nhất.
Tạo mẫu nhanh: Sự dễ dàng trong đào tạo và kiểm định cho phép các nhóm nhanh chóng lặp lại quy trình, một yếu tố quan trọng trong môi trường phát triển linh hoạt.

Hiệu quả bộ nhớ

Ultralytics YOLO Các mô hình này nổi tiếng với mức tiêu thụ bộ nhớ thấp. Không giống như các kiến trúc nặng về bộ xử lý (transformer) tiêu tốn một lượng lớn bộ nhớ... CUDA bộ nhớ, hiệu quả YOLO Các mô hình như YOLO26 cho phép xử lý theo lô lớn hơn trên GPU dành cho người tiêu dùng, giúp dân chủ hóa việc tiếp cận đào tạo AI cao cấp.

Kết luận

Cả PP-YOLOE+ và YOLOv10 là những mẫu máy có khả năng. PP-YOLOE+ là một lựa chọn mạnh mẽ dành cho... PaddlePaddle hệ sinh thái, trong khi YOLOv10 vượt qua giới hạn về hiệu quả với NMS - Thiết kế miễn phí. Tuy nhiên, để có trải nghiệm phát triển tối ưu nhất, hỗ trợ phần cứng rộng nhất và các tính năng tiên tiến như trình tối ưu hóa MuSGD và ProgLoss, Ultralytics YOLO26 nổi bật như một lựa chọn vượt trội dành cho các kỹ sư thị giác máy tính hiện đại.

Để tìm hiểu thêm các lựa chọn khác, hãy xem xét YOLOv8 hoặc RT-DETR dựa trên bộ biến đổi cho các kịch bản yêu cầu độ chính xác cao.