PP-YOLOE+ so với YOLOv8 Khám phá chuyên sâu về các kiến trúc phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng đối với các nhà phát triển và nhà nghiên cứu, thường phải cân bằng giữa tốc độ, độ chính xác và tính dễ triển khai. Bài so sánh này khám phá hai kiến trúc nổi bật: PP-YOLOE+ , một sự phát triển của... PaddlePaddle hệ sinh thái YOLO loạt, và YOLOv8 , tiêu chuẩn được áp dụng rộng rãi từ Ultralytics Chúng tôi sẽ phân tích những cải tiến về kiến trúc, các chỉ số hiệu suất và tính phù hợp của chúng đối với nhiều ứng dụng thực tế khác nhau.

PP-YOLOE+: Được tinh chỉnh cho hệ sinh thái mái chèo

PP-YOLOE+ là một bản cập nhật quan trọng cho PP- YOLO Bộ thuật toán này được phát triển bởi các nhà nghiên cứu tại Baidu. Nó dựa trên mô hình không sử dụng anchor text, nhằm mục đích tối ưu hóa sự hội tụ của quá trình huấn luyện và tốc độ suy luận trên các phần cứng chuyên dụng.

Thông tin chi tiết về PP-YOLOE+:
PaddlePaddle Tác giả
Baidu
02/04/2022
Arxiv
GitHub
Bác sĩ

Kiến trúc và các cải tiến

PP-YOLOE+ giới thiệu một số thay đổi kiến trúc quan trọng được thiết kế để cải tiến so với các phiên bản trước:

Thiết kế không cần hộp neo: Bằng cách loại bỏ các hộp neo, mô hình giảm số lượng siêu tham số và đơn giản hóa quy trình gán giá trị thực bằng cách sử dụng chiến lược TAL (Học tập căn chỉnh nhiệm vụ).
RepResBlock: Kiến trúc xương sống sử dụng các khối dư có thể tái tham số hóa, cho phép mô hình có cấu trúc phức tạp trong quá trình huấn luyện đồng thời thu gọn thành các lớp đơn giản hơn, nhanh hơn trong quá trình suy luận.
ET-Head: Một đầu dò hiệu quả được thiết kế phù hợp với nhiệm vụ được sử dụng để tách biệt hiệu quả các nhiệm vụ phân loại và định vị, cải thiện tốc độ hội tụ.

Mặc dù những cải tiến này mang lại hiệu năng mạnh mẽ, nhưng chúng lại gắn liền chặt chẽ với... PaddlePaddle khung. Tính đặc thù của hệ sinh thái này có thể gây ra thách thức cho các nhóm có cơ sở hạ tầng hiện có dựa trên... PyTorch , TensorFlow , hoặc ONNX quy trình làm việc dựa trên.

Tìm hiểu thêm về PP-YOLOE+

Ultralytics YOLOv8: Tiêu chuẩn hiện đại

Ra mắt vào đầu năm 2023, YOLOv8 đã định nghĩa lại lĩnh vực thị giác máy tính thời gian thực. Nó không chỉ là một mô hình phát hiện mà còn là một khung thống nhất hỗ trợ phân loại hình ảnh , phân đoạn đối tượng , ước lượng tư thế và phát hiện hộp giới hạn định hướng (OBB) .

Thông tin chi tiết về YOLOv8 :
Glenn Jocher, Ayush Chaurasia và Jing Qiu
Ultralytics
10/01/2023
GitHub
Bác sĩ

Những ưu điểm chính của YOLOv8

YOLOv8 Tập trung vào khả năng sử dụng và hiệu năng tổng quát trên nhiều loại phần cứng khác nhau:

Độ chính xác tiên tiến nhất: Sử dụng mô-đun C2f (Cross-Stage Partial bottleneck với hai phép tích chập), YOLOv8 Tăng cường luồng gradient và trích xuất đặc điểm, dẫn đến độ chính xác phát hiện vượt trội đối với các đối tượng khó nhận diện.
Đa phương thức bẩm sinh: Không giống như PP-YOLOE+, chủ yếu tập trung vào phát hiện, YOLOv8 Cho phép người dùng chuyển đổi giữa các tác vụ như phân đoạn và ước lượng tư thế chỉ bằng một dòng mã.
Đầu gắn cố định linh hoạt: Tương tự như PP-YOLOE+, YOLOv8 Sử dụng phương pháp không cần neo nhưng kết hợp với chiến lược tăng cường Mosaic mạnh mẽ giúp nâng cao khả năng chống chịu trước các biến đổi về quy mô.

Tích hợp hệ sinh thái

Sức mạnh thực sự của YOLOv8 Nằm trong hệ sinh thái Ultralytics . Người dùng có quyền truy cập vào các tích hợp liền mạch với các công cụ như Weights & Biases để theo dõi thử nghiệm và Nền tảng Ultralytics để quản lý tập dữ liệu và đào tạo trên đám mây một cách dễ dàng.

Tìm hiểu thêm về YOLOv8

So sánh hiệu suất

Khi so sánh các kiến trúc này, điều cần thiết là phải xem xét cả độ chính xác thô ( mAP ) và hiệu quả (tốc độ/FLOPs). Bảng dưới đây cho thấy rằng mặc dù PP-YOLOE+ có tính cạnh tranh, YOLOv8 Nhìn chung, phương pháp này mang lại sự cân bằng tốt hơn giữa hiệu quả tham số và tốc độ suy luận, đặc biệt là trên phần cứng tiêu chuẩn.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

Hiệu quả huấn luyện và Mức sử dụng bộ nhớ

Một khía cạnh thường bị bỏ qua là yêu cầu về bộ nhớ trong quá trình huấn luyện. Các mô hình dựa trên Transformer hoặc các kiến trúc cũ hơn có thể tiêu tốn rất nhiều VRAM. Ultralytics Các mô hình được tối ưu hóa để chạy hiệu quả trên phần cứng cấp người tiêu dùng. Ví dụ, bạn có thể huấn luyện mô hình YOLOv8 Nano trên một máy tính xách tay tiêu chuẩn. CPU hoặc một cách khiêm tốn GPU Trong khi đó, các quy trình PP-YOLOE+ thường giả định có quyền truy cập vào hiệu năng cao. GPU Các cụm điển hình của phòng thí nghiệm công nghiệp.

Hơn nữa, YOLOv8 Việc tích hợp với Nền tảng Ultralytics giúp đơn giản hóa quá trình huấn luyện. Người dùng có thể trực quan hóa kết quả, quản lý tập dữ liệu và triển khai mô hình mà không cần quản lý các chuỗi phụ thuộc phức tạp thường gặp phải với các hệ thống khác. PaddlePaddle .

Các trường hợp sử dụng và Khuyến nghị

Khi nào nên chọn PP-YOLOE+

PP-YOLOE+ là một lựa chọn tuyệt vời nếu tổ chức của bạn đã đầu tư sâu vào hệ sinh thái Baidu/ PaddlePaddle . Hiệu năng của nó trên phần cứng dành riêng cho thị trường châu Á (như các chip biên chuyên dụng hỗ trợ Paddle Lite) có thể được tối ưu hóa ở mức độ cao. Nếu bạn yêu cầu một bộ dò tìm hoàn toàn không có neo và có nguồn lực kỹ thuật để duy trì môi trường Paddle, thì đây vẫn là một lựa chọn mạnh mẽ.

Khi nào nên chọn Ultralytics YOLOv8

Đối với phần lớn các nhà phát triển, nhà nghiên cứu và đội ngũ doanh nghiệp, YOLOv8 là giải pháp được khuyến nghị nhờ tính linh hoạt và dễ sử dụng của nó.

Triển khai đa nền tảng: YOLOv8 Xuất dữ liệu liền mạch sang ONNX , TensorRT , CoreML , Và TFLite Điều này khiến nó trở nên lý tưởng cho các ứng dụng di động, các thiết bị biên như Raspberry Pi và máy chủ đám mây.
Nhiệm vụ đa dạng: Nếu dự án của bạn có thể mở rộng từ việc phát hiện đơn giản sang phân đoạn (ví dụ: hình ảnh y tế) hoặc ước tính tư thế (ví dụ: phân tích thể thao), YOLOv8 API thống nhất của nó giúp tiết kiệm đáng kể thời gian phát triển.
Hỗ trợ cộng đồng: Cộng đồng năng động xung quanh Ultralytics Đảm bảo các vấn đề được giải quyết nhanh chóng và các tính năng mới như Explorer để phân tích tập dữ liệu được bổ sung thường xuyên.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
model.export(format="onnx")

Nhìn về phía trước: Sức mạnh của YOLO26

Trong khi YOLOv8 Mặc dù vẫn là tiêu chuẩn ngành, công nghệ đang phát triển nhanh chóng. Vào tháng 1 năm 2026, Ultralytics Hãng đã cho ra mắt YOLO26 , một mẫu máy đẩy giới hạn về hiệu quả lên một tầm cao mới.

YOLO26 sở hữu thiết kế không cần NMS (Non-Maximum Suppression) từ đầu đến cuối , loại bỏ nhu cầu xử lý hậu kỳ bằng NMS. Điều này cho phép suy luận nhanh hơn đáng kể, đặc biệt là trên các thiết bị biên nơi logic xử lý hậu kỳ có thể là điểm nghẽn. Với bộ tối ưu hóa MuSGD và việc loại bỏ Distribution Focal Loss (DFL), YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước.

Đối với các dự án mới yêu cầu tốc độ và độ chính xác tuyệt đối, chúng tôi đặc biệt khuyên bạn nên tìm hiểu YOLO26 . Nó vẫn giữ được sự dễ sử dụng huyền thoại của... Ultralytics xây dựng hệ sinh thái đồng thời tích hợp các nghiên cứu tiên tiến nhất để đạt được hiệu năng thế hệ tiếp theo.

Tìm hiểu thêm về YOLO26

Kết luận

Cả PP-YOLOE+ và YOLOv8 là những kiến trúc mạnh mẽ đã thúc đẩy lĩnh vực phát hiện đối tượng. PP-YOLOE+ cung cấp hiệu năng mạnh mẽ trong phạm vi... PaddlePaddle Tuy nhiên, YOLOv8 nổi bật nhờ tính dễ sử dụng, bộ tính năng phong phú và sự hỗ trợ rộng rãi từ nhiều nguồn khác nhau. Ultralytics Hệ sinh thái. Cho dù bạn đang xây dựng sản phẩm tối thiểu khả thi (MVP) cho công ty khởi nghiệp hay mở rộng quy mô giải pháp doanh nghiệp toàn cầu, tính linh hoạt trong việc triển khai ở bất cứ đâu—từ GPU đám mây đến điện thoại di động—đều mang lại nhiều lợi ích. Ultralytics Mô hình này là sự lựa chọn thực tế cho thị giác máy tính hiện đại.

Đối với những ai quan tâm đến các mẫu máy hiệu suất cao khác, hãy xem YOLO11 để phát hiện đa năng hoặc RT-DETR để phát hiện thời gian thực dựa trên máy biến áp.

PP-YOLOE+ so với YOLOv8 Khám phá chuyên sâu về các kiến ​​trúc phát hiện đối tượng