YOLOv8 So sánh với PP-YOLOE+: Đánh giá các kiến trúc phát hiện đối tượng thời gian thực hiện đại
Trong lĩnh vực thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn mô hình phù hợp cho việc phát hiện đối tượng là rất quan trọng để đạt được sự cân bằng giữa tốc độ suy luận và độ chính xác. Hai mô hình nổi bật đã tạo ra tác động đáng kể đến ngành công nghiệp này là Ultralytics YOLOv8 và PP-YOLOE+ . Hướng dẫn này cung cấp một so sánh kỹ thuật toàn diện để giúp các nhà phát triển và kỹ sư máy học hiểu rõ hơn về các sắc thái kiến trúc, số liệu hiệu suất và các kịch bản triển khai lý tưởng của chúng.
Ultralytics YOLOv8 Tiêu chuẩn hệ sinh thái đa năng
Được giới thiệu bởi Ultralytics , YOLOv8 Nó nhanh chóng khẳng định vị thế là nền tảng cho các ứng dụng xử lý hình ảnh chuyên nghiệp. Nền tảng này được xây dựng dựa trên nhiều năm nghiên cứu cơ bản để mang lại hiệu suất vượt trội trong nhiều tác vụ khác nhau.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2023-01-10
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu YOLOv8
Đổi mới kiến trúc và tính linh hoạt
YOLOv8 Sản phẩm này có thiết kế không cần neo được tối ưu hóa cao và tích hợp đầu đọc/ghi tách rời để xử lý độc lập các tác vụ nhận dạng đối tượng, phân loại và hồi quy. Sự tinh chỉnh cấu trúc này dẫn đến khả năng biểu diễn đặc trưng tốt hơn và tốc độ hội tụ nhanh hơn trong quá trình huấn luyện.
Không giống như nhiều mô hình chuyên dụng, YOLOv8 Cung cấp tính linh hoạt vượt trội. Ngoài việc phát hiện hộp giới hạn, cùng một kiến trúc và API thống nhất còn hỗ trợ phân đoạn đối tượng , phân loại hình ảnh , ước tính tư thế và hộp giới hạn định hướng (OBB) .
Phát triển tinh gọn
Sự thống nhất Ultralytics Hệ sinh thái này cho phép các nhà phát triển chuyển đổi liền mạch giữa các tác vụ phát hiện, phân đoạn và theo dõi chỉ bằng cách thay đổi trọng số của mô hình, giúp giảm đáng kể nợ kỹ thuật.
PP-YOLOE+: The PaddlePaddle Nhà máy điện
PP-YOLOE+ là một bước tiến hóa so với các thế hệ PP- trước đó. YOLO các phiên bản lặp lại, được thiết kế đặc biệt để chạy hiệu quả trên các hệ thống nội bộ của Baidu .
- Tác giả: Các tác giả của PaddlePaddle
- Tổ chức:Baidu
- Ngày: 2022-04-02
- Arxiv:Bài báo PP-YOLOE
- GitHub:Kho lưu trữ PaddleDetection
- Tài liệu: Cấu hình PP-YOLOE+
Trọng tâm kiến trúc
PP-YOLOE+ giới thiệu kiến trúc xương sống CSPRepResNet và triển khai Efficient Task-aligned Head (ET-head) để cải thiện độ chính xác phát hiện. Nó phụ thuộc rất nhiều vào khung học sâu PaddlePaddle . Mặc dù đạt được độ chính xác cao trên các tập dữ liệu chuẩn như tập dữ liệu COCO , kiến trúc của nó lại gắn liền với các hệ sinh thái cụ thể, điều này có thể gây khó khăn trong việc tích hợp vào các pipeline PyTorch hoặc TensorFlow tiêu chuẩn phổ biến trong cộng đồng AI rộng lớn hơn.
So sánh hiệu năng và số liệu
Khi triển khai các mô hình lên thiết bị biên hoặc máy chủ đám mây, cần cân bằng giữa độ chính xác ( mAP Tốc độ và số lượng tham số là rất quan trọng. Ultralytics Các mô hình này nổi tiếng với yêu cầu bộ nhớ thấp trong quá trình huấn luyện và tốc độ suy luận cực nhanh.
Dưới đây là bảng so sánh chi tiết các mô hình đã được đánh giá. COCO val2017.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Phân tích các đánh đổi
Trong khi đó, mẫu PP-YOLOE+x lại nhỉnh hơn một chút. YOLOv8x hơi thô mAP (54,7 so với 53,9), điều này phải trả giá bằng việc bổ sung gần 30 triệu tham số. Ultralytics YOLOv8 Đạt được tỷ lệ tham số trên độ chính xác vượt trội hơn nhiều. Trọng lượng nhẹ YOLOv8n Chỉ cần 3,2 triệu tham số và 8,7 tỷ phép tính FLOP, giúp nó hoạt động hiệu quả hơn đáng kể trong môi trường hạn chế tài nguyên so với biến thể PP-YOLOE+ nhỏ nhất.
Hơn nữa, YOLO Các mô hình có hiệu suất vượt trội hơn hẳn so với các kiến trúc dựa trên Transformer lớn về mức sử dụng bộ nhớ trong quá trình huấn luyện. Các mô hình có hiệu suất cao CUDA Dung lượng bộ nhớ thường đòi hỏi phần cứng đắt tiền, trong khi đó YOLOv8 Cho phép thực hiện các quy trình huấn luyện hiệu quả cao trên GPU dành cho người tiêu dùng.
Hệ sinh thái, tính dễ sử dụng và triển khai
Yếu tố thực sự tạo nên sự khác biệt giữa các kiến trúc này nằm ở trải nghiệm người dùng.
Nền tảng Ultralytics cung cấp một hệ sinh thái được duy trì tốt, giúp loại bỏ những rào cản trong các hoạt động học máy. Nó cung cấp API cực kỳ đơn giản, tài liệu đầy đủ và các công cụ gốc để ghi nhật ký dữ liệu, tinh chỉnh siêu tham số và xuất dữ liệu đa nền tảng. Cho dù bạn cần triển khai thông qua ONNX , TensorRT hay CoreML , Ultralytics Nó xử lý một cách trơn tru.
Ngược lại, PP-YOLOE+ thường đòi hỏi kiến thức sâu rộng về... PaddlePaddle Việc chuyển đổi các mô hình này để chạy hiệu quả trên GPU NVIDIA tiêu chuẩn hoặc các thiết bị biên bên ngoài hệ sinh thái phần cứng của Baidu có thể là một quy trình phức tạp, nhiều bước, thiếu tính tự động hóa được sắp xếp hợp lý như trong các khung phần cứng khác. Ultralytics công cụ.
Hiệu Quả Huấn Luyện với Ultralytics
Đào tạo một Ultralytics Mô hình này hầu như không yêu cầu mã mẫu. Dưới đây là một ví dụ đầy đủ chức năng cho thấy bạn có thể dễ dàng huấn luyện một mô hình như thế nào. YOLOv8 mô hình trong Python :
from ultralytics import YOLO
# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Quickly export the trained model for TensorRT deployment
model.export(format="engine", device=0)
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa YOLOv8 Và PP-YOLOE+ phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích hệ sinh thái của bạn.
Khi nào nên chọn YOLOv8
YOLOv8 là một lựa chọn tốt cho:
- Triển khai đa nhiệm linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh để phát hiện , phân đoạn , phân loại và ước tính tư thế trong phạm vi... Ultralytics hệ sinh thái.
- Hệ thống sản xuất hiện có: Môi trường sản xuất hiện tại đã được xây dựng trên hệ thống này. YOLOv8 kiến trúc với các quy trình triển khai ổn định, đã được kiểm thử kỹ lưỡng.
- Hỗ trợ cộng đồng và hệ sinh thái rộng rãi: Các ứng dụng được hưởng lợi từ YOLOv8 Hệ thống này có các hướng dẫn chi tiết, tích hợp với bên thứ ba và nguồn lực cộng đồng năng động.
Khi nào nên chọn PP-YOLOE+
PP-YOLOE+ được khuyến nghị sử dụng cho:
- Tích hợp hệ sinh thái PaddlePaddle : Các tổ chức có cơ sở hạ tầng hiện có được xây dựng trên nền tảng và công cụ PaddlePaddle của Baidu .
- Triển khai Paddle Lite Edge: Triển khai trên phần cứng với các nhân suy luận được tối ưu hóa cao, dành riêng cho công cụ suy luận Paddle Lite hoặc Paddle.
- Phát hiện phía máy chủ độ chính xác cao: Các kịch bản ưu tiên độ chính xác phát hiện tối đa trên các hệ thống mạnh mẽ. GPU các máy chủ mà sự phụ thuộc vào framework không phải là vấn đề đáng quan tâm.
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Hướng tới tương lai: Lợi thế của YOLO26
Đối với những ai đang tìm cách xây dựng các ứng dụng có khả năng đáp ứng nhu cầu trong tương lai, Ultralytics YOLO26 vừa được phát hành gần đây đại diện cho đỉnh cao của công nghệ thị giác máy tính hiện đại. Được phát hành vào tháng 1 năm 2026, nó sẽ vượt trội hơn cả hai thế hệ trước. YOLOv8 và phiên bản tầm trung YOLO11 bằng cách giới thiệu các tính năng đột phá:
- Thiết kế không cần NMS từ đầu đến cuối: YOLO26 loại bỏ hoàn toàn nhu cầu xử lý hậu kỳ Non-Maximum Suppression, giảm đáng kể sự biến động độ trễ và đơn giản hóa logic triển khai.
- MuSGD Optimizer: Tích hợp những cải tiến trong đào tạo LLM vào trí tuệ nhân tạo thị giác, đây là sự kết hợp của... SGD và Muon đảm bảo động lực huấn luyện cực kỳ ổn định và sự hội tụ nhanh hơn.
- Tốc độ suy luận CPU nhanh hơn tới 43%: Bằng cách loại bỏ tổn hao tiêu điểm phân tán (DFL), YOLO26 cung cấp tốc độ vượt trội trên các thiết bị biên và CPU tiêu chuẩn, lý tưởng cho các ứng dụng IoT và di động.
- ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận dạng vật thể nhỏ, một yêu cầu quan trọng đối với phân tích dữ liệu và hình ảnh trên không từ máy bay không người lái.
Đề xuất nâng cấp
Trong khi YOLOv8 YOLO26 vẫn là một lựa chọn mạnh mẽ và được hỗ trợ cao, là kiến trúc được khuyến nghị cho tất cả các dự án doanh nghiệp và nghiên cứu mới, cung cấp độ chính xác vượt trội, suy luận tại biên nhanh hơn và xử lý đầu cuối nguyên bản.
Kết luận
Cả hai YOLOv8 PP-YOLOE+ đã đẩy mạnh giới hạn của việc phát hiện đối tượng trong thời gian thực. Tuy nhiên, đối với phần lớn các nhà phát triển và nhà nghiên cứu, Ultralytics YOLOv8 —và phiên bản kế nhiệm của nó, YOLO26 —vẫn là lựa chọn tối ưu hơn. Sự kết hợp giữa API trực quan, cộng đồng mã nguồn mở năng động, yêu cầu bộ nhớ huấn luyện thấp hơn và khung phần mềm thống nhất linh hoạt đảm bảo quá trình từ tạo tập dữ liệu đến triển khai sản phẩm diễn ra suôn sẻ và hiệu quả nhất có thể.