PP-YOLOE+ so với YOLOv8 So sánh kỹ thuật giữa các thiết bị phát hiện vật thể thời gian thực
Nhu cầu về các mô hình thị giác máy tính hiệu năng cao, thời gian thực đã thúc đẩy sự đổi mới nhanh chóng trong toàn ngành AI. Việc lựa chọn kiến trúc phù hợp có thể là yếu tố quyết định giữa một triển khai thành công, hiệu quả cao và một quy trình cồng kềnh, tốn nhiều tài nguyên. Hướng dẫn kỹ thuật này cung cấp sự so sánh chuyên sâu giữa PP-YOLOE+ và Ultralytics YOLOv8 , khám phá kiến trúc nền tảng, hiệu quả huấn luyện và các kịch bản triển khai lý tưởng của chúng.
Giới thiệu về các kiến trúc
Cả hai mô hình này đều đại diện cho những cột mốc quan trọng trong sự phát triển của công nghệ nhận diện đối tượng, tuy nhiên chúng lại xuất phát từ những triết lý phát triển và hệ sinh thái hoàn toàn khác nhau.
PP-YOLOE+
Được phát triển như một phần mở rộng của bộ phần mềm PaddleDetection, PP-YOLOE+ được xây dựng dựa trên các phiên bản trước đó của PP- YOLO loạt phim. Nó được tối ưu hóa rất nhiều cho PaddlePaddle Khung học sâu, chủ yếu nhắm đến các triển khai công nghiệp tại các thị trường châu Á cụ thể nơi hệ sinh thái phần mềm của Baidu phổ biến.
- Tác giả: Các tác giả của PaddlePaddle
- Tổ chức:Baidu
- Ngày: 2022-04-02
- Arxiv:https://arxiv.org/abs/2203.16250
- GitHub:PaddlePaddle/PaddleDetection
- Tài liệu: Cấu hình PP-YOLOE+
PP-YOLOE+ sử dụng kiến trúc xương sống CSPRepResNet và phần đầu được căn chỉnh theo nhiệm vụ hiệu quả (ET-head), giúp căn chỉnh động các nhiệm vụ phân loại và định vị. Mặc dù đạt được độ chính xác trung bình ( mAP ) cao trên các bộ dữ liệu chuẩn, nhưng nó lại phụ thuộc nhiều vào... PaddlePaddle Hệ sinh thái có thể tạo ra khó khăn cho các nhà phát triển vốn quen thuộc với các framework được sử dụng rộng rãi hơn.
Ultralytics YOLOv8
Được phát hành như một bước tiến vượt bậc bởi Ultralytics , YOLOv8 Đã thiết lập một tiêu chuẩn mới về công nghệ nhận diện đối tượng , mang lại sự dễ sử dụng chưa từng có, tính linh hoạt cao và tốc độ thực thi nhanh chóng cho lĩnh vực rộng lớn hơn. PyTorch cộng đồng nhà phát triển.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2023-01-10
- GitHub:ultralytics/ultralytics
- Tài liệu:Tài liệu YOLOv8
YOLOv8 Giới thiệu một đầu phát hiện không cần neo được tối ưu hóa cao và khối xây dựng C2f được cải tiến thay thế cho mô-đun C3 cũ hơn. Thiết kế này cung cấp luồng gradient vượt trội và cho phép huấn luyện mô hình cực nhanh. Vượt xa khả năng phát hiện đơn giản, YOLOv8 Đây là một công cụ đa nhiệm mạnh mẽ, hỗ trợ liền mạch việc phân đoạn đối tượng , phân loại hình ảnh và ước tính tư thế thông qua cùng một API thân thiện với người dùng.
So sánh hiệu năng và số liệu
So sánh trực tiếp các kiến trúc này cho thấy sự đánh đổi khác nhau giữa kích thước tham số và độ trễ suy luận. Dưới đây là bảng phân tích hiệu năng sử dụng tập dữ liệu COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Mặc dù mẫu PP-YOLOE+x lớn nhất có phần nhỉnh hơn một chút. YOLOv8x TRONG mAP Điều này đòi hỏi một chi phí khổng lồ với gần 100 triệu tham số. Các mô hình Ultralytics YOLOv8 luôn thể hiện sự cân bằng hiệu suất vượt trội hơn hẳn. YOLOv8 Các kiến trúc này yêu cầu mức sử dụng bộ nhớ thấp hơn đáng kể trong quá trình huấn luyện và suy luận so với các kiến trúc nặng hơn, khiến chúng trở nên lý tưởng để mở rộng quy mô trong môi trường sản xuất.
Lợi thế Hệ sinh thái Ultralytics
Khi đánh giá các mô hình, hệ sinh thái xung quanh cũng quan trọng không kém kiến trúc thô. PP-YOLOE+ đòi hỏi phải điều hướng các tệp cấu hình phức tạp và các phụ thuộc đặc thù của nó. PaddlePaddle khung.
Ngược lại, Ultralytics Nền tảng này được thiết kế để tối đa hóa tốc độ phát triển của lập trình viên. Hệ sinh thái được duy trì tốt, sở hữu API Python đơn giản và cộng đồng cực kỳ năng động. Hơn nữa, Nền tảng Ultralytics đơn giản hóa toàn bộ quy trình học máy, cung cấp khả năng quản lý tập dữ liệu liền mạch, huấn luyện trên đám mây và xuất dữ liệu đơn giản sang các định dạng như ONNX và TensorRT .
Được tinh giản PyTorch Triển khai
Bởi vì YOLOv8 Được xây dựng nguyên bản bằng PyTorch , việc tích hợp vào các quy trình AI hiện có trở nên dễ dàng hơn đáng kể, cũng như xuất sang môi trường di động thông qua... CoreML hoặc triển khai trên các thiết bị biên thay vì các khung phần mềm yêu cầu các ngăn xếp phần mềm chuyên biệt.
Dễ sử dụng: So sánh mã nguồn
Huấn luyện một bộ phát hiện đối tượng hiện đại với Ultralytics Chỉ cần vài dòng mã. Không cần phải giải mã các thư mục cấu hình phân cấp phức tạp.
from ultralytics import YOLO
# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model efficiently on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model for mAP metrics
metrics = model.val()
# Export for high-speed edge deployment
model.export(format="engine", dynamic=True) # Exports to TensorRT
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa PP-YOLOE+ và YOLOv8 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn PP-YOLOE+
PP-YOLOE+ là một lựa chọn tuyệt vời cho:
- Tích hợp hệ sinh thái PaddlePaddle : Các tổ chức có cơ sở hạ tầng hiện có được xây dựng trên nền tảng và công cụ PaddlePaddle của Baidu .
- Triển khai Paddle Lite Edge: Triển khai trên phần cứng với các nhân suy luận được tối ưu hóa cao, dành riêng cho công cụ suy luận Paddle Lite hoặc Paddle.
- Phát hiện phía máy chủ độ chính xác cao: Các kịch bản ưu tiên độ chính xác phát hiện tối đa trên các hệ thống mạnh mẽ. GPU các máy chủ mà sự phụ thuộc vào framework không phải là vấn đề đáng quan tâm.
Khi nào nên chọn YOLOv8
YOLOv8 được khuyến nghị cho:
- Triển khai đa nhiệm linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh để phát hiện , phân đoạn , phân loại và ước tính tư thế trong phạm vi... Ultralytics hệ sinh thái.
- Hệ thống sản xuất hiện có: Môi trường sản xuất hiện tại đã được xây dựng trên hệ thống này. YOLOv8 kiến trúc với các quy trình triển khai ổn định, đã được kiểm thử kỹ lưỡng.
- Hỗ trợ cộng đồng và hệ sinh thái rộng rãi: Các ứng dụng được hưởng lợi từ YOLOv8 Hệ thống này có các hướng dẫn chi tiết, tích hợp với bên thứ ba và nguồn lực cộng đồng năng động.
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Vượt lên trên YOLOv8 : Bình Minh của YOLO26
Trong khi YOLOv8 Nếu Ultralytics vẫn là một lựa chọn mạnh mẽ và đáng tin cậy, thì các nhà phát triển đang tìm kiếm công nghệ tiên tiến nhất nên cân nhắc Ultralytics YOLO26 . Được phát hành vào tháng 1 năm 2026, YOLO26 kế thừa các nguyên tắc nền tảng của... YOLO xây dựng và tinh chỉnh các kiến trúc đó thành khung AI ưu tiên điện toán biên tối ưu.
YOLO26 mang đến một số cải tiến đột phá vượt trội so với cả PP-YOLOE+ và các phiên bản trước đó. YOLO các thế hệ (bao gồm YOLO11 ):
- Thiết kế không sử dụng NMS từ đầu đến cuối: Được xây dựng dựa trên các khái niệm từ YOLOv10 , YOLO26 hoạt động nguyên bản từ đầu đến cuối. Bằng cách loại bỏ quá trình xử lý hậu kỳ Non-Maximum Suppression ( NMS ) , nó mang lại khả năng suy luận nhất quán, độ trễ cực thấp, bất kể khung cảnh hình ảnh phức tạp đến mức nào.
- Suy luận CPU nhanh hơn tới 43%: Thông qua việc loại bỏ chiến lược hàm mất mát tiêu điểm phân tán (DFL), YOLO26 giảm đáng kể chi phí xử lý, giúp nó nhanh hơn đáng kể trên các CPU biên — lý tưởng cho các ứng dụng thành phố thông minh và IoT, nơi không có sẵn các GPU đắt tiền.
- Bộ tối ưu hóa MuSGD: YOLO26 kế thừa những cải tiến từ quá trình huấn luyện Mô hình Ngôn ngữ Lớn (LLM). Bộ tối ưu hóa lai MuSGD của nó mang lại sự ổn định chưa từng có và tốc độ hội tụ nhanh hơn trong quá trình huấn luyện.
- ProgLoss + STAL: Các công thức suy giảm tín hiệu tiên tiến này cải thiện đáng kể khả năng phát hiện các vật thể nhỏ và ở xa. Đây là một bước đột phá đối với người điều khiển máy bay không người lái giám sát các cánh đồng nông nghiệp hoặc phát hiện lỗi trên các dây chuyền sản xuất tốc độ cao.
Đối với các nhà phát triển bắt đầu những dự án về thị giác máy tính mới, YOLO26 là sự lựa chọn tối ưu.
Các ứng dụng thực tế
Việc lựa chọn giữa các mô hình này thường phụ thuộc vào thực tế triển khai cụ thể của bạn:
Những điểm mạnh của PP-YOLOE+:
- Hệ sinh thái phần cứng đặc thù của châu Á: Nếu bạn chỉ triển khai trên phần cứng được Baidu hỗ trợ, thì... PaddlePaddle Với yêu cầu về thời gian chạy, PP-YOLOE+ cung cấp khả năng tích hợp mạnh mẽ với môi trường native.
- Xử lý phía máy chủ quy mô lớn: Khi số lượng tham số và hạn chế về bộ nhớ không phải là vấn đề, và bạn đang thực hiện suy luận phía máy chủ hoàn toàn ngoại tuyến.
Ở đâu Ultralytics YOLOv8 (và YOLO26) Xuất sắc:
- Điện toán biên động: Từ các thiết bị NVIDIA Jetson đến các máy Raspberry Pi cơ bản, Ultralytics Các mẫu này cung cấp sự cân bằng tối ưu giữa tốc độ và dung lượng bộ nhớ nhỏ gọn.
- Các quy trình xử lý đa nhiệm: Nếu ứng dụng của bạn cần phát triển từ các hộp giới hạn đơn giản sang các hộp giới hạn định hướng (OBB) cho ảnh chụp từ trên không, hoặc ước tính tư thế cho phân tích hành vi, Ultralytics Hỗ trợ tất cả các tác vụ ngay từ khi cài đặt.
- Từ tạo mẫu nhanh đến sản xuất hàng loạt: Ultralytics Hệ sinh thái này cho phép các nhóm nhanh chóng thử nghiệm và cải tiến. Với các trọng số được huấn luyện sẵn có, các mô hình tùy chỉnh có thể được tạo, huấn luyện và triển khai thông qua Nền tảng Ultralytics chỉ trong một phần nhỏ thời gian so với các kiến trúc cạnh tranh.
Mặc dù PP-YOLOE+ cung cấp các tiêu chuẩn cạnh tranh, nhưng tính linh hoạt vượt trội, dễ sử dụng và sự đổi mới liên tục—được minh chứng bằng việc phát hành YOLO26—đã củng cố vị thế của nó. Ultralytics Các mô hình này là sự lựa chọn ưu việt dành cho cả các nhà phát triển và nhà nghiên cứu hiện đại.