PP-YOLOE+ so với YOLOv7 Điều hướng các kiến trúc phát hiện đối tượng thời gian thực
Thị giác máy tính đã phát triển nhanh chóng, cung cấp cho các nhà phát triển những công cụ ngày càng mạnh mẽ để phát hiện đối tượng trong thời gian thực . Hai cột mốc quan trọng trong sự phát triển này là PP-YOLOE+ của Baidu và YOLOv7 của các tác giả YOLOv4. Cả hai mô hình đều hướng đến sự cân bằng giữa tốc độ và độ chính xác, nhưng chúng đạt được điều này thông qua các triết lý kiến trúc và phương pháp huấn luyện khác nhau về cơ bản.
Hướng dẫn toàn diện này phân tích hai kiến trúc này, so sánh các chỉ số hiệu năng, tính dễ sử dụng và sự phù hợp của chúng với các ứng dụng AI hiện đại. Chúng tôi cũng khám phá cách các cải tiến mới hơn như YOLO26 đang thiết lập các tiêu chuẩn mới về hiệu quả và triển khai.
Tóm tắt: Những điểm khác biệt chính
| Tính năng | PP-YOLOE+ | YOLOv7 |
|---|---|---|
| Kiến trúc | Không cần neo, CSPRepResStage | E-ELAN dựa trên điểm neo |
| Đổi mới cốt lõi | Học tập dựa trên sự phù hợp nhiệm vụ (TAL) | Túi quà tặng có thể huấn luyện |
| Khung chính | PaddlePaddle | PyTorch |
| Trường hợp sử dụng tốt nhất | Môi trường công nghiệp sử dụng suy luận mái chèo | Nghiên cứu và triển khai đa năng |
PP-YOLOE+: Phát hiện không neo được tinh chỉnh
PP-YOLOE+ là sự phát triển của PP- YOLO Đây là dòng sản phẩm được đội ngũ của Baidu phát triển để tối ưu hóa độ chính xác và tốc độ suy luận trên nhiều phần cứng khác nhau. Được phát hành vào năm 2022, nó tận dụng tối đa các cơ chế không cần neo để đơn giản hóa đầu dò.
Chi tiết kỹ thuật:
- Tác giả: Các tác giả của PaddlePaddle
- Tổ chức:Baidu
- Ngày: 2022-04-02
- Arxiv:Bài báo PP-YOLOE
- GitHub:Kho lưu trữ PaddleDetection
Kiến trúc và Điểm mạnh
PP-YOLOE+ giới thiệu kiến trúc xương sống CSPRepResStage , kết hợp các kết nối dư với mạng CSP (Cross Stage Partial). Một tính năng quan trọng là cơ chế Học căn chỉnh nhiệm vụ (TAL) , giúp tự động căn chỉnh các nhiệm vụ phân loại và định vị trong quá trình huấn luyện. Điều này giúp giải quyết vấn đề thường gặp là các phát hiện có độ tin cậy cao không nhất thiết phải có sự chồng lấp hộp giới hạn tốt nhất.
Mô hình này được hỗ trợ nguyên bản bởi hệ sinh thái PaddlePaddle , giúp nó hoạt động hiệu quả cao khi được triển khai trên các công cụ suy luận hoặc phần cứng chuyên dụng của Baidu như các thiết bị FPGA và NPU thường được sử dụng trong thị trường công nghiệp châu Á.
YOLOv7: Túi quà tặng có thể huấn luyện
Được phát hành ngay sau PP-YOLOE+, YOLOv7 tập trung vào việc tối ưu hóa quá trình huấn luyện mà không làm tăng chi phí suy luận, một khái niệm mà các tác giả gọi là "túi quà tặng miễn phí".
Chi tiết kỹ thuật:
- Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
- Ngày: 2022-07-06
- Arxiv: Bài báo YOLOv7 trên ArXiv
- GitHub:Kho lưu trữ YOLOv7
Kiến trúc và Điểm mạnh
YOLOv7 đã giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN) . Không giống như ELAN truyền thống, E-ELAN cho phép mạng học được nhiều đặc điểm đa dạng hơn bằng cách kiểm soát độ dài đường dẫn gradient. Nó cũng sử dụng phương pháp mở rộng mô hình kết hợp, điều chỉnh độ sâu và độ rộng đồng thời để duy trì hiệu quả tối ưu.
Mặc dù có hiệu năng cao, YOLOv7 Phương pháp này dựa trên các hộp neo, điều này có thể đòi hỏi việc tinh chỉnh siêu tham số cẩn thận đối với các tập dữ liệu tùy chỉnh có hình dạng đối tượng bất thường.
Điểm chuẩn hiệu suất
Bảng sau so sánh các mô hình trên tập dữ liệu COCO , một chuẩn mực thông thường cho việc phát hiện đối tượng. Lưu ý rằng trong khi PP-YOLOE+ thể hiện khả năng mạnh mẽ mAP , YOLOv7 thường cung cấp tốc độ suy luận cạnh tranh trên các tiêu chuẩn thông thường. GPU phần cứng.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
So sánh đào tạo và hệ sinh thái
Khi lựa chọn mô hình cho một dự án thị giác máy tính , sự dễ dàng trong việc huấn luyện và hệ sinh thái xung quanh thường quan trọng không kém gì các chỉ số thô.
Khung và Khả năng sử dụng
PP-YOLOE+ yêu cầu PaddlePaddle Khung phần mềm này tuy mạnh mẽ nhưng có thể đòi hỏi người dùng phải học hỏi rất nhiều đối với những nhà phát triển đã quen với các hệ thống khác. PyTorch hệ sinh thái. Việc thiết lập thường bao gồm sao chép các kho lưu trữ cụ thể như... PaddleDetection và quản lý các phụ thuộc khác với các gói pip toàn cầu tiêu chuẩn.
YOLOv7 , là PyTorch Dựa trên nền tảng này, nó tích hợp một cách tự nhiên hơn vào quy trình nghiên cứu tiêu chuẩn của phương Tây. Tuy nhiên, kho lưu trữ gốc thiếu trải nghiệm "từ con số không đến chuyên gia" liền mạch như trong các kho lưu trữ hiện đại. Ultralytics mô hình.
Lợi thế của Ultralytics
Ultralytics Các mẫu như YOLOv8 và YOLO26 mới, cung cấp một giải pháp thống nhất. Python API này giúp đơn giản hóa quá trình huấn luyện, cho phép các nhà phát triển tập trung vào dữ liệu thay vì viết mã lặp đi lặp lại.
Đào tạo được tối ưu hóa với Ultralytics
Huấn luyện một mô hình tiên tiến với Ultralytics Chỉ cần một vài dòng mã, nó sẽ tự động xử lý việc bổ sung dữ liệu và ghi nhật ký.
from ultralytics import YOLO
# Load a pretrained model (YOLO26 recommended for best performance)
model = YOLO("yolo26s.pt")
# Train on your custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Sự đơn giản này cũng được thể hiện ở các tùy chọn triển khai , cho phép xuất dữ liệu đơn giản sang các định dạng như ONNX và TensorRT để đạt hiệu suất tối đa.
Tương lai của công nghệ phát hiện: YOLO26
Trong khi PP-YOLOE+ và YOLOv7 Mặc dù các sản phẩm trước đây đều thuộc hàng tiên tiến nhất khi ra mắt, lĩnh vực này đã phát triển đáng kể. Được phát hành vào tháng 1 năm 2026, YOLO26 đại diện cho đỉnh cao về hiệu quả và độ chính xác.
Những cải tiến quan trọng của YOLO26:
- NMS từ đầu đến cuối - Miễn phí: Không giống như YOLOv7 điều này đòi hỏi sự ức chế không tối đa ( NMS (Không cần xử lý hậu kỳ), YOLO26 là hệ thống end-to-end thuần túy. Điều này loại bỏ sự biến động độ trễ do...) NMS Trong những khung cảnh đông đúc, nó rất lý tưởng cho các ứng dụng thành phố thông minh và giám sát giao thông.
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM, bộ tối ưu hóa này kết hợp SGD Với Muon, hệ thống đảm bảo động lực huấn luyện ổn định, một tính năng không có ở các kiến trúc cũ hơn.
- Tối ưu hóa cho thiết bị biên: Bằng cách loại bỏ hiện tượng mất tiêu điểm phân tán (DFL), YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% , giúp nó vượt trội hơn hẳn so với yêu cầu tính toán nặng nề hơn của PP-YOLOE+ đối với các thiết bị biên.
- ProgLoss + STAL: Các hàm mất mát nâng cao giúp cải thiện khả năng phát hiện vật thể nhỏ, rất quan trọng trong các lĩnh vực như nông nghiệp và ảnh chụp từ trên không.
Các ứng dụng thực tế
Việc lựa chọn mô hình thường quyết định sự thành công của các ứng dụng cụ thể.
Các trường hợp sử dụng PP-YOLOE+
- Kiểm tra công nghiệp tại châu Á: Do nhu cầu cao PaddlePaddle Được hỗ trợ tại các trung tâm sản xuất ở châu Á, PP-YOLOE+ thường được sử dụng để phát hiện lỗi trên các dây chuyền lắp ráp nơi phần cứng được cấu hình sẵn cho hệ thống của Baidu.
- Phân tích hình ảnh tĩnh: Mức độ cao của nó mAP Điều này làm cho nó phù hợp với việc xử lý ngoại tuyến, nơi độ trễ thời gian thực ít quan trọng hơn độ chính xác tuyệt đối.
YOLOv7 Các trường hợp sử dụng
- Nghiên cứu đa mục đích: Được sử dụng rộng rãi như một cơ sở tham khảo trong các bài báo học thuật do tính chất của nó. PyTorch thực hiện.
- Hệ thống tăng tốc GPU : Hoạt động tốt trên các GPU cấp máy chủ cho các tác vụ như phân tích video.
Ultralytics Các trường hợp sử dụng mẫu (YOLO26)
- AI và IoT biên: Dung lượng bộ nhớ thấp và hiệu năng cao. CPU tốc độ của Ultralytics Các mẫu này rất phù hợp cho Raspberry Pi và các ứng dụng di động.
- Nhiệm vụ đa phương thức: Vượt ra ngoài những hộp đơn giản, Ultralytics Hỗ trợ ước lượng tư thế và hộp giới hạn định hướng (OBB) , cho phép thực hiện các ứng dụng phức tạp như gắp vật bằng robot hoặc phân tích tài liệu.
- Tạo mẫu nhanh: Nền tảng Ultralytics cho phép các nhóm chuyển từ chú thích dữ liệu đến mô hình đã triển khai chỉ trong vài phút, giảm đáng kể thời gian đưa sản phẩm ra thị trường.
Kết luận
Cả PP-YOLOE+ và YOLOv7 đã đóng góp đáng kể vào lĩnh vực thị giác máy tính. PP-YOLOE+ đã đẩy mạnh giới hạn của việc phát hiện không cần neo, trong khi đó YOLOv7 Đã nâng cao hiệu quả của các kiến trúc dựa trên neo.
Tuy nhiên, đối với các nhà phát triển đang tìm kiếm một giải pháp có khả năng đáp ứng nhu cầu trong tương lai, kết hợp những ưu điểm tốt nhất của cả tốc độ, độ chính xác và tính dễ sử dụng, YOLO26 là lựa chọn được khuyến nghị. Với những ưu điểm vượt trội của mình, YOLO26 là sự lựa chọn tối ưu. NMS Với thiết kế miễn phí, khả năng xuất dữ liệu mạnh mẽ và tích hợp liền mạch vào hệ sinh thái Ultralytics , nó cung cấp bộ công cụ linh hoạt nhất cho các thách thức AI hiện đại.
Để tìm hiểu thêm các tùy chọn hiệu năng cao khác, hãy tham khảo tài liệu hướng dẫn dành cho YOLOv9 hoặc YOLOv10 .