YOLOv7 so với YOLOv9 : So sánh kỹ thuật toàn diện
Sự tiến hóa của YOLO Dòng sản phẩm (You Only Look Once) đã được đánh dấu bằng sự đổi mới liên tục trong kiến trúc mạng nơ-ron, cân bằng những đánh đổi quan trọng giữa tốc độ suy luận, độ chính xác và hiệu quả tính toán. Bài so sánh này đi sâu vào YOLOv7 , một phiên bản phát hành quan trọng từ năm 2022, nổi tiếng với "túi quà tặng miễn phí" có thể huấn luyện được, và YOLOv9 , một kiến trúc năm 2024 giới thiệu Thông tin Gradient Lập trình (PGI) để khắc phục tình trạng tắc nghẽn thông tin trong mạng sâu.
Phân tích hiệu suất và hiệu quả
Sự chuyển đổi từ YOLOv7 ĐẾN YOLOv9 thể hiện một bước nhảy vọt đáng kể về hiệu quả tham số. Trong khi YOLOv7 đã được tối ưu hóa để đẩy giới hạn của việc phát hiện đối tượng theo thời gian thực bằng cách sử dụng Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN), YOLOv9 giới thiệu những thay đổi về kiến trúc cho phép đạt được Độ chính xác trung bình cao hơn ( mAP ) với ít tham số hơn và Toán tử dấu chấm động (FLOP).
Đối với các nhà phát triển tập trung vào triển khai AI biên , hiệu quả này rất quan trọng. Như minh họa trong bảng dưới đây, YOLOv9e đạt được mAP vượt trội 55,6% , vượt trội hơn YOLOv7x lớn hơn trong khi vẫn duy trì được dung lượng tính toán cạnh tranh. Ngược lại, YOLOv9t nhỏ hơn cung cấp một giải pháp nhẹ nhàng cho các thiết bị có giới hạn cao, một tầng YOLOv7 không nhắm mục tiêu rõ ràng với cùng mức độ chi tiết.
| Mô hình | Kích thước (pixels) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv7 : Tối ưu hóa Túi quà tặng miễn phí có thể đào tạo
Phát hành vào tháng 7 năm 2022, YOLOv7 đã đưa ra một số cải cách cơ cấu cho YOLO kiến trúc tập trung vào việc tối ưu hóa quá trình đào tạo mà không làm tăng chi phí suy luận.
- Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Trung Quốc, Đài Loan
- Date: 2022-07-06
- Arxiv: YOLOv7 : Túi quà tặng có thể huấn luyện thiết lập công nghệ tiên tiến mới
- GitHub: WongKinYiu/yolov7
Điểm nổi bật về kiến trúc
YOLOv7 sử dụng E-ELAN (Mạng Tổng hợp Lớp Hiệu quả Mở rộng) , kiểm soát các đường dẫn gradient ngắn nhất và dài nhất để cho phép mạng học nhiều tính năng hơn một cách hiệu quả. Nó cũng phổ biến khả năng mở rộng mô hình cho các mô hình dựa trên chuỗi, cho phép mở rộng đồng thời chiều sâu và chiều rộng. Một cải tiến quan trọng là tích chập được tham số hóa lại theo kế hoạch, giúp hợp lý hóa kiến trúc mô hình trong quá trình suy luận để tăng tốc độ.
Tình trạng di sản
Trong khi YOLOv7 Mặc dù vẫn là một mô hình mạnh mẽ, nhưng nó thiếu hỗ trợ gốc cho các tối ưu hóa mới hơn trong hệ sinh thái Ultralytics . Các nhà phát triển có thể thấy việc tích hợp với các công cụ MLOps hiện đại khó khăn hơn so với các phiên bản mới hơn.
YOLOv9 : Giải quyết nút thắt thông tin
YOLOv9 , được giới thiệu vào đầu năm 2024, giải quyết một vấn đề cơ bản trong học sâu: mất thông tin khi dữ liệu đi qua các lớp liên tiếp.
- Tác giả: Chien-Yao Wang và Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Trung Quốc, Đài Loan
- Ngày: 2024-02-21
- Arxiv: YOLOv9 : Học những gì bạn muốn học bằng cách sử dụng PGI
- GitHub: WongKinYiu/yolov9
Điểm nổi bật về kiến trúc
Sự đổi mới cốt lõi trong YOLOv9 là Thông tin Gradient Lập trình (PGI) . Trong các mạng sâu, thông tin hữu ích có thể bị mất trong quá trình truyền thẳng, dẫn đến gradient không đáng tin cậy. PGI cung cấp một khung giám sát phụ trợ đảm bảo thông tin quan trọng được bảo toàn cho hàm mất mát. Ngoài ra, Mạng Tổng hợp Lớp Hiệu quả Tổng quát (GELAN) mở rộng khả năng của ELAN bằng cách cho phép chặn tùy ý, tối đa hóa việc sử dụng các tham số và tài nguyên tính toán.
Kiến trúc này làm cho YOLOv9 đặc biệt mạnh mẽ đối với các nhiệm vụ phát hiện phức tạp , chẳng hạn như phát hiện các vật thể nhỏ trong môi trường lộn xộn hoặc phân tích hình ảnh trên không có độ phân giải cao.
Tại sao Ultralytics Các mô hình ( YOLO11 & YOLOv8 ) Là sự lựa chọn ưa thích
Trong khi YOLOv7 Và YOLOv9 Với những thành tựu học thuật ấn tượng, dòng sản phẩm YOLO Ultralytics —bao gồm YOLOv8 và YOLO11 hiện đại—được thiết kế đặc biệt cho việc phát triển ứng dụng thực tế. Các mô hình này ưu tiên tính dễ sử dụng , tích hợp hệ sinh thái và hiệu quả vận hành , khiến chúng trở thành lựa chọn hàng đầu cho hầu hết các nhóm kỹ thuật.
Trải nghiệm người dùng được sắp xếp hợp lý
Ultralytics Các mô hình được gói gọn trong một API Python thống nhất, giúp loại bỏ sự phức tạp của các quy trình đào tạo. Việc chuyển đổi giữa các tác vụ phát hiện đối tượng , phân đoạn thể hiện , ước lượng tư thế và hộp giới hạn định hướng (OBB) chỉ cần một thay đổi đối số duy nhất, một tính linh hoạt mà các tiêu chuẩn hiện nay không có. YOLOv7 hoặc YOLOv9 triển khai.
from ultralytics import YOLO
# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt") # Load a pretrained model
# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Perform inference on an image
results = model("path/to/image.jpg")
Hệ sinh thái được duy trì tốt
Lựa chọn một Ultralytics Mô hình này cho phép truy cập vào một hệ sinh thái mạnh mẽ. Điều này bao gồm tích hợp liền mạch với Ultralytics HUB (và các phiên bản sắp ra mắt) Ultralytics Nền tảng) để đào tạo đám mây và quản lý tập dữ liệu. Hơn nữa, cộng đồng năng động và các bản cập nhật thường xuyên đảm bảo khả năng tương thích với phần cứng mới nhất, chẳng hạn như xuất sang TensorRT hoặc OpenVINO để đạt tốc độ suy luận tối ưu.
Trí nhớ và hiệu quả đào tạo
Ultralytics Các mô hình được biết đến với hiệu quả đào tạo cao . Không giống như các mô hình dựa trên bộ biến đổi (như RT-DETR ) có thể ngốn bộ nhớ và chậm hội tụ, Ultralytics YOLO các mô hình sử dụng bộ tải dữ liệu được tối ưu hóa và tăng cường Mosaic để cung cấp thời gian đào tạo nhanh với chi phí thấp hơn CUDA yêu cầu về bộ nhớ. Điều này cho phép các nhà phát triển đào tạo các mô hình tiên tiến trên GPU dành cho người tiêu dùng.
Các trường hợp sử dụng lý tưởng
Việc lựa chọn mô hình phù hợp phụ thuộc vào những hạn chế cụ thể của dự án của bạn.
Ứng dụng thực tế cho YOLOv9
- Nghiên cứu & Đánh giá chuẩn: Lý tưởng cho các nghiên cứu học thuật yêu cầu độ chính xác cao nhất được báo cáo trên tập dữ liệu COCO .
- Giám sát độ trung thực cao: Trong các tình huống như hệ thống báo động an ninh, độ chính xác tăng 1-2% có thể biện minh cho việc triển khai phức tạp hơn.
Ứng dụng thực tế cho YOLOv7
- Hệ thống kế thừa: Các dự án đã được xây dựng trên Darknet hoặc giai đoạn đầu PyTorch hệ sinh thái yêu cầu số lượng ổn định, đã biết mà không cần phải cấu trúc lại toàn bộ cơ sở mã.
Ứng dụng thực tế cho Ultralytics YOLO11
- Thành phố thông minh: Sử dụng theo dõi đối tượng để phân tích lưu lượng giao thông, trong đó tốc độ và khả năng triển khai dễ dàng là tối quan trọng.
- Chăm sóc sức khỏe: Phân tích hình ảnh y tế trong đó việc phân đoạn và phát hiện thường cần thực hiện đồng thời.
- Sản xuất: Triển khai hệ thống kiểm soát chất lượng trên các thiết bị biên như NVIDIA Jetson hoặc Raspberry Pi, được hưởng lợi từ các tùy chọn xuất đơn giản để TFLite Và ONNX .
Kết luận
Cả hai YOLOv7 Và YOLOv9 đánh dấu những cột mốc quan trọng trong lịch sử thị giác máy tính. YOLOv9 mang đến một bản nâng cấp hấp dẫn so với v7 với kiến trúc PGI, mang lại hiệu quả và độ chính xác cao hơn. Tuy nhiên, đối với các nhà phát triển đang tìm kiếm một giải pháp linh hoạt, dễ sử dụng và được hỗ trợ tốt , Ultralytics YOLO11 vẫn là lựa chọn được đề xuất. Sự cân bằng giữa hiệu suất, tài liệu hướng dẫn toàn diện và khả năng đa nhiệm ( detect , segment , classify , tư thế) cung cấp con đường nhanh nhất từ khái niệm đến sản xuất.
Khám phá các Mô hình Khác
Để tìm ra giải pháp phù hợp nhất cho các tác vụ thị giác máy tính cụ thể của bạn, hãy cân nhắc khám phá những so sánh khác sau:
- YOLOv8 so với YOLOv9 - So sánh phiên bản v8 được sử dụng rộng rãi với phiên bản v9 tập trung vào nghiên cứu.
- YOLOv10 so với YOLOv9 - Xem cách thức từ đầu đến cuối YOLOv10 xếp chồng lên nhau.
- YOLO11 so với YOLOv8 - Hiểu những cải tiến trong phiên bản mới nhất Ultralytics giải phóng.
- RT-DETR so với YOLOv9 - So sánh phát hiện dựa trên Transformer với CNN.