Chuyển đến nội dung

YOLOv7 so với YOLOv9 : So sánh kỹ thuật toàn diện

Sự tiến hóa của YOLO Dòng sản phẩm (You Only Look Once) đã được đánh dấu bằng sự đổi mới liên tục trong kiến trúc mạng nơ-ron, cân bằng những đánh đổi quan trọng giữa tốc độ suy luận, độ chính xác và hiệu quả tính toán. Bài so sánh này đi sâu vào YOLOv7 , một phiên bản phát hành quan trọng từ năm 2022, nổi tiếng với "túi quà tặng miễn phí" có thể huấn luyện được, và YOLOv9 , một kiến trúc năm 2024 giới thiệu Thông tin Gradient Lập trình (PGI) để khắc phục tình trạng tắc nghẽn thông tin trong mạng sâu.

Phân tích hiệu suất và hiệu quả

Sự chuyển đổi từ YOLOv7 ĐẾN YOLOv9 thể hiện một bước nhảy vọt đáng kể về hiệu quả tham số. Trong khi YOLOv7 đã được tối ưu hóa để đẩy giới hạn của việc phát hiện đối tượng theo thời gian thực bằng cách sử dụng Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN), YOLOv9 giới thiệu những thay đổi về kiến trúc cho phép đạt được Độ chính xác trung bình cao hơn ( mAP ) với ít tham số hơn và Toán tử dấu chấm động (FLOP).

Đối với các nhà phát triển tập trung vào triển khai AI biên , hiệu quả này rất quan trọng. Như minh họa trong bảng dưới đây, YOLOv9e đạt được mAP vượt trội 55,6% , vượt trội hơn YOLOv7x lớn hơn trong khi vẫn duy trì được dung lượng tính toán cạnh tranh. Ngược lại, YOLOv9t nhỏ hơn cung cấp một giải pháp nhẹ nhàng cho các thiết bị có giới hạn cao, một tầng YOLOv7 không nhắm mục tiêu rõ ràng với cùng mức độ chi tiết.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

YOLOv7 : Tối ưu hóa Túi quà tặng miễn phí có thể đào tạo

Phát hành vào tháng 7 năm 2022, YOLOv7 đã đưa ra một số cải cách cơ cấu cho YOLO kiến trúc tập trung vào việc tối ưu hóa quá trình đào tạo mà không làm tăng chi phí suy luận.

Điểm nổi bật về kiến trúc

YOLOv7 sử dụng E-ELAN (Mạng Tổng hợp Lớp Hiệu quả Mở rộng) , kiểm soát các đường dẫn gradient ngắn nhất và dài nhất để cho phép mạng học nhiều tính năng hơn một cách hiệu quả. Nó cũng phổ biến khả năng mở rộng mô hình cho các mô hình dựa trên chuỗi, cho phép mở rộng đồng thời chiều sâu và chiều rộng. Một cải tiến quan trọng là tích chập được tham số hóa lại theo kế hoạch, giúp hợp lý hóa kiến trúc mô hình trong quá trình suy luận để tăng tốc độ.

Tình trạng di sản

Trong khi YOLOv7 Mặc dù vẫn là một mô hình mạnh mẽ, nhưng nó thiếu hỗ trợ gốc cho các tối ưu hóa mới hơn trong hệ sinh thái Ultralytics . Các nhà phát triển có thể thấy việc tích hợp với các công cụ MLOps hiện đại khó khăn hơn so với các phiên bản mới hơn.

Tìm hiểu thêm về YOLOv7

YOLOv9 : Giải quyết nút thắt thông tin

YOLOv9 , được giới thiệu vào đầu năm 2024, giải quyết một vấn đề cơ bản trong học sâu: mất thông tin khi dữ liệu đi qua các lớp liên tiếp.

Điểm nổi bật về kiến trúc

Sự đổi mới cốt lõi trong YOLOv9 là Thông tin Gradient Lập trình (PGI) . Trong các mạng sâu, thông tin hữu ích có thể bị mất trong quá trình truyền thẳng, dẫn đến gradient không đáng tin cậy. PGI cung cấp một khung giám sát phụ trợ đảm bảo thông tin quan trọng được bảo toàn cho hàm mất mát. Ngoài ra, Mạng Tổng hợp Lớp Hiệu quả Tổng quát (GELAN) mở rộng khả năng của ELAN bằng cách cho phép chặn tùy ý, tối đa hóa việc sử dụng các tham số và tài nguyên tính toán.

Kiến trúc này làm cho YOLOv9 đặc biệt mạnh mẽ đối với các nhiệm vụ phát hiện phức tạp , chẳng hạn như phát hiện các vật thể nhỏ trong môi trường lộn xộn hoặc phân tích hình ảnh trên không có độ phân giải cao.

Tìm hiểu thêm về YOLOv9

Tại sao Ultralytics Các mô hình ( YOLO11 & YOLOv8 ) Là sự lựa chọn ưa thích

Trong khi YOLOv7 Và YOLOv9 Với những thành tựu học thuật ấn tượng, dòng sản phẩm YOLO Ultralytics —bao gồm YOLOv8YOLO11 hiện đại—được thiết kế đặc biệt cho việc phát triển ứng dụng thực tế. Các mô hình này ưu tiên tính dễ sử dụng , tích hợp hệ sinh tháihiệu quả vận hành , khiến chúng trở thành lựa chọn hàng đầu cho hầu hết các nhóm kỹ thuật.

Trải nghiệm người dùng được sắp xếp hợp lý

Ultralytics Các mô hình được gói gọn trong một API Python thống nhất, giúp loại bỏ sự phức tạp của các quy trình đào tạo. Việc chuyển đổi giữa các tác vụ phát hiện đối tượng , phân đoạn thể hiện , ước lượng tư thếhộp giới hạn định hướng (OBB) chỉ cần một thay đổi đối số duy nhất, một tính linh hoạt mà các tiêu chuẩn hiện nay không có. YOLOv7 hoặc YOLOv9 triển khai.

from ultralytics import YOLO

# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt")  # Load a pretrained model

# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Perform inference on an image
results = model("path/to/image.jpg")

Hệ sinh thái được duy trì tốt

Lựa chọn một Ultralytics Mô hình này cho phép truy cập vào một hệ sinh thái mạnh mẽ. Điều này bao gồm tích hợp liền mạch với Ultralytics HUB (và các phiên bản sắp ra mắt) Ultralytics Nền tảng) để đào tạo đám mây và quản lý tập dữ liệu. Hơn nữa, cộng đồng năng động và các bản cập nhật thường xuyên đảm bảo khả năng tương thích với phần cứng mới nhất, chẳng hạn như xuất sang TensorRT hoặc OpenVINO để đạt tốc độ suy luận tối ưu.

Trí nhớ và hiệu quả đào tạo

Ultralytics Các mô hình được biết đến với hiệu quả đào tạo cao . Không giống như các mô hình dựa trên bộ biến đổi (như RT-DETR ) có thể ngốn bộ nhớ và chậm hội tụ, Ultralytics YOLO các mô hình sử dụng bộ tải dữ liệu được tối ưu hóa và tăng cường Mosaic để cung cấp thời gian đào tạo nhanh với chi phí thấp hơn CUDA yêu cầu về bộ nhớ. Điều này cho phép các nhà phát triển đào tạo các mô hình tiên tiến trên GPU dành cho người tiêu dùng.

Tìm hiểu thêm về YOLO11

Các trường hợp sử dụng lý tưởng

Việc lựa chọn mô hình phù hợp phụ thuộc vào những hạn chế cụ thể của dự án của bạn.

Ứng dụng thực tế cho YOLOv9

  • Nghiên cứu & Đánh giá chuẩn: Lý tưởng cho các nghiên cứu học thuật yêu cầu độ chính xác cao nhất được báo cáo trên tập dữ liệu COCO .
  • Giám sát độ trung thực cao: Trong các tình huống như hệ thống báo động an ninh, độ chính xác tăng 1-2% có thể biện minh cho việc triển khai phức tạp hơn.

Ứng dụng thực tế cho YOLOv7

  • Hệ thống kế thừa: Các dự án đã được xây dựng trên Darknet hoặc giai đoạn đầu PyTorch hệ sinh thái yêu cầu số lượng ổn định, đã biết mà không cần phải cấu trúc lại toàn bộ cơ sở mã.

Ứng dụng thực tế cho Ultralytics YOLO11

  • Thành phố thông minh: Sử dụng theo dõi đối tượng để phân tích lưu lượng giao thông, trong đó tốc độ và khả năng triển khai dễ dàng là tối quan trọng.
  • Chăm sóc sức khỏe: Phân tích hình ảnh y tế trong đó việc phân đoạn và phát hiện thường cần thực hiện đồng thời.
  • Sản xuất: Triển khai hệ thống kiểm soát chất lượng trên các thiết bị biên như NVIDIA Jetson hoặc Raspberry Pi, được hưởng lợi từ các tùy chọn xuất đơn giản để TFLite Và ONNX .

Kết luận

Cả hai YOLOv7 Và YOLOv9 đánh dấu những cột mốc quan trọng trong lịch sử thị giác máy tính. YOLOv9 mang đến một bản nâng cấp hấp dẫn so với v7 với kiến trúc PGI, mang lại hiệu quả và độ chính xác cao hơn. Tuy nhiên, đối với các nhà phát triển đang tìm kiếm một giải pháp linh hoạt, dễ sử dụng và được hỗ trợ tốt , Ultralytics YOLO11 vẫn là lựa chọn được đề xuất. Sự cân bằng giữa hiệu suất, tài liệu hướng dẫn toàn diện và khả năng đa nhiệm ( detect , segment , classify , tư thế) cung cấp con đường nhanh nhất từ khái niệm đến sản xuất.

Khám phá các Mô hình Khác

Để tìm ra giải pháp phù hợp nhất cho các tác vụ thị giác máy tính cụ thể của bạn, hãy cân nhắc khám phá những so sánh khác sau:


Bình luận