Bỏ qua nội dung

YOLO11 vs YOLOv7: So sánh kỹ thuật chi tiết để phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng để đạt được hiệu suất tối ưu trong các tác vụ thị giác máy tính. Trang này cung cấp so sánh kỹ thuật chi tiết giữa Ultralytics YOLO11 và YOLOv7, hai mô hình tiên tiến được thiết kế để phát hiện đối tượng hiệu quả và chính xác. Chúng tôi sẽ khám phá các sắc thái kiến trúc, chuẩn hiệu suất và ứng dụng phù hợp của chúng để hướng dẫn bạn đưa ra quyết định sáng suốt.

Ultralytics YOLO11

Ultralytics YOLO11 , được biên soạn bởi Glenn Jocher và Jing Qiu từ Ultralytics và được phát hành vào ngày 27-09-2024, là sự phát triển mới nhất trong YOLO loạt. Nó tập trung vào việc nâng cao cả độ chính xác và hiệu quả trong việc phát hiện đối tượng, làm cho nó linh hoạt cho một loạt các ứng dụng trong thế giới thực. Ultralytics YOLO11 xây dựng dựa trên YOLO các mô hình, tinh chỉnh cấu trúc mạng để đạt được độ chính xác phát hiện tiên tiến trong khi vẫn duy trì hiệu suất thời gian thực.

Kiến trúc và các tính năng chính:

YOLO11 Kiến trúc của 'kết hợp các kỹ thuật trích xuất tính năng tiên tiến, mang lại độ chính xác cao hơn với số lượng tham số giảm so với các mô hình như YOLOv8 . Việc tối ưu hóa này giúp tăng tốc độ suy luận và giảm nhu cầu tính toán, giúp nó phù hợp để triển khai trên nhiều nền tảng khác nhau, từ thiết bị biên đến cơ sở hạ tầng đám mây. YOLO11 hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm phát hiện đối tượng , phân đoạn thể hiện , phân loại hình ảnhước tính tư thế . Mô hình có sẵn trên GitHub .

Tiêu chuẩn và số liệu hiệu suất:

YOLO11 thể hiện điểm số Độ chính xác trung bình (mAP) ấn tượng trên các kích thước mô hình khác nhau. Ví dụ, YOLO11m đạt được mAPval50-95 là 51,5 ở kích thước hình ảnh 640, cân bằng hiệu quả tốc độ và độ chính xác. Các biến thể nhỏ hơn như YOLO11n và YOLO11s cung cấp suy luận thời gian thực nhanh hơn cho các ứng dụng ưu tiên tốc độ, trong khi các mô hình lớn hơn như YOLO11x tối đa hóa độ chính xác. Để biết số liệu hiệu suất YOLO chi tiết, hãy tham khảo Ultralytics tài liệu.

Các trường hợp sử dụng:

Độ chính xác và hiệu quả được nâng cao của YOLO11 làm cho nó trở nên lý tưởng cho các ứng dụng yêu cầu phát hiện đối tượng chính xác, thời gian thực, chẳng hạn như:

  • Robot : Để điều hướng chính xác và tương tác với vật thể trong môi trường năng động.
  • Hệ thống an ninh : Hệ thống báo động an ninh tiên tiến để phát hiện xâm nhập chính xác và giám sát toàn diện.
  • Phân tích bán lẻ : Sử dụng AI trong bán lẻ để cải thiện quản lý hàng tồn kho và phân tích sâu sắc hành vi của khách hàng.
  • Tự động hóa công nghiệp : Kiểm soát chất lượng chặt chẽ và phát hiện lỗi hiệu quả trong quy trình sản xuất.

Điểm mạnh:

  • Độ chính xác cao : Đạt được mAP hiện đại với kiến trúc tinh vi.
  • Suy luận hiệu quả : Xử lý nhanh phù hợp cho các ứng dụng thời gian thực.
  • Nhiệm vụ đa năng : Hỗ trợ phát hiện đối tượng, phân đoạn, phân loại và ước tính tư thế.
  • Khả năng mở rộng : Hoạt động hiệu quả trên nhiều phần cứng khác nhau, từ thiết bị biên đến hệ thống đám mây.

Điểm yếu:

  • Các mô hình lớn hơn có thể đòi hỏi nhiều tài nguyên tính toán hơn so với các mô hình nhỏ hơn được tối ưu hóa tốc độ.
  • Việc tối ưu hóa cho các thiết bị biên cụ thể có thể yêu cầu cấu hình triển khai mô hình bổ sung.

Tìm hiểu thêm về YOLO11

YOLOv7

YOLOv7, được giới thiệu vào tháng 7 năm 2022 bởi Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Academia Sinica, Đài Loan, được biết đến với các gói miễn phí có thể đào tạo được, thiết lập nên công nghệ tiên tiến mới cho các máy dò vật thể thời gian thực. Được trình bày chi tiết trong bài báo arXivkho lưu trữ GitHub , YOLOv7 nhấn mạnh vào tốc độ và hiệu quả trong khi vẫn duy trì độ chính xác cao trong các tác vụ phát hiện vật thể.

Kiến trúc và các tính năng chính:

YOLOv7 xây dựng dựa trên Efficient Layer Aggregation Network (ELAN) và giới thiệu Extended-ELAN (E-ELAN) để tăng cường khả năng học của mạng. Nó sử dụng các kỹ thuật như tham số hóa lại mô hình và gán nhãn động để cải thiện hiệu quả đào tạo và tốc độ suy luận. YOLOv7 được thiết kế để phát hiện đối tượng hiệu suất cao trên nhiều ứng dụng khác nhau.

Tiêu chuẩn và số liệu hiệu suất:

YOLOv7 chứng minh số liệu hiệu suất tuyệt vời, đạt mAP 51,4% trên tập dữ liệu COCO ở kích thước hình ảnh 640. Tốc độ của nó cũng đáng chú ý, với mô hình YOLOv7 cơ sở đạt 161 FPS trong suy luận lô 1. Để biết điểm chuẩn hiệu suất chi tiết, hãy tham khảo kho lưu trữ GitHub chính thức của YOLOv7 .

Các trường hợp sử dụng:

Sự cân bằng giữa tốc độ và độ chính xác của YOLOv7 khiến nó phù hợp với nhiều ứng dụng khác nhau, bao gồm:

  • Phát hiện đối tượng theo thời gian thực : Lý tưởng cho các ứng dụng yêu cầu phát hiện nhanh, chẳng hạn như lái xe tự động và phân tích video tốc độ cao.
  • Máy tính hiệu suất cao : Phù hợp với môi trường có sẵn tài nguyên tính toán và ưu tiên độ chính xác cao cùng tốc độ.
  • Nghiên cứu và Phát triển : Một mô hình cơ sở vững chắc cho nghiên cứu sâu hơn về kiến trúc phát hiện đối tượng và phương pháp đào tạo.

Điểm mạnh:

  • Tốc độ cao : Đạt được tốc độ suy luận ấn tượng, phù hợp với các hệ thống thời gian thực.
  • Độ chính xác tốt : Cung cấp điểm mAP cạnh tranh trên các tập dữ liệu chuẩn.
  • Kiến trúc hiệu quả : Sử dụng E-ELAN và tham số hóa lại mô hình để nâng cao hiệu suất.

Điểm yếu:

  • Có thể yêu cầu nhiều tài nguyên tính toán hơn so với các mô hình nhỏ hơn, mới hơn như YOLO11n cho các tình huống triển khai biên.
  • Kiến trúc này, mặc dù hiệu quả, nhưng kém linh hoạt hơn trong việc hỗ trợ các tác vụ thị giác đa dạng ngoài việc phát hiện đối tượng so với YOLO11 .

Tìm hiểu thêm về YOLOv7

Bảng so sánh mô hình

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Phần kết luận

Cả hai YOLO11 và YOLOv7 là các mô hình phát hiện đối tượng mạnh mẽ, mỗi mô hình có thế mạnh riêng. YOLO11 vượt trội về tính linh hoạt và hiệu quả, hỗ trợ nhiều tác vụ thị giác với độ chính xác và tốc độ tiên tiến, khiến nó trở thành lựa chọn mạnh mẽ cho nhiều ứng dụng và môi trường triển khai khác nhau. YOLOv7, mặc dù cũng hiệu quả, được tối ưu hóa đặc biệt để phát hiện đối tượng tốc độ cao, phù hợp với các ứng dụng thời gian thực và mục đích nghiên cứu. Sự lựa chọn giữa chúng phụ thuộc vào các yêu cầu cụ thể của dự án của bạn, cân bằng các yếu tố như tính linh hoạt của tác vụ, nhu cầu về độ chính xác và các ràng buộc triển khai.

Đối với người dùng quan tâm đến việc khám phá các mô hình khác, Ultralytics cũng cung cấp YOLOv8 , được biết đến với hiệu quả hợp lý và tính linh hoạt, và YOLOv5 , được sử dụng rộng rãi vì tốc độ và tính dễ sử dụng. Bạn cũng có thể cân nhắc so sánh YOLO11 với YOLOv9 hoặc khám phá các mô hình như RT-DETR cho các phương pháp tiếp cận kiến trúc khác nhau để phát hiện đối tượng.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận