Chuyển đến nội dung

YOLOv7 so với YOLOv5 Cân bằng giữa độ chính xác cao cấp và tính linh hoạt trong sản xuất

Việc lựa chọn kiến ​​trúc phát hiện đối tượng phù hợp thường liên quan đến việc cân bằng giữa hiệu năng học thuật thuần túy và tính dễ dàng triển khai thực tế. Bài so sánh chi tiết này sẽ khám phá hai cột mốc quan trọng trong lĩnh vực này. YOLO Họ hàng của YOLOv7 gồm: YOLOv7 , nổi tiếng với các tối ưu hóa kiến ​​trúc "khổng lồ", và YOLOv5 , huyền thoại. Ultralytics Mô hình này được đánh giá cao về tính dễ sử dụng, tốc độ và mức độ ứng dụng rộng rãi trong môi trường sản xuất.

Tóm tắt điều hành

Trong khi YOLOv7 đạt được độ chính xác cao hơn ( mAP ) trên COCO Thông qua các lựa chọn kiến ​​trúc phức tạp như E-ELAN, YOLOv5 vẫn là tiêu chuẩn ngành về khả năng sử dụng, mang đến trải nghiệm đào tạo hợp lý hơn, tiêu thụ tài nguyên thấp hơn và hỗ trợ triển khai rộng rãi hơn. Đối với các nhà phát triển bắt đầu các dự án mới vào năm 2026, cuộc thảo luận đã tự nhiên chuyển sang Ultralytics YOLO26 , kết hợp lợi ích về độ chính xác của v7 với khả năng sử dụng của v5, cùng với khả năng tích hợp đầu cuối gốc. NMS - suy luận tự do.

So sánh Các chỉ số Hiệu suất

Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa các biến thể chính. YOLOv7 nhắm đến phân khúc cao cấp GPU hiệu suất, trong khi YOLOv5 Cung cấp một loạt các mô hình chi tiết phù hợp với mọi thứ, từ thiết bị di động đến máy chủ đám mây.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv7 : Trung tâm kiến ​​trúc quyền lực

Được phát hành vào tháng 7 năm 2022 bởi các tác giả của YOLOv4, YOLOv7 đã giới thiệu một số khái niệm tiên tiến nhằm mục đích đẩy mạnh giới hạn về độ chính xác của việc phát hiện đối tượng trong thời gian thực.

Tìm hiểu thêm về YOLOv7

Các tính năng kiến trúc chính

  1. E-ELAN (Extended Efficient Layer Aggregation Network): Cấu trúc này cho phép mạng học được nhiều đặc điểm đa dạng hơn bằng cách kiểm soát các đường dẫn gradient ngắn nhất và dài nhất. Nó cải thiện khả năng học tập của mạng mà không phá hủy đường dẫn gradient ban đầu, dẫn đến độ chính xác cao hơn trong các cảnh phức tạp.
  2. Điều chỉnh tỷ lệ mô hình: Không giống như điều chỉnh tỷ lệ hợp chất tiêu chuẩn, YOLOv7 Điều chỉnh đồng thời chiều sâu và chiều rộng của khối, đảm bảo kiến ​​trúc tối ưu cho các ràng buộc tài nguyên khác nhau (ví dụ: YOLOv7 - Nhỏ so với... YOLOv7 -E6E).
  3. Mô hình "túi quà tặng có thể huấn luyện": Mô hình tích hợp các kỹ thuật tái tham số hóa đã được lên kế hoạch, giúp tối ưu hóa cấu trúc mô hình trong quá trình huấn luyện nhưng đơn giản hóa nó trong quá trình suy luận, từ đó tăng tốc độ một cách hiệu quả mà không làm giảm độ chính xác.

Các trường hợp sử dụng lý tưởng cho YOLOv7

YOLOv7 Xuất sắc trong nghiên cứu học thuật và các ứng dụng công nghiệp cao cấp, nơi mà từng phần trăm điểm đều vô cùng quan trọng. mAP các số liệu như hệ thống an toàn cho xe tự lái hoặc phát hiện các khuyết tật nhỏ trong hình ảnh sản xuất độ phân giải cao.

YOLOv5: Tiêu chuẩn sản xuất

YOLOv5 , được phát triển bởi Ultralytics Nó đã cách mạng hóa lĩnh vực này không chỉ thông qua kiến ​​trúc, mà còn bằng cách ưu tiên trải nghiệm của nhà phát triển . Đây là hệ điều hành đầu tiên YOLO mô hình được triển khai nguyên bản trong PyTorch , giúp nó trở nên dễ tiếp cận với một cộng đồng khổng lồ. Python các nhà phát triển.

  • Tác giả: Glenn Jocher
  • Tổ chức:Ultralytics
  • Ngày: 2020-06-26
  • Kho lưu trữ:GitHub

Tìm hiểu thêm về YOLOv5

Lý do các nhà phát triển chọn YOLOv5

  • Tính linh hoạt vượt trội: Trong khi YOLOv7 Tập trung chủ yếu vào việc phát hiện. YOLOv5 Hỗ trợ phân đoạn đối tượngphân loại hình ảnh ngay từ đầu.
  • Dung lượng bộ nhớ thấp: YOLOv5 có hiệu quả cao với CUDA bộ nhớ, cho phép kích thước lô lớn hơn trên phần cứng dành cho người tiêu dùng so với các mô hình dựa trên bộ chuyển đổi hoặc các kiến ​​trúc nặng hơn.
  • Hệ sinh thái triển khai: Cung cấp khả năng xuất khẩu liền mạch sang... ONNX , CoreML , TFLite , Và TensorRT , điều này khiến nó trở thành lựa chọn hàng đầu cho các ứng dụng di động và thiết bị biên như NVIDIA Jetson .

Lợi thế của Ultralytics: Hệ sinh thái và khả năng sử dụng

Khi so sánh các mô hình này, hệ sinh thái xung quanh thường quan trọng không kém gì chính kiến ​​trúc của chúng. Ultralytics mô hình ( YOLOv5 và YOLO26 mới hơn) đều được hưởng lợi từ một nền tảng thống nhất, được bảo trì tốt.

Dễ sử dụng và Hiệu quả huấn luyện

Việc huấn luyện một mô hình không nên đòi hỏi bằng tiến sĩ về khoa học máy tính. Ultralytics cung cấp một cách đơn giản Python API giúp chuẩn hóa quy trình làm việc. Bạn có thể chuyển đổi từ việc đào tạo một... YOLOv5 Chuyển đổi mô hình sang mô hình YOLO11 hoặc YOLO26 bằng cách thay đổi một đối số chuỗi duy nhất.

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Nền tảng tích hợp

Người dùng của Ultralytics Các mô hình có quyền truy cập vào Nền tảng Ultralytics , một trung tâm dựa trên web để quản lý tập dữ liệu, chú thích tự động và triển khai mô hình chỉ bằng một cú nhấp chuột. Sự tích hợp hệ sinh thái này giúp giảm đáng kể thời gian đưa sản phẩm thị giác máy tính ra thị trường so với việc quản lý các kho dữ liệu thô.

Đảm bảo tương lai với YOLO26

Trong khi YOLOv7 Và YOLOv5 Để duy trì khả năng cạnh tranh, lĩnh vực thị giác máy tính đang phát triển nhanh chóng. Đối với các dự án mới, Ultralytics YOLO26 mang lại những lợi thế đáng kể so với cả hai thế hệ tiền nhiệm.

Ra mắt vào tháng 1 năm 2026, YOLO26 khắc phục những hạn chế cụ thể của các thế hệ trước:

  • NMS từ đầu đến cuối - Miễn phí: Không giống như YOLOv5 và v7, yêu cầu Không triệt tiêu tối đa ( NMS (Không cần xử lý hậu kỳ), YOLO26 là hệ thống end-to-end nguyên bản. Điều này giúp mã nguồn sạch hơn và suy luận nhanh hơn, đặc biệt là trên các thiết bị biên, nơi mà...) NMS là một điểm nghẽn.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ sự ổn định của quá trình huấn luyện LLM, bộ tối ưu hóa mới này đảm bảo tốc độ hội tụ nhanh hơn so với bộ tối ưu hóa tiêu chuẩn. SGD Được sử dụng trong phiên bản v5/v7.
  • Tối ưu hóa tại biên: Bằng cách loại bỏ hiện tượng mất tiêu điểm phân tán (DFL), YOLO26 nhanh hơn tới 43% trên CPU , giúp nó vượt trội hơn cho việc triển khai trên thiết bị di động .
  • Phát hiện vật thể nhỏ được cải tiến: Thông qua ProgLoss và STAL (Tự huấn luyện với học neo), nó vượt trội hơn. YOLOv7 Đối với các vật thể nhỏ, đây là yếu tố quan trọng đối với các nhiệm vụ chụp ảnh bằng máy bay không người lái và ảnh trên không.

Tìm hiểu thêm về YOLO26

Kết luận

YOLOv7 là một thành tựu kiến ​​trúc mạnh mẽ, cung cấp độ chính xác cao cho các nhà nghiên cứu và hiệu năng cao chuyên biệt. GPU Tuy nhiên, việc tập trung vào sự phức tạp kiểu "túi quà tặng miễn phí" có thể khiến việc sửa đổi và triển khai trở nên khó khăn hơn so với các phương pháp khác. Ultralytics mô hình.

YOLOv5 vẫn là huyền thoại trong ngành nhờ sự cân bằng hiệu năng , dễ sử dụng và tính linh hoạt đáng kinh ngạc trong các tác vụ như phát hiện, phân đoạn và phân loại. Đây là lựa chọn an toàn và đáng tin cậy cho nhiều hệ thống sản xuất cũ.

Đối với những ai tìm kiếm sự kết hợp hoàn hảo giữa độ chính xác cao và dễ sử dụng, chúng tôi khuyên dùng YOLO26 . Nó kết hợp tính thân thiện với người dùng. Ultralytics hệ sinh thái với những đổi mới tiên tiến như NMS - Suy luận miễn phí và tối ưu hóa MuSGD, đảm bảo ứng dụng của bạn nhanh, chính xác và có khả năng đáp ứng nhu cầu trong tương lai.

Đọc thêm


Bình luận