Sự tiến hóa của công nghệ phát hiện đối tượng: YOLOv5 so với YOLOv7
Lĩnh vực thị giác máy tính đã phát triển nhanh chóng trong vài năm qua, được thúc đẩy bởi nhu cầu phát hiện đối tượng trong thời gian thực nhanh hơn và chính xác hơn. Khi lựa chọn kiến trúc phù hợp cho dự án thị giác máy tính của bạn, việc hiểu rõ sự khác biệt giữa các mô hình phổ biến như Ultralytics YOLOv5 và... là rất quan trọng. YOLOv7 Điều này rất quan trọng. Bản so sánh kỹ thuật toàn diện này đi sâu vào kiến trúc, phương pháp đào tạo, chỉ số hiệu suất và các kịch bản triển khai lý tưởng của chúng để giúp bạn đưa ra quyết định sáng suốt.
Tổng quan: Nguồn gốc mô hình
Việc hiểu rõ nguồn gốc và triết lý thiết kế đằng sau những mô hình này sẽ giúp hiểu được bối cảnh của các lựa chọn kiến trúc của chúng.
YOLOv5 Chi tiết:
- Tác giả: Glenn Jocher
- Tổ chức:Ultralytics
- Ngày: 2020-06-26
- GitHub:Kho lưu trữ YOLOv5
- Tài liệu:Tài liệu YOLOv5
YOLOv7 Chi tiết:
- Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
- Tổ chức:Viện Khoa học Thông tin, Academia Sinica, Đài Loan
- Ngày: 2022-07-06
- Arxiv:Bài báo YOLOv7
- GitHub:Kho lưu trữ YOLOv7
- Tài liệu:Tài liệu YOLOv7
Khám phá thêm nhiều kiểu kiến trúc khác
Bạn muốn biết các mô hình này so sánh với nhau như thế nào? Hãy xem các bài so sánh của chúng tôi như YOLOv5 vs YOLO11 hoặc YOLOv7 vs EfficientDet để mở rộng hiểu biết của bạn về hệ sinh thái phát hiện đối tượng.
Những đổi mới và khác biệt trong kiến trúc
YOLOv5 Tiêu chuẩn về khả năng tiếp cận
Được giới thiệu bởi Ultralytics vào năm 2020, YOLOv5 Nó đã tạo ra một sự thay đổi mang tính đột phá bằng cách sử dụng trực tiếp khung PyTorch , giúp giảm đáng kể rào cản gia nhập cho các nhà nghiên cứu và nhà phát triển. Kiến trúc của nó dựa trên mạng xương sống CSPDarknet53 được sửa đổi, tích hợp các mạng Cross Stage Partial (CSP) để giảm số lượng tham số trong khi vẫn duy trì luồng gradient.
Một trong những ưu điểm lớn nhất của nó là yêu cầu về bộ nhớ . So với các máy dò hai tầng cũ hơn hoặc các mẫu máy biến áp nặng như RT-DETR , YOLOv5 yêu cầu ít hơn đáng kể CUDA bộ nhớ được sử dụng trong quá trình huấn luyện, cho phép kích thước lô lớn hơn trên các GPU tiêu chuẩn dành cho người tiêu dùng. Hơn nữa, tính linh hoạt được tích hợp sẵn hỗ trợ phân loại hình ảnh , phát hiện đối tượng và phân đoạn hình ảnh một cách liền mạch.
YOLOv7 Vượt qua giới hạn về độ chính xác thời gian thực
Được phát hành vào giữa năm 2022, YOLOv7 Tập trung vào việc vượt qua các giới hạn tiên tiến nhất để phát hiện MS trong thời gian thực. COCO các tiêu chuẩn đánh giá. Các tác giả đã giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN), giúp cải thiện khả năng học tập của mạng mà không phá hủy đường dẫn gradient ban đầu.
YOLOv7 Nó cũng nổi tiếng với "kho tài nguyên miễn phí có thể huấn luyện", đặc biệt là các kỹ thuật tái tham số hóa trong quá trình huấn luyện, chuyển đổi nhiều mô-đun thành một lớp tích chập duy nhất để suy luận, giúp tăng tốc độ mà không làm giảm độ chính xác. Tuy nhiên, phương pháp huấn luyện phức tạp này thường dẫn đến đường cong học tập dốc hơn và quy trình xuất khẩu ít đơn giản hơn so với phương pháp gốc. Ultralytics hệ sinh thái.
So sánh hiệu suất
Khi đánh giá các mô hình này, sự cân bằng hiệu năng giữa tốc độ, độ chính xác và chi phí tính toán là vô cùng quan trọng. Dưới đây là bảng so sánh chi tiết các chỉ số hiệu năng của chúng dựa trên MS. COCO Bộ dữ liệu val2017.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Trong khi YOLOv7 đạt được giá trị tuyệt đối cao hơn mAP điểm số trên các biến thể lớn hơn, YOLOv5 Cung cấp một loạt các mẫu sản phẩm chưa từng có – từ Nano siêu nhẹ (YOLOv5n) dành cho các thiết bị biên ở vùng xa đến Extra-Large (YOLOv5x) dành cho suy luận đám mây.
Lợi thế Hệ sinh thái Ultralytics
Tính hữu dụng của một mô hình không chỉ nằm ở kiến trúc thô sơ của nó; hệ sinh thái xung quanh nó quyết định tốc độ triển khai vào môi trường sản xuất. Đây là điểm mấu chốt. Ultralytics Các người mẫu tỏa sáng.
- Dễ sử dụng: Nền tảng Ultralytics và sự thống nhất của nó. Python API cung cấp trải nghiệm người dùng được tối ưu hóa, cú pháp đơn giản và tài liệu đầy đủ. Việc huấn luyện một tập dữ liệu tùy chỉnh không yêu cầu bất kỳ đoạn mã lặp lại nào.
- Hệ sinh thái được duy trì tốt: Ultralytics Sản phẩm được hưởng lợi từ quá trình phát triển tích cực, cập nhật thường xuyên và sự hỗ trợ mạnh mẽ từ cộng đồng. Khả năng tích hợp với các công cụ như Comet ML và Weights & Biases được tích hợp sẵn.
- Hiệu quả đào tạo: Trình tải dữ liệu, bộ nhớ đệm thông minh và đa nhiệm. GPU hỗ trợ tạo ra Ultralytics Các mô hình đặc biệt hiệu quả trong việc huấn luyện. Trọng số được huấn luyện sẵn có giúp tăng tốc đáng kể quá trình học chuyển giao .
Ví dụ mã: Bắt đầu
Sử dụng Ultralytics Việc triển khai một mô hình chỉ cần một vài dòng mã. Sau đây là các bước tiếp theo: Python Đoạn mã này minh họa cách dễ dàng tải, huấn luyện và chạy suy luận bằng cách sử dụng phương pháp được đề xuất. ultralytics gói.
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()
Ngược lại, việc sử dụng phương pháp ban đầu YOLOv7 Việc xây dựng kho lưu trữ thường bao gồm sao chép các kho lưu trữ phức tạp, quản lý thủ công các phụ thuộc và sử dụng các đối số dòng lệnh dài dòng.
Ứng dụng thực tế và các trường hợp sử dụng lý tưởng
Khi nào nên chọn YOLOv7
YOLOv7 vẫn là ứng cử viên sáng giá cho việc đánh giá chuẩn mực học thuật hoặc các di sản cụ thể. GPU đường ống nơi đạt mức tối đa mAP là mục tiêu duy nhất và hệ thống đã được điều chỉnh phù hợp với các tensor đầu ra dựa trên neo của nó. Các nhà nghiên cứu khám phá phân tích đường dẫn gradient thường sử dụng YOLOv7 như một mức cơ bản.
Khi nào nên chọn YOLOv5
YOLOv5 Được ưa chuộng rộng rãi trong môi trường sản xuất nhờ tính ổn định vượt trội. Đây là sự lựa chọn hàng đầu cho:
- Điện toán di động và điện toán biên: Triển khai YOLOv5n cho iOS thông qua CoreML hoặc Android (Nguồn: TFLite )
- Các công ty khởi nghiệp linh hoạt: Các nhóm cần chu kỳ lặp lại nhanh chóng sẽ được hưởng lợi từ sự tích hợp liền mạch của Nền tảng Ultralytics để quản lý tập dữ liệu và đào tạo trên đám mây.
- Môi trường đa nhiệm: Các hệ thống yêu cầu phát hiện, phân loại và phân đoạn đối tượng đồng thời.
Tương lai: Chuyển sang YOLO26
Trong khi so sánh YOLOv5 Và YOLOv7 Đây là một bài tập tuyệt vời để hiểu về sự phát triển của trí tuệ nhân tạo thị giác, và công nghệ tiên tiến nhất vẫn tiếp tục tiến bộ. Được phát hành vào tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho một bước tiến vượt bậc, khiến các kiến trúc cũ trở nên lỗi thời đối với các dự án mới.
Đối với các nhà phát triển đang tìm kiếm hiệu năng tối ưu, YOLO26 mang đến một số lợi thế đột phá so với cả hai. YOLOv5 Và YOLOv7 :
- Thiết kế không cần NMS từ đầu đến cuối: Bằng cách loại bỏ quá trình xử lý hậu kỳ Non-Maximum Suppression, YOLO26 mang đến khả năng triển khai đơn giản hơn đáng kể và độ trễ nhanh hơn, ổn định hơn.
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ những cải tiến LLM của Moonshot AI, bộ tối ưu hóa lai này mang lại khả năng huấn luyện cực kỳ ổn định và hội tụ nhanh chóng.
- Tốc độ xử lý biên chưa từng có: Được tối ưu hóa đặc biệt cho môi trường biên, phiên bản nano tự hào có tốc độ suy luận CPU nhanh hơn tới 43% nhờ loại bỏ tổn hao tiêu điểm phân tán (DFL).
- Độ chính xác vượt trội: Các hàm mất mát mới như ProgLoss + STAL cải thiện đáng kể khả năng nhận dạng vật thể nhỏ, lý tưởng cho việc quay phim bằng máy bay không người lái và robot.
Cho dù bạn đang bảo trì một hệ thống hiện có hay không YOLOv5 Cho dù bạn đang xây dựng một pipeline hay muốn triển khai YOLO26 tiên tiến nhất, Nền tảng Ultralytics cung cấp tất cả các công cụ cần thiết để thành công trong lĩnh vực thị giác máy tính hiện đại.