YOLOv7 so với YOLOv8 So sánh kỹ thuật giữa các thiết bị dò thời gian thực
Sự phát triển nhanh chóng của thị giác máy tính đã tạo ra một loạt các công cụ mạnh mẽ cho các nhà phát triển và nhà nghiên cứu. Khi quyết định kiến trúc phù hợp cho một quy trình phát hiện đối tượng , việc so sánh các mô hình đã được thiết lập là điều cần thiết. Hướng dẫn kỹ thuật này sẽ đi sâu vào kiến trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng của hai mô hình có ảnh hưởng lớn: YOLOv7 Và Ultralytics YOLOv8 .
Giới thiệu về các kiến trúc
Cả hai mô hình đều thể hiện những bước tiến đáng kể về hiệu năng, nhưng chúng tiếp cận thách thức tối ưu hóa mạng nơ-ron sâu từ những triết lý cấu trúc khác nhau.
YOLOv7 Người tiên phong trong việc chia sẻ túi quà miễn phí
Được giới thiệu vào giữa năm 2022, YOLOv7 Tập trung mạnh vào tối ưu hóa đường dẫn gradient kiến trúc và khái niệm "túi quà tặng có thể huấn luyện" để đẩy giới hạn của việc phát hiện thời gian thực trên phần cứng cao cấp.
- Các tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
- Đơn vị tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Đài Loan
- Ngày: 06/07/2022
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
- Tài liệu: Tài liệu hướng dẫn sử dụng Ultralytics YOLOv7
Những điểm nổi bật về kiến trúc: YOLOv7 Mô hình này chủ yếu sử dụng đầu phát hiện dựa trên neo (mặc dù đã thử nghiệm với các nhánh không có neo) và giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Thiết kế này cải thiện khả năng học tập của mạng mà không làm phá hủy đường dẫn gradient ban đầu. Nó hoạt động cực kỳ tốt trên GPU cấp máy chủ, khiến nó rất phù hợp cho phân tích video chuyên sâu.
Điểm mạnh và điểm yếu: Trong khi YOLOv7 Mặc dù đạt được độ trễ tuyệt vời trên phần cứng chuyên dụng, hệ sinh thái của nó lại rất phân mảnh. Quá trình huấn luyện yêu cầu các đối số dòng lệnh phức tạp, sao chép kho lưu trữ thủ công và quản lý phụ thuộc nghiêm ngặt trong PyTorch . Hơn nữa, yêu cầu bộ nhớ trong quá trình huấn luyện có thể quá lớn đối với phần cứng của người dùng thông thường.
Ultralytics YOLOv8: Tiêu chuẩn Đa năng
Được phát hành vào đầu năm 2023, YOLOv8 Đã định nghĩa lại hoàn toàn trải nghiệm của nhà phát triển, tập trung không chỉ vào độ chính xác tiên tiến nhất mà còn vào việc cung cấp một khung làm việc thống nhất, sẵn sàng cho môi trường sản xuất.
- Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 10/01/2023
- GitHub: ultralytics / ultralytics
- Nền tảng: Ultralytics YOLOv8
Những điểm nổi bật về kiến trúc: YOLOv8 Đã giới thiệu một đầu phát hiện không cần neo (anchor-free) , loại bỏ nhu cầu cấu hình thủ công các hộp neo dựa trên tập dữ liệu MS COCO hoặc các phân bố dữ liệu tùy chỉnh. Nó tích hợp mô-đun C2f để cải thiện luồng gradient và sử dụng cấu trúc đầu tách rời, phân biệt các tác vụ nhận dạng đối tượng, phân loại và hồi quy. Điều này giúp tăng tốc độ hội tụ và nâng cao độ chính xác đáng kể.
Điểm mạnh và điểm yếu: YOLOv8 Tự hào sở hữu hiệu quả vượt trội về yêu cầu bộ nhớ . Nó yêu cầu ít hơn đáng kể. CUDA trí nhớ trong quá trình huấn luyện so với YOLOv7 và các mô hình transformer nặng hơn, cho phép các nhà phát triển sử dụng kích thước lô lớn hơn. Điểm mạnh chính của nó nằm ở tính linh hoạt , hỗ trợ natively phân đoạn đối tượng , phân loại hình ảnh , ước tính tư thế và hộp giới hạn định hướng (OBB) . Nhược điểm nhỏ duy nhất là các pipeline kế thừa cực kỳ chuyên biệt được xây dựng dành riêng cho nó. YOLOv7 Các tensor có thể cần một khoảng thời gian chỉnh sửa lại ngắn.
Lợi thế hệ sinh thái
Ultralytics YOLOv8 hưởng lợi từ một hệ sinh thái được duy trì tốt . Với sự trực quan Python Với API, quá trình phát triển tích cực và sự hỗ trợ mạnh mẽ từ cộng đồng, việc đưa một mô hình từ giai đoạn thử nghiệm cục bộ đến triển khai toàn cầu chỉ mất một phần nhỏ thời gian so với các kho lưu trữ độc lập.
So sánh hiệu suất chi tiết
Bảng sau đây phân tích các chỉ số hiệu suất trên các kích thước mô hình chính. Hãy chú ý đến sự cân bằng hiệu suất rõ rệt. YOLOv8 Đạt được điều này bằng cách tối ưu hóa mạnh mẽ khả năng suy luận nhanh trên các thiết bị biên trong khi vẫn duy trì độ chính xác hàng đầu thế giới.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Ghi chú: YOLOv8x đạt được mức cao nhất mAP trong nhóm này, trong khi YOLOv8n Nó vượt trội về hiệu quả tham số và tốc độ suy luận, trở thành nhà vô địch không thể tranh cãi trong việc triển khai thị giác máy tính trên các thiết bị AI biên .
Dễ sử dụng và Hiệu quả huấn luyện
Khi nói đến tính dễ sử dụng , Ultralytics YOLOv8 hoạt động ở một đẳng cấp riêng. Các kiến trúc cũ hơn như YOLOv7 Việc này đòi hỏi phải sao chép các kho lưu trữ cụ thể và chạy các tập lệnh dòng lệnh chi tiết để cấu hình các tập dữ liệu và đường dẫn.
Ngược lại, YOLOv8 'S ultralytics Gói phần mềm này mang đến trải nghiệm phát triển vô cùng tối ưu. Hiệu quả huấn luyện Hiệu suất được tối đa hóa thông qua việc tự động tải xuống dữ liệu, trọng số được huấn luyện sẵn sàng sử dụng và khả năng hoạt động liền mạch. khả năng xuất khẩu sang các định dạng như ONNX và TensorRT.
Đây là cách bạn có thể dễ dàng tải, huấn luyện và chạy suy luận bằng cách sử dụng... Ultralytics Python API:
from ultralytics import YOLO
# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()
Theo dõi thí nghiệm
YOLOv8 Tích hợp liền mạch với các công cụ MLops phổ biến như Weights & Biases và ClearML , cho phép bạn theo dõi quá trình tinh chỉnh siêu tham số và các chỉ số huấn luyện trong thời gian thực.
Các trường hợp sử dụng lý tưởng
Việc lựa chọn giữa các kiến trúc này thường phụ thuộc vào những ràng buộc cụ thể của môi trường triển khai của bạn.
Khi nào nên chọn YOLOv7
- So sánh chuẩn mực dựa trên dữ liệu cũ: Phù hợp cho các nhà nghiên cứu cần một mốc chuẩn cố định để so sánh với các tiêu chuẩn kiến trúc năm 2022.
- Cơ sở hạ tầng nặng nề hiện có: Môi trường được đầu tư mạnh vào NVIDIA GPU V100 hoặc A100, trong đó YOLOv7 đặc thù của tensor Các cấu hình được nhúng sâu vào quy trình C++ cũ.
Khi nào nên chọn YOLOv8
- Sản xuất đa nền tảng: Lý tưởng cho các nhóm cần triển khai liền mạch trên GPU đám mây, thiết bị di động và trình duyệt.
- Yêu cầu đa nhiệm: Nếu dự án của bạn cần vượt ra ngoài các hộp giới hạn và tận dụng mặt nạ phân đoạn đối tượng phong phú hoặc các điểm mấu chốt về tư thế .
- Vùng biên hạn chế tài nguyên: YOLOv8 Nano (
yolov8n(Phần mềm này cung cấp tỷ lệ độ chính xác trên tốc độ đáng kinh ngạc cho robot, máy bay không người lái và cảm biến IoT.)
Hướng tới tương lai: Bước nhảy vọt thế hệ đến YOLO26
Trong khi YOLOv8 Mặc dù vẫn là một lựa chọn rất mạnh mẽ, lĩnh vực thị giác máy tính đang phát triển nhanh chóng. Đối với các nhà phát triển bắt đầu các dự án hiệu năng cao hoàn toàn mới, Ultralytics Mới đây, họ đã giới thiệu thế hệ tiếp theo của các mô hình AI. Rất nên tìm hiểu cả YOLO11 đã được tinh chỉnh sâu sắc và YOLO26 mới ra mắt.
Ra mắt vào tháng 1 năm 2026, YOLO26 đã vượt qua mọi giới hạn về khả năng của các thiết bị biên:
- Thiết kế không cần NMS từ đầu đến cuối: YOLO26 được thiết kế từ đầu đến cuối, loại bỏ hoàn toàn hiện tượng Non-Maximum Suppression (NMS) ( NMS ) xử lý hậu kỳ. Điều này đảm bảo quy trình triển khai nhanh hơn đáng kể, đơn giản hơn mà không gặp phải các nút thắt cổ chai về độ trễ của các mô hình dự đoán dày đặc truyền thống.
- Loại bỏ DFL: Bằng cách loại bỏ hiện tượng suy hao tiêu điểm phân tán (Distribution Focal Loss - DFL), YOLO26 đạt được các tùy chọn triển khai mô hình đơn giản hơn nhiều và khả năng tương thích biên vượt trội.
- Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho các môi trường hạn chế tài nguyên như Raspberry Pi và các hệ thống nhúng, vượt trội hơn tất cả các thế hệ trước đó. CPU thông lượng.
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các mô hình huấn luyện Large Language Model (LLM), YOLO26 kết hợp một phương pháp lai ghép của... SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và khả năng hội tụ cực nhanh.
- ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ, điều cực kỳ quan trọng đối với ảnh chụp từ trên không, nông nghiệp tự động và robot.
Cho dù bạn đang mở rộng quy mô lên các cụm phân tích video khổng lồ với YOLOv8 Cho dù là đẩy khả năng suy luận đến các thiết bị biên nhỏ gọn với YOLO26 tiên tiến, Nền tảng Ultralytics cung cấp các công cụ để quản lý toàn bộ vòng đời AI của bạn một cách liền mạch.