Chuyển đến nội dung

YOLOv7 so với YOLOv8 So sánh kỹ thuật giữa các thiết bị dò thời gian thực

Sự phát triển nhanh chóng của thị giác máy tính đã tạo ra một loạt các công cụ mạnh mẽ cho các nhà phát triển và nhà nghiên cứu. Khi quyết định kiến ​​trúc phù hợp cho một quy trình phát hiện đối tượng , việc so sánh các mô hình đã được thiết lập là điều cần thiết. Hướng dẫn kỹ thuật này sẽ đi sâu vào kiến ​​trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng của hai mô hình có ảnh hưởng lớn: YOLOv7 Và Ultralytics YOLOv8 .

Giới thiệu về các kiến ​​trúc

Cả hai mô hình đều đại diện cho những bước nhảy vọt đáng kể về hiệu suất, nhưng chúng tiếp cận thách thức tối ưu hóa mạng nơ-ron sâu từ các triết lý cấu trúc khác nhau.

YOLOv7 Người tiên phong trong việc chia sẻ túi quà miễn phí

Được giới thiệu vào giữa năm 2022, YOLOv7 Tập trung mạnh vào tối ưu hóa đường dẫn gradient kiến ​​trúc và khái niệm "túi quà tặng có thể huấn luyện" để đẩy giới hạn của việc phát hiện thời gian thực trên phần cứng cao cấp.

Điểm nổi bật về kiến trúc: YOLOv7 chủ yếu sử dụng đầu detect dựa trên neo (mặc dù nó đã thử nghiệm với các nhánh không neo) và giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Thiết kế này cải thiện khả năng học của mạng mà không phá hủy đường dẫn gradient gốc. Nó hoạt động đặc biệt tốt trên các GPU cấp máy chủ, làm cho nó rất phù hợp cho các tác vụ phân tích video nặng.

Điểm mạnh và điểm yếu: YOLOv7 đạt độ trễ tuyệt vời trên phần cứng chuyên dụng, nhưng hệ sinh thái của nó lại bị phân mảnh cao. Việc huấn luyện yêu cầu các đối số dòng lệnh phức tạp, sao chép kho lưu trữ thủ công và quản lý phụ thuộc nghiêm ngặt trong PyTorch. Hơn nữa, yêu cầu bộ nhớ trong quá trình huấn luyện có thể quá cao đối với phần cứng tiêu dùng.

Tìm hiểu thêm về YOLOv7

Ultralytics YOLOv8: Tiêu chuẩn Đa năng

Được phát hành vào đầu năm 2023, YOLOv8 Đã định nghĩa lại hoàn toàn trải nghiệm của nhà phát triển, tập trung không chỉ vào độ chính xác tiên tiến nhất mà còn vào việc cung cấp một khung làm việc thống nhất, sẵn sàng cho môi trường sản xuất.

Điểm nổi bật về kiến trúc: YOLOv8 giới thiệu một đầu detect không neo nguyên bản, loại bỏ nhu cầu cấu hình thủ công các hộp neo dựa trên tập dữ liệu MS COCO hoặc phân phối dữ liệu tùy chỉnh. Nó tích hợp mô-đun C2f để cải thiện luồng gradient và sử dụng cấu trúc đầu tách rời để phân tách các tác vụ nhận dạng đối tượng, phân loại và hồi quy. Điều này đẩy nhanh đáng kể sự hội tụ và tăng cường độ chính xác.

Điểm mạnh và điểm yếu: YOLOv8 tự hào về hiệu quả Yêu cầu bộ nhớ vượt trội. Nó yêu cầu ít bộ nhớ CUDA hơn đáng kể trong quá trình huấn luyện so với YOLOv7 và các mô hình transformer nặng hơn, cho phép các nhà phát triển sử dụng kích thước batch lớn hơn. Điểm mạnh chính của nó nằm ở Tính linh hoạt, hỗ trợ nguyên bản segment instance, phân loại hình ảnh, ước tính tư thếHộp giới hạn định hướng (OBB). Nhược điểm nhỏ duy nhất là các pipeline kế thừa cực kỳ chuyên biệt được xây dựng dành riêng cho các tensor YOLOv7 có thể yêu cầu một thời gian refactoring ngắn.

Tìm hiểu thêm về YOLOv8

Lợi thế hệ sinh thái

Ultralytics YOLOv8 hưởng lợi từ một hệ sinh thái được duy trì tốt . Với sự trực quan Python Với API, quá trình phát triển tích cực và sự hỗ trợ mạnh mẽ từ cộng đồng, việc đưa một mô hình từ giai đoạn thử nghiệm cục bộ đến triển khai toàn cầu chỉ mất một phần nhỏ thời gian so với các kho lưu trữ độc lập.

So sánh hiệu suất chi tiết

Bảng sau đây phân tích các chỉ số hiệu suất trên các kích thước mô hình chính. Hãy chú ý đến sự cân bằng hiệu suất rõ rệt. YOLOv8 Đạt được điều này bằng cách tối ưu hóa mạnh mẽ khả năng suy luận nhanh trên các thiết bị biên trong khi vẫn duy trì độ chính xác hàng đầu thế giới.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Ghi chú: YOLOv8x đạt được mức cao nhất mAP trong nhóm này, trong khi YOLOv8n Nó vượt trội về hiệu quả tham số và tốc độ suy luận, trở thành nhà vô địch không thể tranh cãi trong việc triển khai thị giác máy tính trên các thiết bị AI biên .

Dễ sử dụng và Hiệu quả huấn luyện

Khi nói đến tính dễ sử dụng , Ultralytics YOLOv8 hoạt động ở một đẳng cấp riêng. Các kiến ​​trúc cũ hơn như YOLOv7 Việc này đòi hỏi phải sao chép các kho lưu trữ cụ thể và chạy các tập lệnh dòng lệnh chi tiết để cấu hình các tập dữ liệu và đường dẫn.

Ngược lại, của YOLOv8 ultralytics Gói phần mềm này mang đến trải nghiệm phát triển vô cùng tối ưu. Hiệu quả huấn luyện Hiệu suất được tối đa hóa thông qua việc tự động tải xuống dữ liệu, trọng số được huấn luyện sẵn sàng sử dụng và khả năng hoạt động liền mạch. khả năng xuất khẩu sang các định dạng như ONNXTensorRT.

Đây là cách bạn có thể dễ dàng tải, huấn luyện và chạy suy luận bằng cách sử dụng... Ultralytics Python API:

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

Theo dõi thí nghiệm

YOLOv8 Tích hợp liền mạch với các công cụ MLops phổ biến như Weights & BiasesClearML , cho phép bạn theo dõi quá trình tinh chỉnh siêu tham số và các chỉ số huấn luyện trong thời gian thực.

Các trường hợp sử dụng lý tưởng

Việc lựa chọn giữa các kiến trúc này thường phụ thuộc vào các ràng buộc cụ thể của môi trường triển khai của bạn.

Khi nào nên chọn YOLOv7

  • Đánh giá hiệu năng kế thừa: Phù hợp cho các nhà nghiên cứu cần một đường cơ sở cố định để so sánh với các tiêu chuẩn kiến trúc năm 2022.
  • Cơ sở hạ tầng nặng hiện có: Các môi trường đầu tư mạnh vào GPU NVIDIA V100 hoặc A100, nơi các cấu hình tensor cụ thể của YOLOv7 được nhúng sâu vào một pipeline C++ kế thừa.

Khi nào nên chọn YOLOv8

  • Sản xuất đa nền tảng: Lý tưởng cho các nhóm cần triển khai liền mạch trên các GPU đám mây, thiết bị di động và trình duyệt.
  • Yêu cầu đa nhiệm: Nếu dự án của bạn cần vượt ra ngoài các hộp giới hạn và tận dụng các mặt nạ phân đoạn đối tượng phong phú hoặc điểm chính tư thế.
  • Vùng biên hạn chế tài nguyên: YOLOv8 Nano (yolov8n) cung cấp tỷ lệ độ chính xác trên tốc độ đáng kinh ngạc cho robot, máy bay không người lái và cảm biến IoT.

Hướng tới tương lai: Bước nhảy vọt thế hệ đến YOLO26

Trong khi YOLOv8 Mặc dù vẫn là một lựa chọn rất mạnh mẽ, lĩnh vực thị giác máy tính đang phát triển nhanh chóng. Đối với các nhà phát triển bắt đầu các dự án hiệu năng cao hoàn toàn mới, Ultralytics Mới đây, họ đã giới thiệu thế hệ tiếp theo của các mô hình AI. Rất nên tìm hiểu cả YOLO11 đã được tinh chỉnh sâu sắc và YOLO26 mới ra mắt.

Ra mắt vào tháng 1 năm 2026, YOLO26 đã vượt qua mọi giới hạn về khả năng của các thiết bị biên:

  • Thiết kế loại bỏ NMS đầu cuối (End-to-End NMS-Free): YOLO26 có tính đầu cuối tự nhiên, loại bỏ hoàn toàn hậu xử lý Non-Maximum Suppression (NMS). Điều này đảm bảo các quy trình triển khai nhanh hơn, đơn giản hơn đáng kể mà không gặp phải các nút thắt cổ chai về độ trễ của các mô hình dự đoán dày đặc truyền thống.
  • Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss, YOLO26 đạt được các tùy chọn triển khai mô hình đơn giản hơn nhiều và khả năng tương thích biên vượt trội.
  • Suy luận trên CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho các môi trường hạn chế như Raspberry Pi và hệ thống nhúng, vượt trội hơn tất cả các thế hệ trước về thông lượng CPU.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các mô hình huấn luyện Mô hình Ngôn ngữ Lớn (LLM), YOLO26 tích hợp sự kết hợp giữa SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và khả năng hội tụ cực nhanh.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận diện vật thể nhỏ, điều này cực kỳ quan trọng đối với hình ảnh trên không, nông nghiệp tự động và robot.

Cho dù bạn đang mở rộng quy mô lên các cụm phân tích video khổng lồ với YOLOv8 Cho dù là đẩy khả năng suy luận đến các thiết bị biên nhỏ gọn với YOLO26 tiên tiến, Nền tảng Ultralytics cung cấp các công cụ để quản lý toàn bộ vòng đời AI của bạn một cách liền mạch.


Bình luận