Chuyển đến nội dung

YOLOv8 so với YOLOv6 -3.0: So sánh kỹ thuật

Việc lựa chọn mô hình phát hiện đối tượng tối ưu là một bước then chốt trong việc xây dựng các ứng dụng thị giác máy tính mạnh mẽ. Bài so sánh chi tiết này khám phá sự khác biệt về kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng cho Ultralytics YOLOv8YOLOv6 -3.0 . Mặc dù cả hai mô hình đều ra đời cùng thời điểm và hướng đến giải quyết các vấn đề tương tự, nhưng chúng có sự khác biệt đáng kể về triết lý thiết kế, tính linh hoạt và hệ sinh thái hỗ trợ.

Ultralytics YOLOv8

Tác giả : Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức : Ultralytics
Ngày : 2023-01-10
GitHub : https://github.com/ ultralytics / ultralytics
Tài liệu : https://docs. ultralytics .com/models/ yolov8 /

Ultralytics YOLOv8 đại diện cho một bước tiến đáng kể trong quá trình phát triển của YOLO Kiến trúc. Được thiết kế như một khuôn khổ thống nhất, nó hỗ trợ một loạt các tác vụ thị giác máy tính vượt ra ngoài phạm vi phát hiện đơn giản, bao gồm phân đoạn thực thể, ước lượng tư thế và phân loại. Thiết kế lấy người dùng làm trọng tâm, ưu tiên tính dễ sử dụng, giúp các nhà phát triển ở mọi trình độ kỹ năng đều có thể tiếp cận AI tiên tiến.

Kiến trúc và các tính năng chính

YOLOv8 Giới thiệu cơ chế phát hiện không cần neo , giúp đơn giản hóa phần đầu mô hình và giảm số lượng siêu tham số cần thiết cho quá trình huấn luyện. Phương pháp này cải thiện khả năng khái quát hóa trên các hình dạng và kích thước vật thể khác nhau. Kiến trúc này có xương sống và cổ hiện đại sử dụng mô-đun C2f, giúp tăng cường luồng gradient và tích hợp tính năng so với các phiên bản trước.

Điểm mạnh

  • Tính linh hoạt vô song : Không giống như nhiều đối thủ cạnh tranh, YOLOv8 không chỉ giới hạn ở việc phát hiện đối tượng . Nó hỗ trợ phân đoạn thực thể , phân loại hình ảnh , ước tính tư thế và các tác vụ hộp giới hạn định hướng (OBB) trong một cơ sở mã duy nhất.
  • Hiệu quả vượt trội : Như đã nêu trong các tiêu chuẩn hiệu suất, YOLOv8 đạt được độ chính xác cao hơn ( mAP ) với ít tham số và FLOP hơn. Điều này dẫn đến yêu cầu bộ nhớ thấp hơn trong cả quá trình đào tạo và suy luận, một lợi thế quan trọng so với các mô hình dựa trên bộ biến áp nặng hơn.
  • Dễ sử dụng : Mô hình được gói gọn trong API Python hợp lý và giao diện dòng lệnh ( CLI ), cho phép người dùng đào tạo, xác thực và triển khai các mô hình với mã tối thiểu.
  • Hệ sinh thái mạnh mẽ : Được hỗ trợ bởi Ultralytics , YOLOv8 được hưởng lợi từ các bản cập nhật liên tục, tài liệu đầy đủ và cộng đồng năng động. Điều này đảm bảo khả năng tồn tại lâu dài và hỗ trợ cho việc triển khai doanh nghiệp.

Điểm yếu

  • Phát hiện vật thể nhỏ : Mặc dù có khả năng cao, các máy dò một giai đoạn như YOLOv8 đôi khi có thể gặp khó khăn với các vật thể cực nhỏ hoặc bị che khuất so với các máy dò hai giai đoạn chuyên dụng, tốn kém về mặt tính toán.

Tìm hiểu thêm về YOLOv8

YOLOv6 -3.0

Tác giả : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
Tổ chức : Meituan
Ngày : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/ YOLOv6
Tài liệu : https://docs. ultralytics .com/models/yolov6/

YOLOv6 -3.0 là một nền tảng phát hiện đối tượng do Meituan phát triển, được thiết kế đặc biệt cho các ứng dụng công nghiệp, nơi tốc độ suy luận trên phần cứng chuyên dụng là ưu tiên hàng đầu. Nền tảng này tập trung vào việc tối ưu hóa sự cân bằng giữa tốc độ và độ chính xác, sử dụng các kỹ thuật tiên tiến để tối đa hóa GPU sử dụng.

Kiến trúc và các tính năng chính

Các YOLOv6 Kiến trúc này kết hợp thiết kế nhận biết phần cứng, sử dụng cấu trúc Rep-Block (tham số hóa lại) cho phép mạng có các nhánh phức tạp trong quá trình huấn luyện nhưng có thể được chuyển thành một cấu trúc đơn giản hơn, nhanh hơn trong quá trình suy luận. Nó cũng sử dụng chiến lược tự chắt lọc để tăng độ chính xác mà không phát sinh thêm chi phí suy luận.

Điểm mạnh

  • Tốc độ suy luận GPU : Mô hình được tối ưu hóa cao cho GPU hiệu suất, đặc biệt là trên NVIDIA phần cứng, khiến nó trở thành ứng cử viên sáng giá cho các tình huống công nghiệp có ngân sách độ trễ hạn chế.
  • Hỗ trợ lượng tử hóa : YOLOv6 nhấn mạnh hỗ trợ lượng tử hóa mô hình , cung cấp các công cụ để triển khai mô hình trên phần cứng với độ chính xác tính toán hạn chế.
  • Tối ưu hóa di động : Với các biến thể như YOLOv6Lite, khuôn khổ này cung cấp các giải pháp phù hợp cho thiết bị di động và CPU -điểm cuối dựa trên.

Điểm yếu

  • Phạm vi nhiệm vụ hạn chế : YOLOv6 chủ yếu tập trung vào phát hiện đối tượng. Nó thiếu hỗ trợ gốc, sẵn có cho phân đoạn, ước tính tư thế và theo dõi đặc trưng của Ultralytics hệ sinh thái.
  • Cường độ tài nguyên : Để đạt được độ chính xác tương đương với YOLOv8 , YOLOv6 các mô hình thường yêu cầu nhiều tham số và FLOP hơn đáng kể, dẫn đến chi phí tính toán cao hơn trong quá trình đào tạo.
  • Cộng đồng và Bảo trì : Mặc dù là mã nguồn mở, hệ sinh thái này ít hoạt động hơn so với Ultralytics , điều này có thể dẫn đến việc giải quyết vấn đề chậm hơn và ít nguồn lực đóng góp từ cộng đồng hơn.

Tìm hiểu thêm về YOLOv6

So sánh hiệu suất

Bảng sau đây trình bày so sánh trực tiếp các số liệu hiệu suất trên tập dữ liệu COCO . Dữ liệu này nhấn mạnh hiệu quả của Ultralytics YOLOv8 , luôn mang lại Độ chính xác trung bình ( mAP ) cao với độ phức tạp của mô hình được giảm thiểu.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv6 -3.0n64037.5-1.174.711.4
YOLOv6 -3.0 giây64045.0-2.6618.545.3
YOLOv6 -3,0m64050.0-5.2834.985.8
YOLOv6 -3.0l64052.8-8.9559.6150.7

Phân tích số liệu

  • Hiệu quả : YOLOv8 thể hiện hiệu quả tham số vượt trội. Ví dụ, YOLOv8s đạt được mức cạnh tranh 44,9 mAP chỉ với 11,2 triệu tham số, trong khi YOLOv6 -3.0s cần 18,5 triệu tham số— nhiều hơn 65% —để đạt được kết quả gần như giống hệt nhau mAP của 45.0. Điều này có nghĩa là chi phí lưu trữ thấp hơn và cập nhật nhanh hơn trên các thiết bị biên.
  • Tải tính toán : Tương tự như vậy, về mặt FLOP (Phép tính dấu chấm động), YOLOv8m hoạt động ở mức 78,9 tỷ FLOP so với YOLOv6 -3.0m của 85.8B, làm cho Ultralytics mô hình tính toán nhẹ hơn trong khi đạt được hiệu suất cao hơn mAP (50,2 so với 50,0).
  • Tốc độ : Trong khi YOLOv6 -3.0 cho thấy tốc độ suy luận thô nhanh hơn một chút trên GPU T4 do thiết kế nhận biết phần cứng chuyên dụng của nó, YOLOv8 cung cấp tuyệt vời CPU hiệu suất thông qua ONNX , rất quan trọng đối với các triển khai không có GPU.

Đào tạo và Khả năng sử dụng

Một trong những điểm khác biệt rõ ràng giữa các mô hình này là trải nghiệm của nhà phát triển. Ultralytics ưu tiên quy trình làm việc không gặp trở ngại, thể hiện rõ qua cách đào tạo và triển khai các mô hình.

Quy trình làm việc hợp nhất

Ultralytics cung cấp một API nhất quán cho tất cả các tác vụ. Cho dù bạn đang thực hiện phát hiện, phân đoạn hay ước tính tư thế, cú pháp vẫn giữ nguyên, giúp giảm đáng kể thời gian học tập.

Dễ sử dụng với Ultralytics

YOLOv8 có thể được tích hợp vào một dự án chỉ với một vài dòng mã. Python SDK tự động xử lý việc tải dữ liệu, tăng cường và thiết lập đường ống đào tạo.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Ngược lại, trong khi YOLOv6 mặc dù có hiệu quả, nhưng nó thường yêu cầu cấu hình thủ công và quản lý phụ thuộc nhiều hơn, điển hình của các kho lưu trữ học thuật, điều này có thể làm chậm quá trình tạo mẫu nhanh và tích hợp MLOps .

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn Ultralytics YOLOv8

  • Ứng dụng đa dạng : Khi dự án của bạn yêu cầu nhiều hơn là chỉ các hộp giới hạn—chẳng hạn như phân đoạn đối tượng hoặc ước tính các điểm chính— YOLOv8 Khả năng đa nhiệm là không thể thiếu.
  • Triển khai Edge và Cloud : Nhờ các chế độ xuất của nó, YOLOv8 triển khai liền mạch để TFLite , ONNX , CoreML , Và TensorRT , bao gồm mọi thứ từ điện thoại di động đến máy chủ đám mây.
  • Phát triển nhanh chóng : Đối với các nhóm cần lặp lại nhanh chóng, tài liệu mở rộng và sự hỗ trợ tích cực của cộng đồng sẽ giảm thiểu thời gian ngừng hoạt động và khắc phục sự cố.

Khi nào nên chọn YOLOv6 -3.0

  • Phần cứng công nghiệp cụ thể : Nếu môi trường triển khai của bạn được kiểm soát chặt chẽ và sử dụng phần cứng được hưởng lợi cụ thể từ kiến trúc Rep-Block (như một số GPU thiết lập), YOLOv6 có thể mang lại tốc độ tăng thêm không đáng kể.
  • Hệ thống kế thừa : Dành cho các đường ống hiện có đã được xây dựng xung quanh YOLOv6 định dạng đầu vào/đầu ra cụ thể của nơi mà việc tái cấu trúc là không khả thi.

Kết luận

Trong khi YOLOv6 vẫn là một đối thủ đáng gờm trong lĩnh vực phát hiện đối tượng công nghiệp, Ultralytics YOLOv8 cung cấp một giải pháp toàn diện, hiệu quả và bền vững hơn cho đại đa số các dự án thị giác máy tính. Khả năng mang lại độ chính xác vượt trội với ít tham số hơn, kết hợp với hệ sinh thái phát triển mạnh mẽ và hỗ trợ nhiều tác vụ thị giác, khiến nó trở thành lựa chọn được khuyến nghị cho cả nhà phát triển và nhà nghiên cứu.

Đối với những ai muốn khám phá công nghệ thị giác máy tính mới nhất, hãy cân nhắc xem qua YOLO11 , công nghệ này cải tiến hơn nữa hiệu quả và hiệu suất được thiết lập bởi YOLOv8 Ngoài ra, việc so sánh với các mô hình dựa trên máy biến áp như RT-DETR có thể cung cấp thêm thông tin chi tiết về kiến trúc phát hiện hiện đại.


Bình luận