YOLOv8 so với YOLOv6 -3.0: So sánh kỹ thuật toàn diện
Lĩnh vực thị giác máy tính thời gian thực đang không ngừng phát triển, được thúc đẩy bởi nhu cầu về các mô hình nhanh hơn, chính xác hơn và linh hoạt hơn. Hai trong số những kiến trúc nổi bật nhất xuất hiện vào đầu năm 2023 là Ultralytics YOLOv8 và YOLOv6 -3.0 của Meituan. Cả hai mẫu đều đẩy giới hạn hiệu năng lên mức cao nhất, nhưng chúng phục vụ cho các triết lý phát triển và kịch bản triển khai hơi khác nhau.
Hướng dẫn toàn diện này cung cấp phân tích chuyên sâu về kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng của chúng, giúp các kỹ sư và nhà nghiên cứu máy học lựa chọn công cụ phù hợp cho dự án phát hiện đối tượng tiếp theo của họ.
Nguồn gốc và chi tiết của mẫu xe
Trước khi đi sâu vào các chi tiết kỹ thuật, điều quan trọng là phải hiểu nguồn gốc và các thông số kỹ thuật cốt lõi của cả hai mô hình. Cả hai kho lưu trữ đều tận dụng tối đa khung PyTorch phổ biến, nhưng sự tích hợp hệ sinh thái của chúng lại khác biệt đáng kể.
Chi tiết YOLOv8
Cái Ultralytics YOLOv8 Kiến trúc này đại diện cho một khung làm việc đa nhiệm thống nhất, được thiết kế từ đầu để mang lại trải nghiệm phát triển vượt trội và tính linh hoạt cao. Nó được xây dựng dựa trên nhiều năm nghiên cứu và phản hồi từ cộng đồng ở các phiên bản trước đó.
- Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 10/01/2023
- GitHub: https://github.com/ ultralytics / ultralytics
- Tài liệu yolov8 ultralytics
YOLOv6 -3.0 Chi tiết
Ban đầu được giới thiệu cho các ứng dụng công nghiệp tại Meituan, YOLOv6 Đã nhận được bản cập nhật lớn "Tải lại toàn diện" trong phiên bản 3.0. Bản cập nhật này chủ yếu nhắm vào các môi trường triển khai được tối ưu hóa cao, sử dụng các kỹ thuật như tự chưng cất và RepOptimizer.
- Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
- Tổ chức: Meituan
- Ngày: 13/01/2023
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: YOLOv6
- Tài liệu: ultralytics
Quản lý tinh gọn
Việc quản lý tập dữ liệu, các buổi huấn luyện và triển khai mô hình được đơn giản hóa đáng kể bằng cách sử dụng Nền tảng Ultralytics . Nó cung cấp một giao diện đầu cuối giúp giảm thiểu mã lặp lại thường cần thiết trong quy trình làm việc MLOps.
Kiến trúc và Phương pháp đào tạo
Cái Ultralytics YOLOv8 Ngành kiến trúc
YOLOv8 đã giới thiệu một đầu phát hiện không cần neo được tinh chỉnh cao. Bằng cách loại bỏ các hộp neo được xác định trước, mô hình tổng quát hóa tốt hơn trên các tập dữ liệu đa dạng và giảm số lượng thuật toán xử lý hậu kỳ. Hơn nữa, YOLOv8 Cung cấp sự cân bằng hiệu năng vượt trội, luôn đạt được sự cân bằng tối ưu giữa tốc độ và độ chính xác, phù hợp với nhiều kịch bản triển khai thực tế khác nhau—từ máy chủ đám mây đến các thiết bị biên có tài nguyên hạn chế.
Một lợi thế lớn của YOLOv8 Đó là yêu cầu về bộ nhớ của nó. Trong quá trình huấn luyện, Ultralytics các mô hình thể hiện mức thấp hơn đáng kể CUDA Mức sử dụng bộ nhớ thấp hơn so với các giải pháp thay thế dựa trên Transformer nặng nề như RT-DETR . Điều này cho phép các nhà phát triển sử dụng kích thước lô lớn hơn trên các GPU tiêu chuẩn dành cho người tiêu dùng, dẫn đến hiệu quả huấn luyện tuyệt vời.
Cái YOLOv6 -3.0 Kiến trúc
YOLOv6 -3.0 sử dụng mô-đun Ghép nối hai chiều (Bi-directional Concatenation - BiC) và chiến lược huấn luyện hỗ trợ neo (Aanchor-aided training - AAT). Đối với các mô hình nhỏ hơn (N và S), nó sử dụng EfficientRep Backbone, trong khi các biến thể lớn hơn (M và L) chuyển sang CSPStackRep Backbone. Kiến trúc này được tối ưu hóa mạnh mẽ cho việc thực thi NVIDIA TensorRT , giúp nó hoạt động cực kỳ nhanh khi được triển khai trên phần cứng tương thích. Tuy nhiên, sự liên kết chặt chẽ này với các tối ưu hóa phần cứng cụ thể đôi khi có thể khiến việc triển khai đa nền tảng trở nên cứng nhắc hơn một chút so với quy trình xuất ONNX linh hoạt vốn có của phiên bản trước. Ultralytics .
So sánh hiệu suất
Khi đánh giá các mô hình trên tập dữ liệu xác thực COCO , cả hai mô hình đều thể hiện hiệu suất đáng kể. Bảng dưới đây nêu bật các chỉ số chính.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Trong khi YOLOv6 -3.0 có lợi thế về tốc độ nhẹ ở một số khía cạnh cụ thể TensorRT tiêu chuẩn, YOLOv8 Cung cấp thiết kế hiệu quả hơn về tham số trong các danh mục nhỏ hơn, mang lại tính linh hoạt tốt hơn trên nhiều phần cứng khác nhau, bao gồm cả CPU di động và nhúng.
Hệ sinh thái và tính linh hoạt
Điểm khác biệt rõ rệt nhất giữa hai mô hình nằm ở khả năng hỗ trợ hệ sinh thái của chúng.
YOLOv6 Đây chủ yếu là một công cụ phát hiện hộp giới hạn. Ngược lại, YOLOv8 Được đánh giá cao nhờ tính linh hoạt . Trong một khuôn khổ thống nhất duy nhất, YOLOv8 Hỗ trợ đầy đủ các chức năng phân đoạn đối tượng , phân loại hình ảnh , ước lượng tư thế và phát hiện hộp giới hạn định hướng (OBB) .
Hơn nữa, tính dễ sử dụng của Ultralytics Hệ sinh thái này là vô song. Với một Python Thông qua API, các nhà nghiên cứu có thể bắt đầu quá trình huấn luyện, xác thực kết quả và xuất mô hình sang nhiều định dạng khác nhau mà không cần viết mã phức tạp. Hệ sinh thái được duy trì tốt đảm bảo sự phát triển tích cực, cập nhật thường xuyên và tích hợp liền mạch với các công cụ theo dõi thí nghiệm phổ biến.
Ví dụ mã: Huấn luyện YOLOv8
Đào tạo một YOLOv8 Mô hình này yêu cầu thiết lập tối thiểu, làm nổi bật thiết kế dễ tiếp cận của khung phần mềm:
from ultralytics import YOLO
# Load a pretrained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model on the COCO8 dataset
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Utilize GPU for efficient training
batch=32,
)
# Easily export to ONNX for cross-platform deployment
model.export(format="onnx")
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa YOLOv8 Và YOLOv6 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn YOLOv8
YOLOv8 là một lựa chọn tốt cho:
- Triển khai đa nhiệm linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh để phát hiện , phân đoạn , phân loại và ước tính tư thế trong phạm vi... Ultralytics hệ sinh thái.
- Hệ thống sản xuất hiện có: Môi trường sản xuất hiện tại đã được xây dựng trên hệ thống này. YOLOv8 kiến trúc với các quy trình triển khai ổn định, đã được kiểm thử kỹ lưỡng.
- Hỗ trợ cộng đồng và hệ sinh thái rộng rãi: Các ứng dụng được hưởng lợi từ YOLOv8 Hệ thống này có các hướng dẫn chi tiết, tích hợp với bên thứ ba và nguồn lực cộng đồng năng động.
Khi nào nên chọn YOLOv6
YOLOv6 được khuyến nghị cho:
- Triển khai có nhận thức về phần cứng công nghiệp: Các kịch bản trong đó thiết kế có nhận thức về phần cứng của mô hình và việc tái tham số hiệu quả cung cấp hiệu suất tối ưu trên phần cứng mục tiêu cụ thể.
- Phát hiện nhanh chóng trong một giai đoạn duy nhất: Các ứng dụng ưu tiên tốc độ suy luận thô trên GPU Dùng để xử lý video thời gian thực trong môi trường được kiểm soát.
- Tích hợp hệ sinh thái Meituan: Các nhóm hiện đang làm việc trong hệ sinh thái công nghệ và cơ sở hạ tầng triển khai của Meituan .
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Hướng tới tương lai: Nâng cấp lên YOLO26
Trong khi YOLOv8 Và YOLOv6 -3.0 là những lựa chọn tuyệt vời, các nhà phát triển bắt đầu các dự án mới được khuyến khích mạnh mẽ khám phá mô hình Ultralytics YOLO26 thế hệ tiếp theo. Được phát hành vào tháng 1 năm 2026, YOLO26 định nghĩa lại tiêu chuẩn cho AI thị giác ưu tiên thiết bị đầu cuối.
YOLO26 giới thiệu thiết kế không cần NMS từ đầu đến cuối , loại bỏ hoàn toàn nhu cầu sử dụng Non-Maximum Suppression trong quá trình xử lý hậu kỳ. Cách tiếp cận từ đầu đến cuối này đảm bảo logic triển khai nhanh hơn, đơn giản hơn, đặc biệt là trong môi trường biên. Kết hợp với DFL Removal (Distribution Focal Loss), phần đầu của mô hình nhẹ hơn đáng kể, dẫn đến suy luận CPU nhanh hơn tới 43% .
Tính ổn định và tốc độ hội tụ của quá trình huấn luyện cũng đã được nâng cấp đáng kể nhờ vào MuSGD Optimizer , một thuật toán lai giữa... SGD và Muon được lấy cảm hứng từ các phương pháp huấn luyện của LLM. Ngoài ra, việc giới thiệu ProgLoss + STAL giúp tăng cường đáng kể khả năng nhận dạng vật thể nhỏ, điều này rất quan trọng đối với hình ảnh từ máy bay không người lái và kiểm tra công nghiệp mật độ cao.
Các mô hình khác để xem xét
Tùy thuộc vào các ràng buộc cụ thể của bạn, bạn cũng có thể quan tâm đến việc khám phá YOLO11 cho các quy trình làm việc kế thừa có tính cân bằng cao hoặc YOLO -World cho các tác vụ phát hiện từ vựng mở, không cần huấn luyện lại nhiều.
Kết luận
Lựa chọn giữa YOLOv8 Và YOLOv6 -3.0 cuối cùng phụ thuộc vào các ưu tiên của quy trình triển khai của bạn. YOLOv6 -3.0 là một mô hình có khả năng cao dành cho các ứng dụng nghiêm ngặt. TensorRT môi trường nơi nguyên liệu thô GPU Tốc độ là ưu tiên tuyệt đối. Tuy nhiên, đối với phần lớn các nhóm, mô hình Ultralytics YOLOv8 là sự lựa chọn vượt trội. Sự kết hợp giữa yêu cầu bộ nhớ huấn luyện thấp hơn, tính linh hoạt đa nhiệm và hệ sinh thái hàng đầu trong ngành do Nền tảng Ultralytics cung cấp giúp giảm đáng kể thời gian đưa sản phẩm ra thị trường.
Đối với các nhà phát triển mong muốn đạt được hiệu quả tối ưu tuyệt đối trong thời đại hiện đại, việc chuyển đổi liền mạch sang YOLO26 mang lại một lợi thế chưa từng có. NMS - Trải nghiệm miễn phí giúp đảm bảo tính bền vững cho mọi ứng dụng thị giác máy tính trong tương lai.