YOLOv6 -3.0 so với YOLO26: Sự tiến hóa của phát hiện đối tượng thời gian thực

Lĩnh vực thị giác máy tính được định hình bởi sự phát triển nhanh chóng, nơi các đột phá về kiến trúc liên tục định nghĩa lại những gì có thể thực hiện được trên cả thiết bị biên và máy chủ đám mây. Bài so sánh này khám phá hai cột mốc quan trọng trong hành trình này: YOLOv6 , một bộ dò công nghiệp mạnh mẽ từ Meituan, và YOLO26 , mô hình tiên tiến nhất hiện nay từ... Ultralytics Được thiết kế để đạt hiệu quả toàn diện.

YOLOv6 -3.0: Con ngựa thồ công nghiệp

Được phát hành vào đầu năm 2023, YOLOv6 -3.0 được thiết kế với một mục tiêu duy nhất: ứng dụng công nghiệp. Các nhà nghiên cứu tại Meituan đã tối ưu hóa mô hình này đặc biệt cho mục đích đó. GPU năng suất cao, khiến nó trở thành lựa chọn phổ biến cho các hệ thống sản xuất tốc độ cao và kiểm tra tự động chạy trên phần cứng như... NVIDIA Tesla T4.

Tổng quan về YOLOv6 -3.0
Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
Tổ chức: Meituan
Ngày: 13/01/2023
Arxiv: YOLOv6 v3.0: Tải lại toàn diện
GitHub: meituan/ YOLOv6

Các Tính Năng và Điểm Mạnh Chủ Yếu

Kiến trúc của YOLOv6 -3.0 tận dụng mô-đun Nối tiếp hai chiều (Bi-directional Concatenation - BiC) và chiến lược huấn luyện hỗ trợ neo (Aanchor-aided training - AAT). Điểm mạnh chính của nó nằm ở cấu trúc xương sống kiểu RepVGG , cho phép mô hình có các nhánh phức tạp trong quá trình huấn luyện nhưng hợp nhất thành một cấu trúc đơn giản, nhanh chóng trong quá trình suy luận.

Tối ưu hóa GPU : Mô hình được tinh chỉnh mạnh mẽ để triển khai trên TensorRT , hoạt động xuất sắc trong các trường hợp sử dụng GPU chuyên dụng. GPU tài nguyên.
Thân thiện với lượng tử hóa: Nó giới thiệu các kỹ thuật huấn luyện nhận biết lượng tử hóa (QAT) để duy trì độ chính xác cao ngay cả khi được nén đến độ chính xác INT8.
Tập trung vào môi trường công nghiệp: Được thiết kế đặc biệt cho các môi trường thực tế nơi yêu cầu độ trễ nghiêm ngặt nhưng phần cứng mạnh mẽ.

Tuy nhiên, sự tập trung này vào GPU kiến trúc có nghĩa là YOLOv6 -3.0 có thể kém hiệu quả hơn trên CPU - Chỉ có các thiết bị này so với các mẫu mới hơn được thiết kế để tương thích với nhiều thiết bị ngoại vi hơn.

Tìm hiểu thêm về YOLOv6

YOLO26: Cuộc cách mạng điện toán biên toàn diện

Ra mắt vào tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho một bước đột phá trong kiến trúc phát hiện. Bằng cách loại bỏ nhu cầu về Non-Maximum Suppression ( NMS ) , YOLO26 hợp lý hóa toàn bộ quy trình triển khai, cung cấp trải nghiệm liền mạch từ đầu đến cuối, giảm thiểu sự biến động độ trễ và đơn giản hóa việc tích hợp.

Tổng quan về YOLO26
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 14/01/2026
Tài liệu: Tài liệu hướng dẫn sử dụng Ultralytics YOLO26
GitHub: ultralytics / ultralytics

Tính năng đột phá

YOLO26 kết hợp những cải tiến từ cả thị giác máy tính và huấn luyện Mô hình Ngôn ngữ Lớn (LLM) để đạt được hiệu suất vượt trội:

Thiết kế hoàn chỉnh từ đầu đến cuối - Không cần NMS : Dựa trên nền tảng của YOLOv10 , YOLO26 loại bỏ... NMS Xử lý hậu kỳ. Điều này giúp tốc độ suy luận nhanh hơn, mang tính xác định hơn và đơn giản hóa logic triển khai.
MuSGD Optimizer: Lấy cảm hứng từ Kimi K2 của Moonshot AI, đây là sự kết hợp của... SGD và Muon mang lại sự ổn định của quá trình huấn luyện LLM cho các tác vụ thị giác, đảm bảo sự hội tụ nhanh hơn.
Tốc độ suy luận CPU : Nhờ loại bỏ hàm mất mát tiêu điểm phân tán (DFL) và các lựa chọn kiến trúc được tối ưu hóa, YOLO26 nhanh hơn tới 43% trên CPU , trở thành lựa chọn lý tưởng cho IoT, thiết bị di động và robot.
ProgLoss + STAL: Các hàm mất mát nâng cao (Programmatic Loss và Soft-Target Anchor Loss) cải thiện đáng kể khả năng phát hiện vật thể nhỏ , một yêu cầu quan trọng đối với ảnh chụp từ trên không và an ninh.

Tìm hiểu thêm về YOLO26

So sánh Các chỉ số Hiệu suất

Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa hai kiến trúc. Trong khi đó, YOLOv6 -3.0 vẫn duy trì khả năng cạnh tranh trên GPU, YOLO26 thể hiện hiệu quả vượt trội, đặc biệt là trong CPU môi trường và cách sử dụng tham số.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Phân tích dữ liệu

YOLO26 đạt độ chính xác cao hơn đáng kể ( mAP ) với số tham số và số phép tính (FLOP) chỉ bằng khoảng một nửa so với các hệ thống tương đương. YOLOv6 các mẫu. Ví dụ, YOLO26 đạt 48,6. mAP chỉ với 9,5 triệu tham số, trong khi YOLOv6 -3.0s yêu cầu 18.5 triệu tham số để đạt 45.0 mAP .

Tìm hiểu sâu về kiến trúc

Sự khác biệt cơ bản giữa hai mô hình này nằm ở phương pháp dự đoán và tối ưu hóa của chúng.

YOLOv6 -3.0: Được tinh chỉnh cho GPU

YOLOv6 Nó sử dụng kiến trúc EfficientRep Backbone , có khả năng song song hóa cao trên GPU. Nó sử dụng chiến lược huấn luyện hỗ trợ anchor, kết hợp các mô hình dựa trên anchor và không dựa trên anchor để ổn định quá trình huấn luyện. Việc phụ thuộc nhiều vào các phép tích chập 3x3 giúp nó hoạt động cực kỳ nhanh trên phần cứng có khả năng tăng tốc các phép toán này, chẳng hạn như... NVIDIA T4, nhưng cấu trúc này có thể tốn nhiều tài nguyên tính toán trên các CPU hoặc NPU thiếu các tối ưu hóa cụ thể.

YOLO26: Tối ưu hóa cho mọi nền tảng

YOLO26 áp dụng cách tiếp cận phổ quát hơn. Bằng cách loại bỏ mô-đun Distribution Focal Loss (DFL), lớp đầu ra được đơn giản hóa, giúp xuất sang các định dạng như CoreML và TFLite dễ dàng hơn.

Thiết kế hoàn chỉnh từ đầu đến cuối không cần hệ thống quản lý mạng NMS là tính năng nổi bật. Các bộ phát hiện đối tượng truyền thống tạo ra hàng nghìn hộp chồng chéo cần được lọc bằng các phương pháp khác. NMS Đây là một quy trình chậm và khó tối ưu hóa trên các bộ tăng tốc nhúng. YOLO26 sử dụng chiến lược gán kép trong quá trình huấn luyện, buộc mô hình phải dự đoán một hộp duy nhất, chính xác cho mỗi đối tượng, loại bỏ sự cần thiết phải... NMS hoàn toàn trong quá trình suy luận.

Lợi thế của Ultralytics

Trong khi YOLOv6 -3.0 là một kho lưu trữ mã nguồn mở mạnh mẽ, việc lựa chọn Ultralytics YOLO26 cung cấp quyền truy cập vào một hệ sinh thái toàn diện giúp đơn giản hóa toàn bộ vòng đời AI.

1. Trải nghiệm người dùng liền mạch

Ultralytics Ưu tiên trải nghiệm của nhà phát triển. Cho dù bạn đang sử dụng CLI hoặc Python Với SDK, việc huấn luyện một mô hình tiên tiến nhất hiện nay chỉ cần vài dòng mã. Quy trình "từ con số không đến chuyên gia" này trái ngược với các kho lưu trữ nghiên cứu thường yêu cầu thiết lập môi trường phức tạp và định dạng dữ liệu thủ công.

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer automatically engaged
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

2. Tính linh hoạt vượt trội

YOLOv6 -3.0 chủ yếu là một mô hình phát hiện đối tượng. Ngược lại, Ultralytics Khung phần mềm hỗ trợ nhiều tác vụ xử lý hình ảnh khác nhau. Nếu yêu cầu dự án của bạn chuyển từ phát hiện đối tượng sang phân đoạn đối tượng hoặc ước lượng tư thế , bạn có thể chuyển đổi tác vụ mà không cần thay đổi quy trình làm việc hoặc thư viện của mình.

3. Hiệu quả huấn luyện và trí nhớ

Ultralytics Các mô hình được tối ưu hóa để tuân thủ các hạn chế về phần cứng. YOLO26 thường yêu cầu ít hơn. CUDA Hiệu quả sử dụng bộ nhớ trong quá trình huấn luyện tốt hơn so với các kiến trúc cũ hơn hoặc các kiến trúc lai dựa trên Transformer như RT-DETR . Điều này cho phép các nhà phát triển huấn luyện với kích thước lô lớn hơn trên GPU cấp độ người tiêu dùng, đẩy nhanh chu kỳ nghiên cứu.

4. Hệ sinh thái mạnh mẽ

Nền tảng Ultralytics (trước đây là HUB) cung cấp giao diện dựa trên web để quản lý tập dữ liệu, huấn luyện mô hình trên đám mây và triển khai đến các thiết bị biên. Kết hợp với các tích hợp cho Weights & Biases , MLflow và các công cụ khác, YOLO26 phù hợp một cách tự nhiên với các quy trình MLOps hiện đại.

Kết luận: Bạn nên chọn mô hình nào?

Chọn YOLOv6-3.0 nếu:

Bạn đang triển khai độc quyền trên GPU NVIDIA T4 hoặc V100 .
Bạn có một hệ thống quản lý dữ liệu cũ được xây dựng dựa trên kiến trúc RepVGG.
Ứng dụng của bạn tập trung vào việc phát hiện vật thể trong môi trường công nghiệp được kiểm soát chặt chẽ, trong đó... CPU Hiệu suất không liên quan.

Chọn YOLO26 nếu:

Bạn cần đạt được sự cân bằng tốt nhất giữa tốc độ và độ chính xác trên nhiều loại phần cứng khác nhau. CPU , GPU (NPU, Di động).
Bạn cần NMS đầu cuối - khả năng suy luận miễn phí để đơn giản hóa logic triển khai.
Bạn đang làm việc với các thiết bị biên như Raspberry Pi, Jetson Nano hoặc điện thoại di động, nơi hiệu suất CPU là yếu tố cực kỳ quan trọng.
Bạn cần một giải pháp có khả năng đáp ứng nhu cầu trong tương lai, được hỗ trợ bởi bảo trì thường xuyên, tài liệu đầy đủ và một cộng đồng phát triển mạnh mẽ.
Dự án của bạn bao gồm các tác vụ phức tạp như OBB hoặc phân đoạn cùng với phát hiện.

Đối với hầu hết các nhà phát triển và doanh nghiệp bắt đầu các dự án mới hiện nay, YOLO26 mang lại tính linh hoạt, dễ sử dụng và hiệu năng vượt trội, trở thành lựa chọn được khuyến nghị cho các ứng dụng thị giác máy tính thế hệ tiếp theo.