Chuyển đến nội dung

YOLOv5 so với YOLO26: Sự phát triển của detect đối tượng thời gian thực

Sự phát triển của công nghệ nhận diện đối tượng đã được đánh dấu bằng những bước tiến vượt bậc về tốc độ, độ chính xác và tính dễ sử dụng. Bài so sánh này đi sâu vào YOLOv5 , mô hình huyền thoại đã phổ biến rộng rãi Trí tuệ Nhân tạo Thị giác, và YOLO26 , kiến ​​trúc hiện đại nhất từ ​​trước đến nay. Ultralytics Được thiết kế cho hiệu quả hoạt động ở biên thế hệ tiếp theo và hiệu năng toàn diện.

Cả hai mô hình đều đại diện cho những thời điểm quan trọng trong lịch sử thị giác máy tính. Trong khi đó, YOLOv5 Đã thiết lập tiêu chuẩn về khả năng sử dụng và sự chấp nhận của cộng đồng vào năm 2020, YOLO26 định nghĩa lại cục diện vào năm 2026 với giải pháp toàn diện. NMS - Kiến trúc không cần cấu trúc cố định, tối ưu hóa dựa trên LLM và khả năng vượt trội CPU tốc độ.

YOLOv5 : Món ăn được cộng đồng yêu thích nhất

YOLOv5 được phát hành vào tháng 6 năm 2020 bởi Ultralytics , đánh dấu một sự chuyển dịch hướng tới PyTorch - Phát triển ứng dụng gốc. Nó trở nên nổi tiếng không chỉ vì hiệu năng mà còn vì tính dễ sử dụng vượt trội, giúp cho thị giác máy tính tiên tiến trở nên dễ tiếp cận với các nhà phát triển và nhà nghiên cứu trên toàn thế giới.

Kiến trúc và Điểm mạnh

YOLOv5 Nó giới thiệu một kiến ​​trúc được tinh giản tập trung vào "Trải nghiệm người dùng" của AI. Kiến trúc này sử dụng mạng trục CSP-Darknet53 và mạng cổ Path Aggregation Network (PANet), giúp cải thiện sự lan truyền tính năng trên các quy mô khác nhau.

Các tính năng chính bao gồm:

  • Tăng cường dữ liệu bằng kỹ thuật ghép ảnh (Mosaic Data Augmentation): Một kỹ thuật huấn luyện kết hợp bốn hình ảnh thành một, cải thiện đáng kể khả năng của mô hình. detect các vật thể nhỏ và khái quát hóa chúng sang các ngữ cảnh mới.
  • Hộp neo tự học: Mô hình tự động học kích thước hộp neo tối ưu cho tập dữ liệu tùy chỉnh của bạn trước khi quá trình huấn luyện bắt đầu.
  • Dễ dàng triển khai: Hỗ trợ xuất dữ liệu gốc sang các định dạng như ONNX , CoreMLTFLite đã biến nó trở thành lựa chọn hàng đầu cho các ứng dụng di động và thiết bị biên.

Tìm hiểu thêm về YOLOv5

YOLO26: Tiêu chuẩn mới về hiệu quả

Ra mắt vào tháng 1 năm 2026, YOLO26 kế thừa những ưu điểm của các thế hệ trước nhưng mang đến những thay đổi kiến ​​trúc đột phá. Nó được thiết kế để trở thành mẫu máy "ưu tiên cạnh" hàng đầu, đặt trọng tâm vào... CPU Tăng tốc độ suy luận mà không làm giảm độ chính xác đã đạt được trong những năm gần đây.

Tính năng đột phá

YOLO26 tích hợp nhiều cải tiến tiên tiến, tạo nên sự khác biệt so với các sản phẩm truyền thống. YOLOv5 ngành kiến ​​​​trúc:

  1. Hoàn toàn từ đầu đến cuối ( NMS - Miễn phí): Không giống như YOLOv5 , điều này đòi hỏi sự triệt tiêu không tối đa ( NMS (Để lọc các hộp chồng chéo trong quá trình xử lý hậu kỳ, YOLO26 là hệ thống end-to-end nguyên bản. Điều này loại bỏ sự biến đổi độ trễ do gây ra bởi) NMS Điều này đảm bảo thời gian suy luận nhất quán, rất quan trọng đối với các hệ thống điều khiển thời gian thực trong robot và xe tự lái.
  2. Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ tính ổn định trong quá trình huấn luyện của các Mô hình Ngôn ngữ Lớn (LLM) như Kimi K2 của Moonshot AI, YOLO26 sử dụng bộ tối ưu hóa lai kết hợp SGD Với Muon. Điều này mang lại các đặc tính hội tụ LLM cho các tác vụ thị giác.
  3. Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss (DFL), cấu trúc mô hình được đơn giản hóa, dẫn đến việc xuất dữ liệu sạch hơn và khả năng tương thích tốt hơn với các thiết bị biên và bộ tăng tốc công suất thấp như Coral Edge TPU .
  4. ProgLoss + STAL: Các hàm mất mát mới (ProgLoss và STAL) mang lại những cải tiến đáng kể trong việc nhận dạng vật thể nhỏ, một điểm yếu truyền thống của nhiều bộ dò tìm thời gian thực.

Tìm hiểu thêm về YOLO26

Cân bằng hiệu suất

YOLO26 đạt được sự cân bằng đáng kể, mang lại khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ trước trong khi vẫn duy trì độ chính xác cao hơn. Điều này làm cho nó trở nên lý tưởng cho các thiết bị mà... GPU Nguồn lực khan hiếm hoặc không có sẵn.

So sánh kỹ thuật: Các chỉ số hiệu năng

Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa các nhóm. YOLOv5 và YOLO26. Trong khi YOLOv5 YOLO26 vẫn là một mô hình có khả năng hoạt động tốt, thể hiện hiệu quả và độ chính xác vượt trội trên mọi quy mô mô hình.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Lưu ý: Tốc độ tăng đáng kể trong YOLO26 trên CPU ( ONNX Điều này là nhờ vào kiến ​​trúc được tinh giản và việc loại bỏ các bước xử lý hậu kỳ phức tạp.

Phương pháp luận đào tạo và Hệ sinh thái

Một lợi thế lớn của việc lựa chọn Ultralytics các mô hình là hệ sinh thái chung. Chuyển đổi từ YOLOv5 Việc chuyển đổi từ YOLO26 sang YOLO26 diễn ra liền mạch vì cả hai đều được hỗ trợ bởi cùng một hệ điều hành. ultralytics Python gói hàng và Nền tảng Ultralytics.

Dễ sử dụng và API

Cả hai mô hình đều tận dụng API thống nhất giúp đơn giản hóa toàn bộ vòng đời AI. Cho dù bạn đang sử dụng... CLI hoặc Python Cú pháp vẫn dễ hiểu.

from ultralytics import YOLO

# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt")  # Switch to 'yolov5s.pt' seamlessly

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Hiệu quả huấn luyện

YOLOv5 đã thiết lập tiêu chuẩn cho việc huấn luyện hiệu quả, giới thiệu các tính năng như "AutoBatch" để tối ưu hóa quá trình huấn luyện. GPU Việc tận dụng tối đa tài nguyên. YOLO26 còn tiến xa hơn với thuật toán tối ưu hóa MuSGD . Bằng cách ổn định động lực huấn luyện, YOLO26 thường hội tụ nhanh hơn, yêu cầu ít epoch hơn để đạt độ chính xác cao nhất. Điều này giúp giảm chi phí điện toán đám mây và rút ngắn chu kỳ lặp lại cho các nhà nghiên cứu.

Hơn nữa, yêu cầu bộ nhớ giảm của YOLO26 cho phép kích thước lô lớn hơn trên phần cứng cấp người tiêu dùng so với các kiến ​​trúc nặng về bộ biến đổi như RT-DETR .

Các ứng dụng thực tế

Việc lựa chọn giữa các mô hình này thường phụ thuộc vào phần cứng triển khai và các yêu cầu cụ thể của từng trường hợp sử dụng.

Điện toán biên và IoT

Đối với các ứng dụng chạy trên Raspberry Pi hoặc điện thoại di động, YOLO26 là lựa chọn vượt trội. Nó có tốc độ suy luận CPU nhanh hơn tới 43% và loại bỏ... NMS Điều này giúp nó phản hồi cực kỳ nhanh chóng đối với các tác vụ như quản lý bãi đỗ xe thông minh hoặc quét kho hàng bằng thiết bị cầm tay. Việc loại bỏ hiện tượng suy hao tiêu điểm phân phối (DFL) cũng đơn giản hóa quá trình chuyển đổi sang lượng tử hóa số nguyên cho bộ vi điều khiển.

Robot và Hệ thống tự hành

Trong lĩnh vực robot học, tính nhất quán về độ trễ là yếu tố then chốt. Thiết kế không phụ thuộc vào hệ thống quản lý mạng NMS từ đầu đến cuối của YOLO26 đảm bảo thời gian suy luận là xác định, tránh được thời gian xử lý thay đổi do các yếu tố khác gây ra. NMS Khi khung cảnh trở nên đông đúc. Độ tin cậy này rất quan trọng đối với các hệ thống điều hướng tự động và tránh va chạm.

Hỗ trợ hệ thống cũ

YOLOv5 vẫn là một lựa chọn mạnh mẽ cho các hệ thống cũ, nơi quy trình triển khai đã được xác định rõ ràng. YOLOv5 kiến trúc (ví dụ: cụ thể) tensor (các hình dạng được mong đợi bởi các luồng bit FPGA cũ hơn). Sự hỗ trợ mạnh mẽ từ cộng đồng và nhiều năm thử nghiệm thực tế đồng nghĩa với việc các giải pháp cho hầu hết mọi trường hợp ngoại lệ đều có sẵn trên các diễn đàn và các vấn đề trên GitHub.

Tính linh hoạt: Vượt xa mọi sự phát hiện

Trong khi YOLOv5 Được mở rộng để hỗ trợ phân đoạn trong các phiên bản sau (v7.0), YOLO26 được xây dựng từ đầu như một hệ thống học đa nhiệm.

  • Phân đoạn đối tượng: YOLO26 bao gồm các cải tiến dành riêng cho từng tác vụ như tổn thất phân đoạn ngữ nghĩa và các mô-đun nguyên mẫu đa tỷ lệ, nâng cao chất lượng mặt nạ cho các tác vụ như phân tích hình ảnh y tế .
  • Ước lượng tư thế: Với phương pháp ước lượng logarit xác suất dư (RLE), YOLO26 cung cấp độ chính xác điểm mấu chốt vượt trội cho việc ước lượng tư thế người trong phân tích thể thao.
  • Hộp giới hạn định hướng (OBB): Đối với ảnh chụp từ trên không và dữ liệu vệ tinh, thuật toán suy hao góc chuyên dụng của YOLO26 giải quyết các vấn đề về ranh giới thường gặp trong phát hiện đối tượng xoay, giúp nó vượt trội hơn trong các tác vụ OBB .

Kết luận

Cả hai YOLOv5 và YOLO26 là những ví dụ điển hình Ultralytics Với cam kết làm cho AI trở nên dễ sử dụng, nhanh chóng và chính xác, YOLOv5 vẫn là một công cụ kinh điển, đáng tin cậy với tầm ảnh hưởng lớn trong ngành. Tuy nhiên, đối với các dự án mới trong năm 2026, YOLO26 mang đến một lộ trình nâng cấp đầy hứa hẹn.

Với thiết kế không cần NMS , trình tối ưu hóa MuSGDhiệu năng CPU vượt trội , YOLO26 không chỉ là một bản cập nhật nhỏ; nó là một bước tiến vượt bậc cho trí tuệ nhân tạo biên. Bằng cách hợp nhất phát hiện, phân đoạn, tư thế và phân loại vào một khung làm việc hiệu quả duy nhất, Ultralytics Đảm bảo các nhà phát triển có những công cụ tốt nhất để giải quyết các thách thức về thị giác máy tính trong tương lai ngay hôm nay.

Đối với các nhà phát triển quan tâm đến việc khám phá các kiến ​​trúc hiện đại khác, mẫu YOLO11 cũng cung cấp hiệu năng tuyệt vời, mặc dù YOLO26 vẫn là lựa chọn hàng đầu nhờ sự cân bằng giữa tốc độ và các tính năng thế hệ mới.


Bình luận