YOLO26 vs YOLOv5 Bước tiến vượt bậc trong phát hiện đối tượng
Sự phát triển của thị giác máy tính được định hình bởi sự theo đuổi không ngừng nghỉ về tốc độ, độ chính xác và tính dễ tiếp cận. Việc lựa chọn kiến trúc phù hợp là rất quan trọng đối với sự thành công của bất kỳ dự án AI nào. Trong hướng dẫn toàn diện này, chúng tôi so sánh hai phiên bản đột phá từ... Ultralytics Hai hệ thống tiên phong YOLOv5 và hệ thống đột phá YOLO26 . Mặc dù cả hai đều có ảnh hưởng lớn đến lĩnh vực phát hiện đối tượng thời gian thực, nhưng công nghệ nền tảng của chúng phản ánh một sự thay đổi mô hình lớn trong cách mạng lưới thần kinh xử lý dữ liệu hình ảnh.
Tổng quan mô hình
Trước khi đi sâu vào các chi tiết kiến trúc tinh tế, chúng ta hãy cùng xác định những điểm cơ bản của cả hai mô hình.
Chi tiết YOLO26:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 14/01/2026
- GitHub: https://github.com/ ultralytics / ultralytics
- Tài liệu: Tài liệu hướng dẫn sử dụng YOLO26
YOLOv5 Chi tiết:
- Tác giả: Glenn Jocher
- Tổ chức: Ultralytics
- Ngày: 26/06/2020
- GitHub: https://github.com/ ultralytics / yolov5
- Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv5
Khám phá các lựa chọn khác
Trong khi hướng dẫn này tập trung vào YOLO26 và YOLOv5 Các nhà phát triển đang chuyển đổi hệ thống cũ cũng có thể quan tâm đến việc so sánh YOLO11 hoặc các công nghệ tiên phong khác. NMS - Kiến trúc tự do của YOLOv10 . Cả hai đều cung cấp những bước đệm tuyệt vời cho các môi trường triển khai cụ thể.
Đổi mới Kiến trúc
Khoảng cách sáu năm giữa YOLOv5 và YOLO26 đại diện cho một bước tiến vượt bậc trong nghiên cứu học sâu. YOLOv5 Nó đã phổ biến việc sử dụng rộng rãi PyTorch cho các mô hình thị giác, cung cấp một cơ chế phát hiện dựa trên điểm neo được tối ưu hóa cao, trở thành tiêu chuẩn ngành. Tuy nhiên, nó phụ thuộc nhiều vào phương pháp loại bỏ cực đại không đồng nhất (Non-Maximum Suppression - NMS ) trong quá trình xử lý hậu kỳ, điều này có thể gây ra tắc nghẽn độ trễ trên các thiết bị có tài nguyên hạn chế.
YOLO26 hoàn toàn định hình lại quy trình suy luận với thiết kế không cần NMS từ đầu đến cuối . Bằng cách loại bỏ nhu cầu về NMS Với khả năng xử lý hậu kỳ, YOLO26 mang lại logic triển khai nhanh hơn và đơn giản hơn nhiều, một khái niệm lần đầu tiên được tiên phong trong YOLOv10 nhưng đã được hoàn thiện ở đây. Hơn nữa, YOLO26 có tính năng Loại bỏ tổn hao tiêu điểm phân phối (DFL Removal - Distribution Focal Loss), giúp đơn giản hóa đáng kể đầu ra. Điều này giúp việc xuất mô hình sang các định dạng như ONNX và TensorRT trở nên cực kỳ mượt mà, đảm bảo khả năng tương thích tuyệt vời với các thiết bị biên và thiết bị công suất thấp.
Trong quá trình huấn luyện, YOLO26 sử dụng thuật toán tối ưu hóa MuSGD tiên tiến, một thuật toán lai giữa... SGD và Muon được lấy cảm hứng từ Kimi K2 của Moonshot AI . Điều này mang lại những cải tiến trong huấn luyện LLM vào lĩnh vực thị giác máy tính, đảm bảo quá trình huấn luyện cực kỳ ổn định và tốc độ hội tụ nhanh hơn đáng kể so với phương pháp truyền thống. SGD hoặc AdamW các công cụ tối ưu hóa được sử dụng trong YOLOv5 .
Hiệu suất và số liệu
Khi đánh giá các mô hình, sự cân bằng giữa độ chính xác trung bình ( mAP ) và tốc độ suy luận quyết định tính khả thi trong thực tế. YOLO26 được tối ưu hóa nguyên bản cho cả GPU cao cấp và CPU biên.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Các số liệu so sánh cho thấy sự cải thiện đáng kinh ngạc. Ví dụ, YOLO26n đạt được mAP 40,9 so với YOLOv5n28.0 của 's, đồng thời cung cấp Nhanh hơn tới 43% CPU suy luậnĐiều này khiến YOLO26 trở nên vượt trội hơn hẳn đối với các triển khai nhúng như... Raspberry Pi hoặc thiết bị di động. Trong khi YOLOv5 nắm giữ một lợi thế nhỏ về TensorRT GPU Xét về tốc độ trên thang đo Nano, sự đánh đổi về độ chính xác nghiêng hẳn về phía YOLO26.
Hệ sinh thái đào tạo và tính dễ sử dụng
Cả hai mẫu xe đều được hưởng lợi rất nhiều từ việc bảo trì tốt. Ultralytics Hệ sinh thái của họ mang đến trải nghiệm "từ con số không đến anh hùng" với quy trình được tối ưu hóa. Python API, tài liệu đầy đủ và sự hỗ trợ tích cực từ cộng đồng. Tuy nhiên, YOLO26 đưa hiệu quả đào tạo lên một tầm cao mới.
Ultralytics Các mô hình này luôn yêu cầu lượng bộ nhớ CUDA thấp hơn đáng kể trong quá trình huấn luyện so với các mô hình thay thế sử dụng nhiều transformer. YOLO26 khuếch đại điều này với các hàm mất mát ProgLoss + STAL . Những cải tiến này mang lại những cải thiện đáng kể trong nhận dạng đối tượng nhỏ mà không làm tăng đáng kể lượng bộ nhớ tiêu hao.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
Đoạn mã đơn giản này cho phép các nhà phát triển nhanh chóng thử nghiệm trên các tập dữ liệu tùy chỉnh , chuyển đổi liền mạch từ khâu thu thập dữ liệu sang mô hình sẵn sàng cho sản xuất.
Triển khai dễ dàng
Sử dụng nền tảng Ultralytics , bạn có thể tự động xuất các mô hình YOLO26 đã được huấn luyện sang các định dạng như CoreML hoặc TensorFlow Lite mà không cần viết một dòng mã chuyển đổi nào.
Tính linh hoạt và các trường hợp sử dụng lý tưởng
Khi nào nên sử dụng YOLOv5
YOLOv5 vẫn là một công cụ đáng tin cậy cho các hệ thống cũ. Nếu bạn có một quy trình công nghiệp hiện có liên kết chặt chẽ với các đầu ra dựa trên điểm neo, hoặc nếu bạn đang chạy suy luận trên các thiết bị NVIDIA Jetson cũ hơn với các tính năng đã lỗi thời và không thể thay đổi. TensorRT chồng, YOLOv5 Cung cấp một giải pháp ổn định, được ghi chép đầy đủ.
Khi nào nên sử dụng YOLO26?
YOLO26 là sự lựa chọn tối ưu cho các dự án thị giác máy tính hiện đại. Tính linh hoạt của nó vượt trội hơn hẳn so với người tiền nhiệm. Trong khi đó, YOLO26 lại là sự lựa chọn tối ưu cho các dự án thị giác máy tính hiện đại. Tính linh hoạt của nó vượt trội hơn hẳn so với người tiền nhiệm. YOLOv5 Tập trung chủ yếu vào phát hiện (với các bổ sung phân đoạn sau này), YOLO26 cung cấp hỗ trợ sâu rộng và nguyên bản cho Phân đoạn đối tượng , Ước tính tư thế , Phân loại hình ảnh và Hộp giới hạn định hướng (OBB) .
YOLO26 giới thiệu các cải tiến dành riêng cho từng tác vụ , chẳng hạn như hàm mất mát phân đoạn ngữ nghĩa chuyên dụng, ước lượng logarit xác suất dư (RLE) cho các điểm mấu chốt tư thế siêu chính xác và hàm mất mát góc nâng cao cho OBB để giải quyết các vấn đề ranh giới phức tạp.
- IoT biên và Robot: NMS - Kiến trúc miễn phí và nhanh hơn 43% CPU Khả năng suy luận giúp YOLO26 trở nên lý tưởng cho việc điều hướng robot thời gian thực và camera nhà thông minh.
- Ảnh chụp từ trên không: Các cải tiến của ProgLoss + STAL giúp việc phát hiện các vật thể nhỏ từ máy bay không người lái—như xe cộ trong bãi đỗ xe hoặc cây trồng trên đồng ruộng—trở nên đáng tin cậy hơn đáng kể.
- Phân tích video thời gian thực: Cho dù theo dõi vận động viên trong các chương trình phát sóng thể thao hay giám sát lưu lượng giao thông, sự cân bằng hiệu năng của YOLO26 đảm bảo khả năng thu hồi dữ liệu cao mà không làm mất khung hình.
Cuối cùng, Ultralytics cam kết xây dựng một hệ sinh thái dễ tiếp cận và hiệu suất cao đảm bảo quá trình chuyển đổi từ YOLOv5 Việc sử dụng YOLO26 diễn ra suôn sẻ, mở khóa những khả năng tiên tiến nhất cho cả nhà nghiên cứu và nhà phát triển.