YOLO11 so với YOLOv5 : So sánh kỹ thuật toàn diện của Ultralytics Kiến trúc
Việc lựa chọn kiến trúc mạng nơ-ron phù hợp là một quyết định then chốt đối với bất kỳ dự án thị giác máy tính nào. Khi lĩnh vực trí tuệ nhân tạo phát triển, các công cụ dành cho nhà phát triển và nhà nghiên cứu cũng vậy. Hướng dẫn toàn diện này cung cấp sự so sánh kỹ thuật chuyên sâu giữa hai mô hình nổi bật từ hệ sinh thái Ultralytics : mô hình được đánh giá cao và YOLOv5 và nâng cao YOLO11 .
Cho dù bạn đang triển khai các mô hình nhẹ cho các ứng dụng AI biên hay xử lý các luồng video độ phân giải cao trên GPU đám mây, việc hiểu rõ các sắc thái kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng cho các mô hình này sẽ đảm bảo bạn đưa ra lựa chọn dựa trên dữ liệu phù hợp với các ràng buộc triển khai cụ thể của mình.
Nguồn gốc và thông tin kỹ thuật của mẫu xe
Cả hai mô hình đều phản ánh cam kết của Ultralytics đối với sự hợp tác mã nguồn mở, hiệu suất mạnh mẽ và khả năng dễ sử dụng vượt trội, khiến chúng được cộng đồng học máy toàn cầu đặc biệt ưa chuộng.
YOLO11 Chi tiết
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 27/09/2024
- GitHub: ultralytics / ultralytics
- Tài liệu: Tài liệu hướng dẫn sử dụng YOLO11
YOLOv5 Chi tiết
- Tác giả: Glenn Jocher
- Tổ chức: Ultralytics
- Ngày: 26-06-2020
- GitHub: ultralytics / yolov5
- Tài liệu: Tài liệu YOLOv5
Sự khác biệt về kiến trúc
Sự tiến hóa từ YOLOv5 ĐẾN YOLO11 Giới thiệu một số thay đổi kiến trúc sâu sắc được thiết kế để tối ưu hóa độ chính xác và hiệu quả tham số.
YOLOv5 PyTorch là một công cụ tiên phong, giới thiệu kiến trúc mạng CSPNet (Cross Stage Partial Network) được tối ưu hóa cao và mạng PANet (Path Aggregation Network) ở phần cổ. Nó dựa trên phát hiện dựa trên neo, yêu cầu các hộp neo được xác định trước để dự đoán ranh giới đối tượng. Mặc dù rất hiệu quả, việc điều chỉnh các neo này cho các tập dữ liệu thị giác máy tính tùy chỉnh có thể khá phức tạp.
Ngược lại, YOLO11 Chuyển sang mô hình phát hiện không cần anchor hiện đại hơn. Điều này loại bỏ nhu cầu điều chỉnh anchor box thủ công, giúp đơn giản hóa quá trình huấn luyện và cải thiện khả năng khái quát hóa trên các tập dữ liệu đa dạng như tập dữ liệu COCO . Ngoài ra, YOLO11 Đặc điểm nổi bật là đầu xử lý được tách rời, nghĩa là các tác vụ phân loại và hồi quy hộp giới hạn được xử lý trong các nhánh riêng biệt. Sự tách biệt này cải thiện đáng kể tốc độ hội tụ và độ chính xác trung bình ( mAP ) , đặc biệt là đối với các kịch bản phát hiện đối tượng phức tạp.
Các chỉ số hiệu suất và điểm chuẩn
Bảng dưới đây so sánh các chỉ số chính giữa các kích thước mô hình khác nhau. Ultralytics Các mẫu máy này nổi tiếng về yêu cầu bộ nhớ, thường tiêu thụ ít hơn. CUDA so sánh với các giải pháp thay thế dựa trên Transformer nặng nề hơn, bộ nhớ được sử dụng trong quá trình huấn luyện sẽ giảm đáng kể rào cản phần cứng.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Như đã quan sát, YOLO11 đạt được sự cân bằng hiệu suất rất thuận lợi, luôn mang lại điểm mAP cao hơn ở số lượng tham số tương đương so với các đối tác YOLOv5 của nó.
Phương pháp luận đào tạo và Tính khả dụng
Một nguyên tắc cốt lõi trong triết lý của Ultralytics là khả năng sử dụng cực kỳ dễ dàng, được hỗ trợ bởi một hệ sinh thái được duy trì tốt và sự hỗ trợ cộng đồng rộng rãi.
YOLOv5 Trong lịch sử, nó dựa vào giao diện dòng lệnh mạnh mẽ ( CLI ) kịch bản (train.py, detect.py) để thực thi. Mặc dù mạnh mẽ, việc tích hợp trực tiếp các script này vào các ứng dụng python tùy chỉnh thường yêu cầu các giải pháp thay thế.
YOLO11 đã tạo ra một cuộc cách mạng bằng cách giới thiệu hệ thống được tinh giản. ultralytics Python gói. API thống nhất này xử lý mọi thứ từ đào tạo đến xuất khẩu mô hình các định dạng như ONNX, OpenVINO, và TensorRT bản địa.
Triển khai được tối ưu hóa với Ultralytics Nền tảng
Để có trải nghiệm hoàn toàn không cần lập trình, các nhà phát triển có thể sử dụng Nền tảng Ultralytics để chú thích dữ liệu, huấn luyện mô hình trên đám mây và triển khai chúng đến các thiết bị biên một cách liền mạch.
So sánh mã
Đào tạo một Ultralytics Mô hình hiện nay vô cùng hiệu quả. Dưới đây là cách bạn có thể huấn luyện. YOLO11 sử dụng bản địa của nó Python API:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")
Đối với các hệ thống cũ sử dụng YOLOv5 đào tạo thông qua CLI Trông như thế này:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt
Các trường hợp sử dụng lý tưởng và ứng dụng thực tế
Cả hai mô hình đều sở hữu những thế mạnh riêng biệt, phù hợp với các môi trường vận hành khác nhau.
Khi nào nên sử dụng YOLOv5
Mặc dù có thế hệ mới hơn, YOLOv5 vẫn là một cỗ máy mạnh mẽ. Nó được khuyến nghị cao cho:
- Tích hợp hệ thống cũ: Các môi trường được tích hợp sâu với cấu trúc tensor cụ thể của YOLOv5 hoặc các pipeline triển khai mà không thể dễ dàng tái cấu trúc.
- Academic Baselines: Dành cho các nhà nghiên cứu cần các mô hình cơ sở đã được thiết lập, tồn tại lâu đời cho các nghiên cứu học thuật có thể tái tạo trong phân tích hình ảnh y tế.
Khi nào nên sử dụng YOLO11
YOLO11 Nhờ tính linh hoạt vượt trội, đây là sự lựa chọn lý tưởng cho các dây chuyền sản xuất hiện đại:
- Môi trường đa nhiệm: Không giống như YOLOv5, vốn chủ yếu là một detector (với các bổ sung segmentation sau này), YOLO11 hỗ trợ nguyên bản phân đoạn đối tượng, phân loại hình ảnh, ước tính tư thế, và detect Hộp giới hạn định hướng (OBB) ngay khi sử dụng.
- Phân tích video mật độ cao: Lý tưởng cho các hệ thống giao thông thông minh hoặc quản lý hàng tồn kho bán lẻ, nơi việc trích xuất độ chính xác tối đa từ các cảnh phức tạp là rất quan trọng.
Hướng tới tương lai: Kiến trúc YOLO26
Trong khi YOLO11 Với tiêu chuẩn vượt trội, lĩnh vực thị giác máy tính vẫn tiếp tục phát triển nhanh chóng. Các nhà phát triển tìm kiếm hiệu quả tối ưu tuyệt đối cũng nên xem xét Ultralytics YOLO26 mới nhất (phát hành tháng 1 năm 2026).
YOLO26 đại diện cho một bước tiến vượt bậc, được thiết kế đặc biệt cho cả việc tối ưu hóa tại biên và quy mô doanh nghiệp. Các cải tiến chính bao gồm:
- Thiết kế loại bỏ NMS đầu cuối (End-to-End NMS-Free): YOLO26 có tính đầu cuối tự nhiên, loại bỏ hậu xử lý Non-Maximum Suppression (NMS) để triển khai nhanh hơn, đơn giản hơn.
- Loại bỏ DFL: Distribution Focal Loss đã được loại bỏ để đơn giản hóa việc xuất mô hình và tăng cường khả năng tương thích với thiết bị công suất thấp.
- Trình tối ưu hóa MuSGD: Một sự kết hợp lai đột phá giữa SGD và Muon, mang lại sự ổn định trong huấn luyện LLM cho thị giác máy tính để hội tụ nhanh hơn.
- Tăng tốc suy luận trên CPU lên đến 43%: Được tối ưu hóa mạnh mẽ cho các triển khai IoT và các thiết bị không có GPU chuyên dụng.
- ProgLoss + STAL: Các hàm mất mát được cải thiện đáng kể mang lại những cải tiến đáng kể trong nhận diện vật thể nhỏ, rất quan trọng đối với hình ảnh từ máy bay không người lái trên không.
Tóm tắt
Việc lựa chọn giữa YOLO11 và YOLOv5 cuối cùng phụ thuộc vào giai đoạn vòng đời của dự án của bạn. Di sản của YOLOv5 là không thể phủ nhận, mang lại sự ổn định cực cao và sự hỗ trợ mạnh mẽ từ cộng đồng. Tuy nhiên, đối với bất kỳ dự án mới nào, YOLO11 được khuyến nghị cao hơn các thế hệ cũ. Nó kết hợp độ chính xác tiên tiến, một API Python cực kỳ tinh tế và chi phí bộ nhớ huấn luyện thấp hơn, củng cố vị thế của Ultralytics ở vị trí dẫn đầu trong đổi mới AI. Đối với những người muốn vượt xa hơn nữa, việc khám phá YOLO26 tiên tiến trên Nền tảng Ultralytics sẽ mang lại kết quả vượt trội.