Link to this sectionYOLOv9 so với YOLO11#
Sự phát triển nhanh chóng của thị giác máy tính đã liên tục đẩy giới hạn của những gì có thể thực hiện được trong phát hiện đối tượng thời gian thực. Khi so sánh các kiến trúc hàng đầu, YOLOv9 và Ultralytics YOLO11 nổi bật như những bước tiến đột phá, mỗi cái tên đáp ứng những nhu cầu kỹ thuật riêng biệt. YOLOv9 giới thiệu các phương pháp mới để bảo toàn dòng gradient trong quá trình huấn luyện mạng sâu, trong khi YOLO11 cách mạng hóa hệ sinh thái thị giác đa dụng với hiệu suất, tính linh hoạt và khả năng sử dụng vượt trội.
Bản so sánh kỹ thuật toàn diện này phân tích kiến trúc, các chỉ số hiệu suất, yêu cầu bộ nhớ và các kịch bản triển khai lý tưởng để giúp bạn chọn model tối ưu cho dự án AI tiếp theo của mình.
Mặc dù YOLOv9 và YOLO11 là những model tuyệt vời, nhưng YOLO26 mới ra mắt đại diện cho bước nhảy vọt tiếp theo. Nó có thiết kế end-to-end không cần NMS để đơn giản hóa việc triển khai, tốc độ suy luận trên CPU nhanh hơn tới 43%, và bộ tối ưu hóa MuSGD sáng tạo cho quá trình hội tụ nhanh chóng. Đối với tất cả các dự án sản xuất mới, YOLO26 rất được khuyến khích sử dụng.
Link to this sectionThông số kỹ thuật và Quyền tác giả#
Việc hiểu về dòng dõi của các model này cung cấp bối cảnh cần thiết cho các quyết định kiến trúc và các phụ thuộc framework của chúng.
Link to this sectionYOLOv9#
YOLOv9 mang đến trọng tâm học thuật mạnh mẽ về các điểm nghẽn thông tin trong học sâu, ưu tiên tối đa độ trung thực của đặc trưng thông qua các khối mạng tùy chỉnh.
- Tác giả: Chien-Yao Wang và Hong-Yuan Mark Liao
- Tổ chức: Institute of Information Science, Academia Sinica
- Ngày: 21 tháng 2 năm 2024
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
Link to this sectionUltralytics YOLO11#
YOLO11 được thiết kế từ đầu cho môi trường sản xuất, tập trung vào sự cân bằng giữa độ chính xác hàng đầu, tốc độ triển khai thực tế và tính linh hoạt đa tác vụ.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 27 tháng 9, 2024
- GitHub: https://github.com/ultralytics/ultralytics
Link to this sectionCải tiến kiến trúc#
Link to this sectionThông tin gradient lập trình được trong YOLOv9#
YOLOv9 giới thiệu khái niệm Thông tin Gradient Lập trình được (PGI) cùng với Mạng tổng hợp lớp hiệu quả tổng quát (GELAN). Khi các mạng thần kinh ngày càng sâu hơn, chúng thường gặp phải tình trạng nghẽn thông tin, nơi các chi tiết quan trọng bị mất trong quá trình truyền tiến. PGI giải quyết vấn đề này bằng cách cung cấp các bản cập nhật gradient đáng tin cậy giúp giữ lại thông tin không gian chi tiết, trong khi GELAN tối đa hóa hiệu quả tham số. Điều này giúp YOLOv9 đặc biệt phù hợp với các tác vụ yêu cầu độ trung thực đặc trưng cao, mặc dù nó dựa vào NMS (Non-Maximum Suppression) tiêu chuẩn trong quá trình hậu xử lý, điều này có thể gây ra độ trễ trên các thiết bị biên.
Link to this sectionHiệu quả tinh gọn trong YOLO11#
YOLO11 xây dựng dựa trên nhiều năm nghiên cứu nền tảng để cung cấp một kiến trúc được tối ưu hóa cao. Nó cải thiện các phiên bản trước bằng cách giảm chi phí tính toán trong khi tối đa hóa quá trình trích xuất đặc trưng. Không giống như các pipeline NMS truyền thống gây nghẽn hiệu suất CPU, YOLO11 sử dụng các đầu phát hiện (detection head) tinh chỉnh để đạt được sự cân bằng đáng kinh ngạc giữa độ trễ và độ chính xác. Hơn nữa, YOLO11 tự hào có mức sử dụng bộ nhớ thấp hơn đáng kể trong cả quá trình huấn luyện model và suy luận so với các model Transformer nặng nề, vốn thường mất nhiều thời gian để huấn luyện và yêu cầu lượng lớn bộ nhớ CUDA.
Link to this sectionSo sánh các chỉ số hiệu suất#
Khi so sánh các model này trên tập dữ liệu COCO tiêu chuẩn, cả hai đều thể hiện những khả năng đáng kinh ngạc, nhưng các sự đánh đổi xuất hiện giữa số lượng tham số thô và tốc độ vận hành.
Dưới đây là bảng phân tích chi tiết về Các chỉ số hiệu suất YOLO.
| Mô hình | kích thước (pixel) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this sectionPhân tích kết quả#
- Tốc độ và hiệu quả phần cứng: YOLO11 liên tục vượt trội hơn YOLOv9 về tốc độ suy luận. Ví dụ, YOLO11n đạt tốc độ 1.5ms đáng kinh ngạc trên GPU NVIDIA T4 sử dụng TensorRT, khiến nó cực kỳ khả thi cho các pipeline thời gian thực khắt khe.
- Yêu cầu tính toán: Các model YOLO11 thường yêu cầu ít FLOPs hơn (ví dụ: 68.0B cho YOLO11m so với 76.3B cho YOLOv9m), giúp tiêu thụ ít năng lượng hơn trên các thiết bị biên chạy bằng pin như Raspberry Pi hoặc phần cứng di động.
- Độ chính xác tương đương: Mặc dù YOLOv9e nhỉnh hơn YOLO11x một chút về mAP tuyệt đối (55.6 so với 54.7), YOLO11 đạt được độ chính xác cao nhất với độ trễ thấp hơn đáng kể (11.3ms so với 16.77ms), cho thấy sự cân bằng hiệu suất thuận lợi hơn cho các triển khai thực tế.
Link to this sectionHệ sinh thái và tính dễ sử dụng#
Mặc dù các chỉ số thô rất quan trọng, hệ sinh thái framework thường quyết định sự thành công của dự án. Đây là nơi Ưu thế của Ultralytics thực sự tỏa sáng.
Repository YOLOv9 gốc rất chuyên biệt, cung cấp các triển khai nghiên cứu tiên tiến. Tuy nhiên, Nền tảng Ultralytics và gói mã nguồn mở tương ứng của nó cung cấp trải nghiệm người dùng tinh gọn, API đơn giản và tài liệu mở rộng giúp giảm đáng kể thời gian đưa ra thị trường.
Link to this sectionTính linh hoạt đa tác vụ#
YOLOv9 tập trung chủ yếu vào phát hiện bbox. Ngược lại, YOLO11 là một nền tảng đa tác vụ mạnh mẽ hỗ trợ nguyên bản:
Link to this sectionTriển khai liền mạch#
Sử dụng hệ sinh thái Ultralytics cho phép các nhà phát triển xuất model liền mạch sang một loạt định dạng chỉ với một dòng mã Python. Cho dù nhắm mục tiêu đến ONNX, OpenVINO, TFLite hay CoreML, quá trình chuyển đổi từ huấn luyện sang sản xuất đều dễ dàng.
from ultralytics import YOLO
# Load a highly efficient YOLO11 model
model = YOLO("yolo11n.pt")
# Train rapidly on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to OpenVINO for Intel CPU acceleration
model.export(format="openvino")Link to this sectionCác trường hợp sử dụng lý tưởng#
Link to this sectionKhi nào nên sử dụng YOLOv9#
YOLOv9 là công cụ tuyệt vời cho các môi trường tập trung vào nghiên cứu hoặc các kịch bản ưu tiên độ trung thực đặc trưng cực cao, nơi độ trễ phần cứng không phải là ràng buộc chính. Kiến trúc GELAN của nó có thể rất hữu ích trong phân tích hình ảnh y tế, nơi việc phát hiện những thay đổi pixel nhỏ nhất là rất quan trọng.
Link to this sectionTại sao YOLO11 là lựa chọn vượt trội#
Đối với các nhà phát triển, kỹ sư và đội ngũ sản xuất, YOLO11 được đánh giá rất cao. Nó vượt trội trong các môi trường đòi hỏi triển khai tốc độ cao, có khả năng mở rộng:
- Phân tích bán lẻ thông minh: Theo dõi sản phẩm và khách hàng một cách liền mạch bằng cách sử dụng các bộ xử lý tiêu chuẩn Intel.
- Drone tự hành: Nơi các kiến trúc có FLOP thấp giúp bảo toàn tuổi thọ pin trong khi vẫn cung cấp khả năng phát hiện đối tượng nhỏ mạnh mẽ.
- Các dự án năng động: Các quy trình công việc có thể bắt đầu bằng phát hiện nhưng sau đó phát triển thành yêu cầu ước tính tư thế hoặc phân đoạn.
Link to this sectionHướng tới tương lai: Sự tiến hóa tiếp theo#
Mặc dù YOLO11 đại diện cho công nghệ hiện đại nhất trong thế hệ của nó, bối cảnh thị giác máy tính vẫn tiếp tục tiến bộ. Người dùng khám phá các giới hạn của AI cũng nên hướng tới YOLO26.
Tiên phong trong thiết kế end-to-end không cần NMS lần đầu tiên được khám phá trong YOLOv10, YOLO26 giới thiệu bộ tối ưu hóa MuSGD (kết hợp giữa SGD và Muon) cho sự ổn định huấn luyện chưa từng có. Với việc loại bỏ Distribution Focal Loss (DFL) để đơn giản hóa quá trình xuất, và các cơ chế mất mát tiên tiến như ProgLoss và STAL, YOLO26 đạt tốc độ suy luận trên CPU nhanh hơn tới 43%. Đối với các dự án hiện đại, nó cung cấp sự kết hợp tối thượng giữa đổi mới học thuật và độ tin cậy sẵn sàng cho sản xuất. Hơn nữa, các đội ngũ nâng cấp từ các hệ thống cũ như Ultralytics YOLOv8 sẽ thấy quá trình chuyển đổi sang YOLO26 hoặc YOLO11 hoàn toàn không gặp khó khăn nhờ API Ultralytics thống nhất.