YOLOv9 so với YOLO11 Kết nối sự đổi mới kiến trúc với khả năng sẵn sàng sản xuất
Lĩnh vực phát hiện đối tượng thời gian thực đang phát triển nhanh chóng, với mỗi thế hệ đều đẩy mạnh giới hạn về độ chính xác, tốc độ và hiệu quả. Bài so sánh này đi sâu vào YOLOv9 , nổi tiếng với những đột phá lý thuyết về thông tin gradient, và YOLO11 , Ultralytics 'Một cỗ máy mạnh mẽ đạt tiêu chuẩn sản xuất, được thiết kế để triển khai liền mạch và linh hoạt.'
Mặc dù cả hai mẫu đều bắt nguồn từ dòng xe huyền thoại. YOLO Nguồn gốc của chúng, mỗi công cụ phục vụ những mục đích riêng biệt trong hệ sinh thái thị giác máy tính . Hướng dẫn này phân tích kiến trúc, số liệu hiệu năng và các trường hợp sử dụng lý tưởng của chúng để giúp các nhà phát triển lựa chọn công cụ phù hợp với nhu cầu cụ thể của mình.
Tóm tắt: Đổi mới so với Hệ sinh thái
YOLOv9 tập trung giải quyết vấn đề cơ bản về mất mát thông tin trong mạng nơ-ron sâu thông qua các khái niệm kiến trúc mới như Thông tin Gradient có thể lập trình (Programmable Gradient Information - PGI). Đây là lựa chọn tuyệt vời cho nghiên cứu học thuật và các trường hợp yêu cầu khả năng giữ lại tối đa các đặc trưng trên các tập dữ liệu phức tạp.
Ngược lại, YOLO11 được thiết kế cho thế giới thực. Là một thành phần chính thức của hệ sinh thái Ultralytics , nó mang đến sự dễ sử dụng vượt trội, tốc độ suy luận nhanh hơn trên phần cứng biên và hỗ trợ gốc cho nhiều tác vụ ngoài việc phát hiện đơn giản. Đối với các nhà phát triển xây dựng ứng dụng thương mại, YOLO11 Cung cấp lộ trình hợp lý hơn từ đào tạo đến triển khai .
Thông số kỹ thuật và hiệu suất
Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa các mô hình trên tập dữ liệu COCO . Trong khi đó, YOLOv9 Thể hiện khả năng lý thuyết vượt trội. YOLO11 Thể hiện những ưu điểm vượt trội về tốc độ và hiệu quả tham số, đặc biệt là ở các biến thể mô hình nhỏ hơn, vốn rất quan trọng đối với trí tuệ nhân tạo biên (edge AI).
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv9 Khám phá sâu hơn về Gradient lập trình được
YOLOv9 Phương pháp này được giới thiệu để giải quyết vấn đề "nút thắt cổ chai thông tin" trong mạng nơ-ron sâu. Khi mạng trở nên sâu hơn, dữ liệu đầu vào thường mất thông tin quan trọng trước khi đến được các lớp dự đoán.
- Tác giả: Chien-Yao Wang, Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
- Ngày: 21 tháng 2, 2024
- Arxiv:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
Các tính năng kiến trúc chính
- Thông tin độ dốc có thể lập trình (PGI): PGI tạo ra các độ dốc đáng tin cậy thông qua một nhánh giám sát phụ trợ, đảm bảo nhánh chính học được các đặc trưng mạnh mẽ ngay cả trong các kiến trúc rất sâu. Điều này đặc biệt hữu ích cho việc nghiên cứu động lực học giảm độ dốc .
- GELAN (Generalized Efficient Layer Aggregation Network): Một kiến trúc mới tối ưu hóa việc sử dụng tham số, kết hợp những ưu điểm tốt nhất của CSPNet và ELAN. Điều này cho phép YOLOv9 để đạt được độ chính xác cao với cấu trúc tương đối nhẹ so với các thiết kế cũ hơn. Ultralytics mô hình.
YOLO11 Được thiết kế cho sản xuất và tính linh hoạt
YOLO11 đại diện cho đỉnh điểm của Ultralytics 'kinh nghiệm hỗ trợ hàng triệu chuyên gia AI.' ưu tiên tính hữu dụng thực tiễn, đảm bảo các mô hình không chỉ chính xác trên các tiêu chuẩn mà còn dễ huấn luyện, xuất khẩu và chạy trên nhiều loại phần cứng khác nhau, từ NVIDIA Kết nối GPU với thiết bị Raspberry Pi .
- Tác giả: Glenn Jocher, Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 27 tháng 9 năm 2024
- Kho lưu trữ: Ultralytics GitHub
Lợi thế của Ultralytics
YOLO11 tỏa sáng nhờ sự tích hợp với phạm vi rộng hơn. Ultralytics Hệ sinh thái. Điều này bao gồm:
- Hiệu quả bộ nhớ: YOLO11 được tối ưu hóa để yêu cầu ít hơn đáng kể. CUDA Việc này giúp tiết kiệm bộ nhớ trong quá trình huấn luyện so với các kiến trúc nặng về Transformer hoặc các kho lưu trữ chưa được tối ưu hóa. Điều này giúp dân chủ hóa việc tiếp cận huấn luyện, cho phép người dùng tinh chỉnh các mô hình tiên tiến trên các GPU cấp người tiêu dùng như RTX 3060 hoặc 4070.
- Hỗ trợ nhiệm vụ tổng quát: Không giống như YOLOv9 , chủ yếu tập trung vào việc phát hiện trong kho lưu trữ cơ sở của nó, YOLO11 Hỗ trợ nguyên bản:
- Khả năng xuất khẩu: Xuất chỉ với một cú nhấp chuột sang các định dạng như ONNX , TensorRT , CoreML , Và TFLite làm cho YOLO11 Là sự lựa chọn hàng đầu cho việc triển khai trên thiết bị di động và hệ thống nhúng.
Đào tạo được tối ưu hóa với Ultralytics
Đào tạo YOLO11 Yêu cầu mã mẫu tối thiểu. Bạn có thể bắt đầu huấn luyện trên tập dữ liệu tùy chỉnh chỉ trong vài giây bằng cách sử dụng công cụ này. Python API:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Các trường hợp sử dụng thực tế
Việc lựa chọn giữa hai mô hình này phụ thuộc rất nhiều vào các ràng buộc triển khai và mục tiêu dự án của bạn.
Các kịch bản lý tưởng cho YOLOv9
- Đánh giá chuẩn mực học thuật: Các nhà nghiên cứu nghiên cứu về cấu trúc mạng và luồng thông tin sẽ thấy các khái niệm PGI hữu ích trong... YOLOv9 Thật thú vị khi tìm kiếm kiến trúc mạng thần kinh .
- Trích xuất đặc điểm độ chính xác cao: Đối với các tác vụ mà việc thu thập các đặc điểm tinh tế trong hình ảnh y tế độ phân giải cao là rất quan trọng, kiến trúc GELAN cung cấp khả năng biểu diễn mạnh mẽ.
- Triển khai máy chủ GPU tiêu chuẩn: Trong môi trường mà độ trễ không quá quan trọng so với việc tối ưu hóa 0,1% hiệu năng. mAP Mẫu YOLOv9e lớn hơn là một ứng cử viên nặng ký.
Các kịch bản lý tưởng cho YOLO11
- AI và IoT tại biên: Với ưu việt vượt trội CPU Tốc độ suy luận (ví dụ: 1,5ms cho YOLO11n so với 2,3ms cho YOLOv9t trên T4) GPU và thậm chí khoảng cách còn lớn hơn nữa về CPU ), YOLO11 Hoàn hảo cho việc điều hướng máy bay không người lái và camera thông minh.
- Phần mềm thương mại dưới dạng dịch vụ (SaaS): Tính ổn định và bảo trì tích cực của Ultralytics Mã nguồn đảm bảo các ứng dụng thương mại luôn được bảo mật và cập nhật với các công nghệ mới nhất. PyTorch các phiên bản.
- Các quy trình xử lý đa nhiệm: Các ứng dụng yêu cầu phát hiện và theo dõi đồng thời, chẳng hạn như phân tích thể thao , sẽ được hưởng lợi từ... YOLO11 Khả năng chuyển đổi giữa các tác vụ mà không cần thay đổi cấu trúc nền tảng.
- Đào tạo trong điều kiện nguồn lực hạn chế: Các công ty khởi nghiệp và sinh viên với phần cứng hạn chế vẫn có thể đào tạo hiệu quả. YOLO11 các mô hình mà không phải chịu chi phí điện toán đám mây cao liên quan đến các kiến trúc phức tạp hơn.
Tương lai: Hướng tới YOLO26
Trong khi YOLOv9 Và YOLO11 Dù đó là những lựa chọn tuyệt vời, lĩnh vực thị giác máy tính không ngừng phát triển. Ultralytics Mới đây, công ty đã giới thiệu YOLO26 , một mô hình định nghĩa lại hiệu quả cho năm 2026 và những năm tiếp theo.
YOLO26 được xây dựng dựa trên những bài học kinh nghiệm từ cả hai kiến trúc trước đó nhưng giới thiệu thiết kế hoàn chỉnh, không cần NMS , lần đầu tiên được tiên phong trong YOLOv10 . Điều này loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression, đơn giản hóa đáng kể quy trình triển khai.
Tại sao nên cân nhắc YOLO26?
- Tốc độ: Suy luận CPU nhanh hơn tới 43% so với các thế hệ trước, đạt được nhờ loại bỏ hàm mất mát tiêu điểm phân phối (DFL) và tối ưu hóa việc thực thi đồ thị.
- Tính ổn định: Sử dụng trình tối ưu hóa MuSGD mới, một sự kết hợp giữa... SGD và Muon (lấy cảm hứng từ phương pháp huấn luyện LLM), cung cấp tính ổn định của huấn luyện theo lô lớn cho các tác vụ thị giác.
- Độ chính xác: Tích hợp các chức năng ProgLoss + STAL giúp cải thiện đáng kể khả năng nhận dạng vật thể nhỏ, một vấn đề thường gặp trong phân tích ảnh vệ tinh .
Đối với các nhà phát triển bắt đầu các dự án mới ngày nay, việc đánh giá YOLO26 cùng với... YOLO11 Điều này rất được khuyến khích để đảm bảo ứng dụng của bạn có thể đáp ứng được nhu cầu trong tương lai.
Kết luận
Cả hai YOLOv9 Và YOLO11 Đây là những cột mốc quan trọng trong lịch sử phát hiện đối tượng. YOLOv9 đã giới thiệu những cải tiến lý thuyết quan trọng liên quan đến việc lưu giữ thông tin trong mạng nơ-ron sâu. Tuy nhiên, YOLO11 (và YOLO26 mới hơn) nhìn chung cung cấp một gói sản phẩm thiết thực hơn cho hầu hết người dùng nhờ sự tích hợp. Ultralytics hệ sinh thái, tỷ lệ tốc độ/độ chính xác vượt trội và dễ dàng triển khai.
Bằng cách tận dụng Nền tảng Ultralytics , các nhà phát triển có thể dễ dàng thử nghiệm cả hai mô hình, so sánh hiệu suất của chúng trên các tập dữ liệu tùy chỉnh và triển khai mô hình chiến thắng vào môi trường sản xuất chỉ với một vài cú nhấp chuột.
Đọc thêm
- So sánh mô hình: Xem các mô hình này hoạt động như thế nào so với YOLOv8 và RT-DETR .
- Quản lý dữ liệu: Tìm hiểu cách chú thích dữ liệu hiệu quả cho các mô hình này bằng cách sử dụng Nền tảng Ultralytics .
- Triển khai: Tìm hiểu hướng dẫn xuất mô hình sang TensorRT để đạt hiệu quả tối đa. GPU hiệu suất.