YOLOv10 so với DAMO- YOLO : So sánh kỹ thuật
Việc lựa chọn mô hình phát hiện đối tượng tối ưu là một quyết định quan trọng, cân bằng giữa độ chính xác, tốc độ và chi phí tính toán. Trang này cung cấp so sánh kỹ thuật chi tiết giữa YOLOv10 , mô hình hiệu quả cao mới nhất được tích hợp vào Ultralytics hệ sinh thái và DAMO- YOLO , một công cụ phát hiện mạnh mẽ từ Tập đoàn Alibaba. Chúng tôi sẽ phân tích kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng của họ để giúp bạn đưa ra lựa chọn sáng suốt cho các dự án thị giác máy tính của mình.
YOLOv10 : Phát hiện đầu cuối theo thời gian thực
YOLOv10 , được giới thiệu bởi các nhà nghiên cứu tại Đại học Thanh Hoa vào tháng 5 năm 2024, đánh dấu một bước tiến đáng kể trong lĩnh vực phát hiện đối tượng theo thời gian thực. Cải tiến chính của nó là đạt được khả năng phát hiện toàn diện bằng cách loại bỏ nhu cầu sử dụng NMS (Non-Maximum Suppression) , giúp giảm thiểu chi phí hậu xử lý và độ trễ suy luận .
Chi tiết kỹ thuật:
Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Ngày: 23-05-2024
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Tài liệu: https://docs. ultralytics .com/models/yolov10/
Kiến trúc và các tính năng chính
YOLOv10 được xây dựng dựa trên sự mạnh mẽ Ultralytics framework, kế thừa tính dễ sử dụng và hệ sinh thái mạnh mẽ của nó. Kiến trúc của nó giới thiệu một số cải tiến quan trọng để đạt hiệu quả và hiệu suất vượt trội:
- NMS - Đào tạo miễn phí: YOLOv10 sử dụng các phép gán kép nhất quán cho nhãn trong quá trình huấn luyện. Điều này cho phép mô hình đưa ra các dự đoán rõ ràng mà không cần NMS bước xử lý hậu kỳ, đơn giản hóa quy trình triển khai và thực sự hoàn chỉnh.
- Thiết kế toàn diện về hiệu quả và độ chính xác: Kiến trúc mô hình đã được tối ưu hóa toàn diện để giảm sự dư thừa tính toán. Điều này bao gồm một lớp classification head (đầu phân loại) gọn nhẹ và giảm tỷ lệ lấy mẫu không gian-kênh được tách rời, giúp tăng cường cả tốc độ và khả năng.
- Tích hợp Ultralytics liền mạch: Là một phần của Ultralytics hệ sinh thái, YOLOv10 Trải nghiệm người dùng được tối ưu hóa. Điều này bao gồm API Python đơn giản, tài liệu hướng dẫn chi tiết, quy trình đào tạo hiệu quả và các trọng số được đào tạo sẵn có. Sự tích hợp này giúp các nhà phát triển dễ dàng bắt đầu và triển khai mô hình nhanh chóng.
Tại sao NMS -Vấn đề tự do
Các máy dò vật thể truyền thống thường dự đoán nhiều hộp giới hạn cho một vật thể duy nhất. Không loại bỏ tối đa ( NMS ) là bước xử lý hậu kỳ được sử dụng để lọc ra các bản sao này. Bằng cách loại bỏ NMS , YOLOv10 giảm đáng kể độ trễ và độ phức tạp của suy luận, đặc biệt là trong các tình huống triển khai biên, nơi mà từng mili giây đều có giá trị.
DAMO- YOLO : Hiệu quả do NAS thúc đẩy
DAMO- YOLO là một mô hình phát hiện đối tượng nhanh và chính xác được phát triển bởi Tập đoàn Alibaba . Được phát hành vào tháng 11 năm 2022, mô hình này đã giới thiệu một số kỹ thuật mới để mở rộng ranh giới hiệu suất của YOLO -bộ dò kiểu, tập trung nhiều vào tối ưu hóa kiến trúc thông qua các thuật toán tìm kiếm.
Chi tiết kỹ thuật:
Tác giả: Xianzhe Xu, Yiqi Jiang, Weihua Chen, et al.
Tổ chức: Tập đoàn Alibaba
Ngày: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444
GitHub: https://github.com/tinyvision/DAMO- YOLO
Tài liệu: https://github.com/tinyvision/DAMO- YOLO /blob/master/README.md
Kiến trúc và các tính năng chính
DAMO- YOLO khám phá các kỹ thuật tiên tiến để cải thiện sự cân bằng giữa tốc độ và độ chính xác. Kiến trúc của nó được đặc trưng bởi:
- Tìm kiếm kiến trúc thần kinh (NAS): Xương sống của DAMO- YOLO được tạo ra bằng NAS, cho phép tạo ra mạng trích xuất tính năng được tối ưu hóa cao, được thiết kế riêng cho các nhiệm vụ phát hiện.
- Cổ RepGFPN hiệu quả: Kết hợp thiết kế Mạng kim tự tháp tính năng (FPN) mới có tên là RepGFPN giúp kết hợp hiệu quả các tính năng từ nhiều tỷ lệ khác nhau.
- ZeroHead và AlignedOTA: Mô hình sử dụng đầu đơn giản, không có tham số và chiến lược gán nhãn được cải tiến có tên là AlignedOTA (Gán vận chuyển tối ưu được căn chỉnh) để tăng cường độ chính xác phát hiện và định vị.
- Chắt lọc kiến thức: DAMO- YOLO tận dụng quá trình chắt lọc kiến thức để tăng cường hiệu suất của các mô hình nhỏ hơn bằng cách học hỏi từ các mạng lưới giáo viên lớn hơn.
So sánh trực tiếp hiệu năng
Bảng sau đây so sánh hiệu suất của các loại khác nhau YOLOv10 và DAMO- YOLO kích thước mô hình trên tập dữ liệu COCO . YOLOv10 luôn chứng minh hiệu suất vượt trội, mang lại độ chính xác cao hơn với độ trễ thấp hơn và ít tham số hơn.
| Mô hình | Kích thước (pixels) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Như dữ liệu cho thấy, YOLOv10 các mô hình thường vượt trội hơn DAMO- của chúng YOLO các đối tác về hiệu quả. Ví dụ, YOLOv10 -S đạt được mAP cao hơn (46,7 so với 46,0) so với DAMO- YOLO -S trong khi nhanh hơn đáng kể (2,66 ms so với 3,45 ms) và có ít hơn một nửa số tham số (7,2M so với 16,3M). Xu hướng này đúng trên tất cả các kích thước mô hình, đạt đến đỉnh điểm YOLOv10 -X đạt đến đỉnh cao nhất mAP của 54,4.
Phân tích điểm mạnh và điểm yếu
YOLOv10 Điểm mạnh
- Hiệu quả hiện đại: YOLOv10 mang lại sự cân bằng tuyệt vời giữa tốc độ và độ chính xác, thường vượt trội hơn các đối thủ cạnh tranh với ít thông số hơn và độ trễ thấp hơn.
- Dễ sử dụng: Mô hình này cực kỳ thân thiện với người dùng nhờ tích hợp với Ultralytics hệ sinh thái.
- Triển khai đầu cuối: NMS Thiết kế miễn phí giúp đơn giản hóa toàn bộ quy trình làm việc từ đào tạo đến suy luận , khiến nó trở nên lý tưởng cho các ứng dụng thực tế trên các thiết bị biên .
- Yêu cầu bộ nhớ thấp hơn: So với các kiến trúc phức tạp hơn, YOLOv10 có hiệu quả trong việc sử dụng bộ nhớ trong quá trình đào tạo và suy luận.
DAMO- YOLO Điểm mạnh
- Hiệu suất cao: DAMO-YOLO đạt được độ chính xác và tốc độ cạnh tranh, khiến nó trở thành một đối thủ mạnh trong lĩnh vực phát hiện đối tượng.
- Công nghệ tiên tiến: Kết hợp các khái niệm nghiên cứu tiên tiến như NAS và các chiến lược gán nhãn tiên tiến có giá trị cho việc khám phá học thuật.
Điểm yếu
- YOLOv10 : Mặc dù đặc biệt hữu ích trong việc phát hiện đối tượng , YOLOv10 hiện đang tập trung vào nhiệm vụ duy nhất này, không giống như Ultralytics YOLO11 đa năng hỗ trợ phân đoạn, phân loại và ước tính tư thế ngay khi cài đặt.
- DAMO- YOLO : Kiến trúc và quy trình đào tạo của mô hình phức tạp hơn so với YOLOv10 . Nó chủ yếu có sẵn trong các hộp công cụ nghiên cứu cụ thể, điều này có thể là rào cản đối với các nhà phát triển thích giải pháp tích hợp hơn, thân thiện với người dùng như giải pháp được cung cấp bởi Ultralytics .
Các Ultralytics Lợi thế
Mặc dù cả hai mô hình đều ấn tượng, Ultralytics các mô hình như YOLOv10 và sản phẩm chủ lực YOLO11 mang lại lợi thế riêng biệt cho các nhà phát triển và nhà nghiên cứu:
- Hệ sinh thái thống nhất: Ultralytics cung cấp một nền tảng gắn kết nơi chú thích dữ liệu , đào tạo và triển khai diễn ra liền mạch.
- Dễ sử dụng: Với một cách đơn giản Python API, bạn có thể tải mô hình và chạy suy luận chỉ bằng vài dòng mã.
- Tính linh hoạt: Ultralytics hỗ trợ nhiều tác vụ bao gồm phân đoạn trường hợp , phân loại hình ảnh , ước tính tư thế và Hộp giới hạn định hướng (OBB) .
- Hỗ trợ cộng đồng: Một cộng đồng năng động và tài liệu đầy đủ đảm bảo bạn sẽ không bao giờ gặp phải vấn đề nào đó quá lâu.
Ví dụ sử dụng: YOLOv10 với Ultralytics
Đang chạy YOLOv10 là đơn giản bằng cách sử dụng Ultralytics Python gói. Sau đây là cách bạn có thể tải một mô hình được đào tạo trước và chạy dự đoán trên một hình ảnh:
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Perform object detection on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Kết luận
Cả hai YOLOv10 và DAMO- YOLO là những mô hình phát hiện đối tượng đáng gờm. DAMO- YOLO là tài liệu tham khảo tuyệt vời cho nghiên cứu về kiến trúc NAS và hợp nhất tính năng nâng cao. Tuy nhiên, xét về hiệu quả triển khai thực tế và MLOps , YOLOv10 nổi bật là lựa chọn vượt trội. NMS -kiến trúc tự do, kết hợp với toàn diện Ultralytics hệ sinh thái đảm bảo bạn có thể chuyển từ ý tưởng sang sản xuất nhanh hơn và hiệu suất tốt hơn.
Đối với người dùng yêu cầu tính linh hoạt cao hơn trong nhiều nhiệm vụ thị giác, chúng tôi đặc biệt khuyên bạn nên khám phá YOLO11 , công nghệ tiên tiến hiện đại nhất hiện nay cho YOLO gia đình.
Khám Phá Các So Sánh Mô Hình Khác
Để xem các mô hình này so sánh như thế nào với các kiến trúc hàng đầu khác, hãy xem các so sánh sau:
- YOLO11 so với DAMO-YOLO
- YOLOv8 so với DAMO-YOLO
- RT-DETR so với DAMO-YOLO
- YOLOX so với DAMO-YOLO
- YOLOv10 so với RT-DETR
- YOLOv10 so với YOLOX