YOLOv8 vs. DAMO-YOLO: So sánh kỹ thuật toàn diện
Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn kiến trúc phát hiện đối tượng phù hợp là rất quan trọng để cân bằng giữa độ chính xác, tốc độ và hiệu quả triển khai. Hướng dẫn này cung cấp phân tích kỹ thuật chuyên sâu về hai mô hình nổi bật: Ultralytics YOLOv8 , nổi tiếng với hệ sinh thái mạnh mẽ và dễ sử dụng, và DAMO- YOLO , một kiến trúc tập trung vào nghiên cứu tận dụng Tìm kiếm Kiến trúc Thần kinh (NAS).
Tóm tắt điều hành
Trong khi DAMO- YOLO Năm 2022, YOLO đã giới thiệu các khái niệm đột phá như hệ thống xương sống NAS và tái tham số hóa, cùng với YOLOv8 (phát hành năm 2023) và YOLO26 mới hơn (phát hành năm 2026), mang đến một hệ sinh thái hoàn thiện hơn, sẵn sàng cho môi trường sản xuất. Ultralytics các mô hình cung cấp trải nghiệm "từ con số không đến chuyên gia" liền mạch với hỗ trợ tích hợp cho việc đào tạo, xác thực và triển khai trên nhiều phần cứng khác nhau, trong khi DAMO- YOLO Mục tiêu chính là nghiên cứu học thuật với quy trình đào tạo phức tạp hơn.
Các chỉ số hiệu suất
Bảng dưới đây so sánh hiệu suất của YOLOv8 và DAMO- YOLO trên COCO Bộ dữ liệu xác thực. YOLOv8 Thể hiện tính linh hoạt và tốc độ vượt trội, đặc biệt trong các tình huống suy luận thực tế.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Tổng quan về Ultralytics YOLOv8
YOLOv8 đánh dấu một bước tiến đáng kể trong lĩnh vực này. YOLO gia đình, được thiết kế bởi Ultralytics Trở thành mô hình tiên tiến, hữu dụng và chính xác nhất cho nhiều nhiệm vụ khác nhau.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 10 tháng 1 năm 2023
- Tài liệu:Tài liệu YOLOv8
- GitHub:ultralytics/ultralytics
Các tính năng chính của YOLOv8
YOLOv8 Nền tảng này được xây dựng dựa trên những thành công trước đó với một khung thống nhất hỗ trợ phát hiện đối tượng , phân đoạn thể hiện , ước lượng tư thế , phân loại và phát hiện hộp giới hạn định hướng (OBB) . Đầu phát hiện không cần neo và các hàm mất mát mới giúp đơn giản hóa quá trình học, dẫn đến độ chính xác cao hơn và tốc độ hội tụ nhanh hơn.
Hệ sinh thái tích hợp
Khác với các kho lưu trữ chỉ dành cho nghiên cứu, YOLOv8 Được hỗ trợ bởi Hệ sinh thái Ultralytics toàn diện. Điều này bao gồm Nền tảng Ultralytics để huấn luyện không cần lập trình và quản lý tập dữ liệu, cũng như tích hợp liền mạch với các công cụ như Weights & Biases và Ultralytics Platform .
Tổng quan về DAMO-YOLO
DAMO- YOLO là một khung phần mềm phát hiện đối tượng được phát triển bởi Học viện Alibaba DAMO. Nó nhấn mạnh vào độ trễ thấp và độ chính xác cao bằng cách tận dụng Tìm kiếm Kiến trúc Mạng thần kinh (NAS) và các kỹ thuật tiên tiến khác.
- Tác giả: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, và Xiuyu Sun
- Tổ chức: Alibaba Group
- Ngày: 23 tháng 11 năm 2022
- Arxiv:DAMO-YOLO: Báo cáo về Thiết kế detect Đối tượng theo Thời gian Thực
- GitHub:tinyvision/DAMO-YOLO
Kiến trúc và Phương pháp luận
DAMO- YOLO Nó tích hợp thuật toán Tìm kiếm Kiến trúc Đa Quy mô (MAE-NAS) để tìm ra các kiến trúc xương sống tối ưu cho các ràng buộc độ trễ khác nhau. Nó sử dụng mạng RepGFPN (Mạng Kim tự tháp Đặc trưng Tổng quát được tham số hóa lại) để kết hợp đặc trưng hiệu quả và áp dụng quy trình chưng cất mạnh mẽ trong quá trình huấn luyện để nâng cao hiệu suất của mô hình học sinh.
So sánh kiến trúc chi tiết
Triết lý kiến trúc của hai mô hình này khác biệt đáng kể, ảnh hưởng đến tính khả dụng và tính linh hoạt của chúng.
Kiến trúc Backbone và Hợp nhất Đặc trưng
YOLOv8 sử dụng kiến trúc xương sống CSPDarknet đã được sửa đổi với các mô-đun C2f, được tối ưu hóa cho luồng gradient phong phú và hiệu quả phần cứng. Cách tiếp cận "tận dụng tối đa các nguồn lực sẵn có" này đảm bảo hiệu suất cao mà không cần đến các giai đoạn tìm kiếm phức tạp.
Ngược lại, DAMO- YOLO dựa vào NAS để phát hiện các kiến trúc mạng như MobileOne hoặc các biến thể dựa trên CSP được thiết kế riêng cho phần cứng cụ thể. Mặc dù điều này có thể mang lại hiệu quả lý thuyết cao hơn, nhưng nó thường làm phức tạp quy trình huấn luyện và khiến việc tùy chỉnh kiến trúc cho các tác vụ mới trở nên khó khăn hơn đối với nhà phát triển thông thường.
Phương pháp Huấn luyện
Đào tạo DAMO- YOLO Đây là một quy trình phức tạp, nhiều giai đoạn. Nó bao gồm chiến lược "ZeroHead" và một quy trình chưng cất phức tạp, trong đó một mô hình giáo viên lớn hướng dẫn học sinh. Điều này đòi hỏi nguồn tài nguyên tính toán đáng kể và cấu hình phức tạp.
Các mô hình Ultralytics ưu tiên hiệu quả đào tạo . YOLOv8 (và YOLO26 phiên bản mới hơn) có thể được huấn luyện từ đầu hoặc tinh chỉnh trên dữ liệu tùy chỉnh chỉ bằng một lệnh duy nhất. Việc sử dụng trọng số được huấn luyện trước giúp giảm đáng kể thời gian và CUDA Bộ nhớ cần thiết cho sự hội tụ.
# Simplicity of Ultralytics Training
yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640
Tính linh hoạt và hỗ trợ tác vụ
Một lợi thế quan trọng của Ultralytics Điểm mạnh của framework này là tính linh hoạt vốn có của nó. Trong khi DAMO- YOLO Về cơ bản, nó là một thiết bị phát hiện đối tượng. YOLOv8 Nó hỗ trợ vô số các tác vụ thị giác máy tính . Các nhà phát triển có thể chuyển từ phát hiện ô tô sang phân đoạn khối u hoặc ước tính tư thế người mà không cần thay đổi bộ phần mềm của họ.
Cái Ultralytics Ưu điểm: Tại sao nên chọn YOLOv8 Hay là YOLO26?
Đối với các nhà phát triển và doanh nghiệp, việc lựa chọn mô hình thường vượt ra ngoài phạm vi dữ liệu thô. mAP cho toàn bộ vòng đời của sản phẩm AI.
1. Dễ sử dụng và Tài liệu
Ultralytics nổi tiếng với hệ thống tài liệu hàng đầu trong ngành và sự đơn giản. Python API. Tích hợp YOLOv8 Việc tích hợp vào một ứng dụng chỉ cần vài dòng mã, trong khi DAMO- YOLO Thường đòi hỏi phải điều hướng các cơ sở mã nghiên cứu phức tạp với sự hỗ trợ bên ngoài hạn chế.
2. Triển khai và Xuất khẩu
Việc triển khai thực tế đòi hỏi tính linh hoạt. Ultralytics Các mô hình hỗ trợ xuất chỉ bằng một cú nhấp chuột sang các định dạng như ONNX , TensorRT , CoreML và TFLite . Điều này đảm bảo rằng mô hình của bạn có thể chạy trên mọi thiết bị, từ máy chủ đám mây đến các thiết bị biên như Raspberry Pi hoặc... NVIDIA Jetson.
3. Cân bằng hiệu suất
YOLOv8 Đạt được sự cân bằng vượt trội giữa tốc độ và độ chính xác. Đối với người dùng yêu cầu hiệu quả cao hơn nữa, YOLO26 mới ra mắt được xây dựng dựa trên nền tảng này với thiết kế không sử dụng NMS từ đầu đến cuối . Điều này loại bỏ quá trình xử lý hậu kỳ loại bỏ các giá trị không tối đa ( NMS ) , dẫn đến suy luận nhanh hơn và logic triển khai đơn giản hơn.
Tương lai không cần NMS
YOLO26 tiên phong trong kiến trúc đầu cuối hoàn chỉnh. Bằng cách loại bỏ nhu cầu về... NMS Và nhờ sử dụng thuật toán tối ưu hóa MuSGD mới (lấy cảm hứng từ thuật toán huấn luyện LLM), YOLO26 cung cấp khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ trước, trở thành lựa chọn vượt trội cho điện toán biên.
Các trường hợp sử dụng lý tưởng
- Hãy chọn DAMO- YOLO nếu: Bạn là nhà nghiên cứu chuyên điều tra các kỹ thuật Tìm kiếm Kiến trúc Mạng thần kinh (NAS) hoặc có những hạn chế về phần cứng chuyên biệt cao, trong đó kiến trúc mạng chung không đủ đáp ứng, và bạn có đủ nguồn lực để quản lý các quy trình xử lý dữ liệu phức tạp.
- Hãy chọn Ultralytics YOLOv8 /YOLO26 nếu: Bạn cần một giải pháp sẵn sàng cho môi trường sản xuất dành cho phân tích bán lẻ , xe tự hành , hình ảnh y tế hoặc các ứng dụng thành phố thông minh . Các tùy chọn xuất dữ liệu mạnh mẽ, yêu cầu bộ nhớ thấp hơn và sự hỗ trợ cộng đồng tích cực khiến nó trở thành tiêu chuẩn cho việc triển khai thương mại đáng tin cậy.
Kết luận
Trong khi DAMO- YOLO Mặc dù Ultralytics YOLOv8 và YOLO26 tiên tiến mang đến những đổi mới học thuật thú vị trong tìm kiếm kiến trúc, chúng vẫn là những lựa chọn ưu tiên cho ứng dụng thực tiễn. Sự kết hợp giữa tính dễ sử dụng , hệ sinh thái được duy trì tốt và hiệu năng cân bằng đảm bảo các nhà phát triển có thể tập trung vào giải quyết các vấn đề thực tế thay vì phải vật lộn với các chi tiết triển khai mô hình.
Đối với những ai sẵn sàng bắt đầu hành trình khám phá thị giác máy tính, hãy tham khảo Hướng dẫn nhanh hoặc tìm hiểu sâu hơn về các tính năng của Nền tảng Ultralytics ngay hôm nay.
Đọc thêm
- So sánh YOLOv8 với EfficientDet
- So sánh YOLO26 và RT-DETR
- Tìm hiểu về YOLO11