YOLOX so với YOLOv8 : Một cái nhìn sâu sắc về sự phát triển của công nghệ phát hiện đối tượng
Bối cảnh của thị giác máy tính đang thay đổi nhanh chóng, với các kiến trúc mới liên tục thúc đẩy ranh giới về tốc độ và độ chính xác. Hai cột mốc quan trọng trong hành trình này là YOLOX và YOLOv8 Bài so sánh này khám phá những sắc thái kỹ thuật giữa sự đổi mới không cần neo của YOLOX và tính linh hoạt tiên tiến của Ultralytics YOLOv8 . Chúng tôi phân tích kiến trúc, số liệu hiệu suất và khả năng phù hợp của chúng với các ứng dụng thực tế để giúp bạn chọn đúng công cụ cho các dự án học máy của mình.
Nâng cấp lên công nghệ mới nhất
Trong khi YOLOv8 là một mô hình mạnh mẽ, lĩnh vực này đã tiến xa hơn nữa. Hãy xem YOLO11 , phiên bản mới nhất từ Ultralytics , mang lại hiệu quả cao hơn, xử lý nhanh hơn và độ chính xác được cải thiện cho các nhiệm vụ phát hiện, phân đoạn và ước tính tư thế.
Chỉ số hiệu suất và điểm chuẩn
Khi đánh giá các mô hình phát hiện đối tượng, sự cân bằng giữa tốc độ suy luận và Độ chính xác trung bình ( mAP ) là rất quan trọng. Bảng dưới đây nhấn mạnh rằng Ultralytics YOLOv8 luôn đạt được độ chính xác cao hơn với độ trễ thấp hơn trên các kích thước mô hình tương đương.
Đáng chú ý là, YOLOv8 cung cấp các tiêu chuẩn minh bạch cho CPU suy luận thông qua ONNX , một chỉ số quan trọng để triển khai trên phần cứng không có GPU chuyên dụng. Ngược lại, các tiêu chuẩn đánh giá YOLOX tiêu chuẩn chủ yếu tập trung vào GPU hiệu suất, tạo ra khoảng trống cho người dùng nhắm mục tiêu vào các ứng dụng AI biên trên bộ xử lý tiêu chuẩn.
| Mô hình | Kích thước (pixels) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOX: Người tiên phong không cần neo
Được phát hành vào năm 2021 bởi các nhà nghiên cứu tại Megvii, YOLOX đã giới thiệu một sự thay đổi đáng kể trong YOLO gia đình bằng cách áp dụng cơ chế không neo . Lựa chọn thiết kế này loại bỏ nhu cầu sử dụng hộp neo được xác định trước, giúp đơn giản hóa quá trình đào tạo và cải thiện hiệu suất trong các tình huống cụ thể.
- Tác giả: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, và Jian Sun
- Tổ chức: Megvii
- Date: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
Kiến trúc và Điểm mạnh
YOLOX tích hợp một đầu tách rời , tách biệt các tác vụ phân loại và định vị để cải thiện tốc độ và độ chính xác hội tụ. Nó sử dụng SimOTA (Simplified Optimal Transport Assignment - Gán Vận chuyển Tối ưu Đơn giản hóa) để gán nhãn động, xử lý quá trình huấn luyện như một bài toán vận chuyển tối ưu. Mặc dù mang tính đột phá vào thời điểm đó, YOLOX chủ yếu là một mô hình phát hiện đối tượng , thiếu hỗ trợ gốc cho các tác vụ khác như phân đoạn hoặc ước lượng tư thế trong cùng một cơ sở mã.
YOLOv8 : Tiêu chuẩn hiện đại cho AI thị giác
Ra mắt vào đầu năm 2023 bởi Ultralytics , YOLOv8 là đỉnh cao của quá trình nghiên cứu chuyên sâu về hiệu quả, độ chính xác và khả năng sử dụng. Nền tảng này được xây dựng dựa trên nền tảng không có neo nhưng được cải tiến với Task-Aligned Assigner tiên tiến và kiến trúc hiện đại, vượt trội trên nhiều loại phần cứng.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2023-01-10
- Tài liệu: https://docs. ultralytics .com/models/ yolov8 /
Ưu điểm chính
YOLOv8 không chỉ là một mô hình phát hiện; nó là một khuôn khổ thống nhất. Nó cung cấp hỗ trợ gốc cho phân loại hình ảnh , phân đoạn thực thể , ước lượng tư thế và phát hiện đối tượng định hướng (OBB) . Tính linh hoạt này cho phép các nhà phát triển giải quyết các vấn đề đa phương thức phức tạp bằng một API duy nhất, thống nhất.
So sánh kiến trúc và các trường hợp sử dụng
Hiểu được sự khác biệt về mặt kỹ thuật giữa các kiến trúc này giúp lựa chọn công cụ phù hợp cho hệ thống suy luận và sản xuất theo thời gian thực .
1. Hiệu quả đào tạo và trí nhớ
Một trong những tính năng nổi bật của Ultralytics YOLO mô hình là hiệu quả đào tạo của họ. YOLOv8 triển khai các chiến lược tăng cường nâng cao, chẳng hạn như khảm và trộn, được tối ưu hóa để ngăn ngừa tình trạng quá khớp trong khi vẫn duy trì tốc độ đào tạo cao.
Điều quan trọng là, YOLOv8 cho thấy yêu cầu bộ nhớ thấp hơn trong cả quá trình đào tạo và suy luận so với các kiến trúc cũ hoặc các mô hình dựa trên bộ biến áp nặng. Hiệu quả này giúp việc đào tạo các mô hình tùy chỉnh trên GPU cấp độ người dùng hoặc triển khai chúng trên các thiết bị biên bị hạn chế về bộ nhớ trở nên khả thi. YOLOX, mặc dù hiệu quả, thường yêu cầu điều chỉnh thủ công các siêu tham số nhiều hơn để đạt được độ ổn định tối ưu.
2. Hệ sinh thái và tính dễ sử dụng
Đối với các nhà phát triển và nhà nghiên cứu, hệ sinh thái xung quanh một mô hình cũng quan trọng như chính kiến trúc của nó.
- YOLOX tuân theo cấu trúc kho lưu trữ nghiên cứu truyền thống. Việc thiết lập thường liên quan đến các tệp cấu hình phức tạp và quản lý phụ thuộc thủ công.
- Ultralytics YOLOv8 ưu tiên tính dễ sử dụng . Nó có gói cài đặt pip, API Python được sắp xếp hợp lý và CLI hoạt động ngay lập tức.
Dễ sử dụng với Ultralytics API
Chạy dự đoán với YOLOv8 cực kỳ đơn giản, chỉ cần một vài dòng mã.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
3. Hệ sinh thái được duy trì tốt
Lựa chọn YOLOv8 có nghĩa là tiếp cận được một hệ sinh thái được duy trì tốt . Ultralytics cung cấp tài liệu toàn diện, cập nhật thường xuyên và hỗ trợ cộng đồng tích cực. Việc tích hợp với hệ sinh thái Ultralytics rộng lớn hơn giúp đơn giản hóa quy trình làm việc, bao gồm chú thích dữ liệu , quản lý tập dữ liệu và triển khai mô hình sang các định dạng như TensorRT và OpenVINO .
Các ứng dụng thực tế
Ở đâu YOLOv8 Xuất sắc
- Bán lẻ thông minh: Sử dụng khả năng phân khúc để hiểu cách bố trí kệ hàng và vị trí đặt sản phẩm với độ chính xác đến từng pixel.
- Phân tích thể thao: Tận dụng ước tính tư thế để track chuyển động và cơ chế sinh học của người chơi theo thời gian thực, một nhiệm vụ mà YOLOX không thể thực hiện được.
- Kiểm tra công nghiệp: Triển khai mô hình OBB để detect các vật thể quay như các thành phần trên băng chuyền với độ chính xác cao.
- Triển khai cạnh: Tỷ lệ tốc độ trên độ chính xác vượt trội của YOLOv8 làm cho nó trở thành sự lựa chọn ưu tiên cho các ứng dụng di động và hệ thống nhúng như Raspberry Pi hoặc NVIDIA Jetson.
Ngách YOLOX
YOLOX vẫn là một ứng cử viên sáng giá cho nghiên cứu học thuật tập trung cụ thể vào các khía cạnh lý thuyết của đầu dò không neo. Cơ sở mã nguồn của nó cung cấp một tài liệu tham khảo rõ ràng cho các nhà nghiên cứu đang tìm hiểu quá trình chuyển đổi từ phương pháp dựa trên neo sang phương pháp không neo trong kỷ nguyên 2021.
Kết luận
Trong khi YOLOX đóng vai trò then chốt trong việc phổ biến công nghệ phát hiện không neo, Ultralytics YOLOv8 đại diện cho sự phát triển tự nhiên của công nghệ này. Bằng cách cung cấp các chỉ số hiệu suất vượt trội, một khuôn khổ học tập đa tác vụ linh hoạt và trải nghiệm người dùng vượt trội, YOLOv8 nổi bật là sự lựa chọn vượt trội cho phát triển AI hiện đại.
Đối với các nhà phát triển đang tìm kiếm một giải pháp mạnh mẽ, có khả năng thích ứng với tương lai, có thể mở rộng từ tạo mẫu nhanh đến triển khai cho doanh nghiệp, Ultralytics YOLOv8 —và YOLO11 mới hơn —cung cấp các công cụ cần thiết để thành công.
Khám phá các Mô hình Khác
Mở rộng hiểu biết của bạn về bối cảnh phát hiện đối tượng bằng cách khám phá những so sánh sau:
- YOLOv8 so với YOLOv5
- YOLOv8 so với YOLOv7
- YOLOv8 so với RT-DETR
- YOLOv8 so với YOLOv10
- YOLOX so với YOLOv7
- Khám phá khả năng của YOLO11 để có những tiến bộ mới nhất.