YOLOv10 So với EfficientDet: Sự tiến hóa của hiệu quả phát hiện đối tượng
Lĩnh vực thị giác máy tính được định hình bởi sự theo đuổi sự cân bằng—cụ thể là sự đánh đổi giữa tốc độ suy luận và độ chính xác phát hiện. Bài so sánh này khám phá hai cột mốc quan trọng trong lịch sử này: YOLOv10 , bước đột phá học thuật từ Đại học Thanh Hoa đã giới thiệu NMS - phát hiện miễn phí và EfficientDet , Google Kiến trúc tiên phong của công ty này đã đề cao hiệu quả có thể mở rộng.
Trong khi EfficientDet đã thiết lập các tiêu chuẩn mới vào năm 2019 với phương pháp mở rộng quy mô phức hợp của mình, YOLOv10 (2024) đại diện cho một sự thay đổi mô hình hướng tới việc loại bỏ hoàn toàn các nút thắt cổ chai trong quá trình xử lý hậu kỳ. Hướng dẫn này phân tích kiến trúc, các chỉ số hiệu suất và tính phù hợp của chúng đối với các ứng dụng AI biên hiện đại.
YOLOv10: Bộ detect thời gian thực đầu cuối
Được phát hành vào tháng 5 năm 2024, YOLOv10 đã giải quyết một sự thiếu hiệu quả kéo dài trong ngành. YOLO gia đình: sự phụ thuộc vào sự ức chế không tối đa ( NMS Bằng cách loại bỏ bước xử lý hậu kỳ này, YOLOv10 Giảm đáng kể độ trễ và đơn giản hóa quy trình triển khai.
YOLOv10 Chi tiết:
- Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
- Tổ chức:Đại học Thanh Hoa
- Ngày: 2024-05-23
- Arxiv:Real-Time End-to-End Object Detection
- GitHub:THU-MIG/yolov10
Các Đổi Mới Kiến Trúc Chính
Đặc điểm nổi bật của YOLOv10 Điểm mạnh của mô hình là chiến lược phân công kép nhất quán . Trong quá trình huấn luyện, mô hình sử dụng một đầu nối một-nhiều cho các tín hiệu giám sát phong phú và một đầu nối một-một để học các dự đoán duy nhất tối ưu. Điều này cho phép mô hình dự đoán các hộp giới hạn chính xác mà không cần yêu cầu NMS để lọc bỏ các bản ghi trùng lặp trong quá trình suy luận.
Ngoài ra, YOLOv10 Giới thiệu một thiết kế toàn diện về hiệu quả và độ chính xác , tối ưu hóa các thành phần xương sống và cổ để giảm sự dư thừa tính toán. Điều này dẫn đến một mô hình không chỉ nhanh hơn mà còn hiệu quả hơn về tham số so với các phiên bản trước đó.
EfficientDet: Có khả năng mở rộng và mạnh mẽ
Được phát triển bởi Google Vào cuối năm 2019, EfficientDet được thiết kế để vượt qua giới hạn về hiệu quả bằng một triết lý khác: mở rộng theo cấp số nhân . Nó mở rộng một cách có hệ thống độ phân giải, độ sâu và độ rộng của mạng để đạt được hiệu suất tốt hơn trong nhiều điều kiện hạn chế về tài nguyên.
Chi tiết EfficientDet:
- Tác giả: Mingxing Tan, Ruoming Pang, và Quoc V. Le
- Tổ chức:Google Research
- Ngày: 2019-11-20
- Arxiv:EfficientDet: detect Đối tượng Hiệu quả và Có khả năng Mở rộng
- GitHub:google/automl
Ưu điểm của BiFPN
EfficientDet sử dụng kiến trúc xương sống EfficientNet kết hợp với Mạng Kim tự tháp Đặc trưng Hai chiều có trọng số (BiFPN). Không giống như các FPN tiêu chuẩn cộng các đặc trưng mà không phân biệt, BiFPN gán trọng số cho các đặc trưng đầu vào, cho phép mạng học được tầm quan trọng của các thang đo đầu vào khác nhau. Mặc dù có độ chính xác cao, kiến trúc này liên quan đến các kết nối đa thang đo phức tạp, có thể tốn kém về mặt tính toán trên phần cứng không được tối ưu hóa cho các kiểu truy cập bộ nhớ không đều.
So sánh hiệu suất kỹ thuật
Bảng sau đây cung cấp sự so sánh trực tiếp các chỉ số. Lưu ý sự khác biệt đáng kể về tốc độ suy luận, đặc biệt là khi YOLOv10 lợi ích từ việc loại bỏ NMS trên không.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Phân tích chuyên sâu
- Độ trễ so với Độ chính xác: YOLOv10x đạt được mAP (Độ chính xác trung bình) vượt trội là 54,4% với TensorRT Độ trễ chỉ 12,2ms. Ngược lại, EfficientDet-d7 đạt được độ trễ tương đương là 53,7%. mAP Nhưng lại cần khoảng 128ms— chậm hơn hơn 10 lần . Điều này cho thấy bước tiến vượt bậc về tối ưu hóa thời gian thực giữa các thế hệ.
- Triển khai tại biên: NMS - Thiết kế miễn phí của YOLOv10 Đây là yếu tố thay đổi cuộc chơi trong việc triển khai mô hình . NMS Việc tăng tốc quá trình này thường gặp khó khăn trên các bộ xử lý thần kinh (NPU) hoặc chip nhúng. Loại bỏ bước này cho phép toàn bộ mô hình chạy như một đồ thị duy nhất, cải thiện đáng kể khả năng tương thích với các công cụ như OpenVINO và... TensorRT .
- Hiệu quả huấn luyện: EfficientDet dựa trên... TensorFlow hệ sinh thái và các chiến lược tìm kiếm AutoML phức tạp. Ultralytics YOLO các mô hình, bao gồm YOLOv10 và mẫu YOLO26 mới hơn, được xây dựng trên PyTorch và tích hợp các quy trình huấn luyện được tối ưu hóa, tự động xử lý các siêu tham số, giúp hội tụ nhanh hơn và giảm yêu cầu về bộ nhớ .
Lợi thế Hệ sinh thái Ultralytics
Việc lựa chọn mô hình hiếm khi chỉ dựa vào kiến trúc; nó còn liên quan đến quy trình làm việc. Ultralytics Các mô hình này mang lại trải nghiệm liền mạch cho các nhà phát triển.
- Dễ sử dụng: Với Ultralytics Python SDK , bạn có thể tải, huấn luyện và triển khai mô hình chỉ với ba dòng mã. Việc triển khai EfficientDet thường yêu cầu quản lý phụ thuộc phức tạp và hệ thống cũ. TensorFlow các phiên bản.
- Tính linh hoạt: Mặc dù EfficientDet chủ yếu là một công cụ phát hiện đối tượng, nhưng... Ultralytics Khung phần mềm hỗ trợ đầy đủ các tác vụ bao gồm Phân đoạn đối tượng , Ước tính tư thế và Phát hiện OBB (Hộp giới hạn định hướng) .
- Hệ sinh thái được duy trì tốt: Ultralytics Cung cấp các bản cập nhật thường xuyên, đảm bảo khả năng tương thích với các thư viện phần cứng và phần mềm mới nhất. Việc tích hợp với Nền tảng Ultralytics cho phép quản lý tập dữ liệu và huấn luyện trên đám mây dễ dàng.
Huấn luyện tinh gọn
Ultralytics Nó tự động xử lý các phép tăng cường dữ liệu phức tạp và lập lịch tốc độ học. Bạn không cần phải tự điều chỉnh các anchor hoặc trọng số loss để có được kết quả tốt nhất.
Ví dụ mã: Huấn luyện với Ultralytics
Đoạn mã sau đây minh họa cách huấn luyện một mô hình đơn giản bằng cách sử dụng... Ultralytics API. Điều này hoạt động hoàn toàn giống nhau đối với YOLOv10 , YOLO11 và YOLO26 được đề xuất.
from ultralytics import YOLO
# Load the latest recommended model (YOLO26)
model = YOLO("yolo26n.pt")
# Train on a custom dataset
# Ultralytics automatically handles device selection (CPU/GPU)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")
Vì sao chúng tôi khuyên dùng YOLO26
Trong khi YOLOv10 giới thiệu NMS Dựa trên khái niệm "miễn phí", Ultralytics YOLO26 đã tinh chỉnh và hoàn thiện nó. Được phát hành vào tháng 1 năm 2026, YOLO26 hiện là công nghệ tiên tiến nhất dành cho trí tuệ nhân tạo biên và hệ thống sản xuất.
YOLO26 áp dụng thiết kế không cần hệ thống quản lý mạng NMS từ đầu đến cuối, một thiết kế tiên phong của... YOLOv10 nhưng được nâng tầm nhờ một số cải tiến quan trọng:
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM (cụ thể là Kimi K2 của Moonshot AI), YOLO26 sử dụng sự kết hợp của... SGD và bộ tối ưu hóa Muon. Điều này giúp quá trình huấn luyện diễn ra ổn định hơn đáng kể và tốc độ hội tụ nhanh hơn so với các thế hệ trước.
- Loại bỏ DFL: Bằng cách loại bỏ hiện tượng suy hao tiêu điểm phân phối (DFL), YOLO26 đơn giản hóa cấu trúc lớp đầu ra. Điều này giúp việc xuất sang các định dạng như... trở nên dễ dàng hơn. CoreML hoặc ONNX Sạch hơn nữa, đảm bảo khả năng tương thích tốt hơn với các thiết bị biên công suất thấp.
- Hiệu năng: YOLO26 cung cấp khả năng suy luận CPU nhanh hơn tới 43% so với các phiên bản trước, biến nó trở thành lựa chọn lý tưởng cho các thiết bị không có GPU chuyên dụng, chẳng hạn như máy tính xách tay thông thường hoặc các thiết lập Raspberry Pi.
- Lợi ích cụ thể cho từng nhiệm vụ: Nó bao gồm các hàm mất mát chuyên dụng như ProgLoss và STAL , mang lại những cải tiến đáng kể trong việc nhận dạng các vật thể nhỏ - một điểm yếu thường gặp ở các bộ phát hiện trước đây.
Đề xuất Trường hợp Sử dụng
Khi nào nên lựa chọn Ultralytics YOLO26 (Được đề xuất)
- Ứng dụng thời gian thực: Xe tự lái, giám sát giao thông và phân tích thể thao, nơi độ trễ thấp là yếu tố cực kỳ quan trọng.
- Triển khai tại biên: Chạy trên điện thoại di động, máy bay không người lái hoặc thiết bị IoT, nơi mà... CPU Chu kỳ sạc và tuổi thọ pin bị hạn chế.
- Yêu cầu đa nhiệm: Khi dự án của bạn yêu cầu phân đoạn, ước lượng tư thế hoặc phát hiện các đối tượng xoay (OBB) ngoài các hộp giới hạn tiêu chuẩn.
Khi nào nên cân nhắc EfficientDet
- Nghiên cứu cũ: Nếu bạn đang sao chép các bài báo học thuật từ giai đoạn 2019-2020 mà đặc biệt so sánh hiệu năng với kiến trúc EfficientDet.
- Hạn chế về phần cứng (Cụ thể): Trong những trường hợp hiếm hoi khi các bộ tăng tốc phần cứng cũ được tối ưu hóa nghiêm ngặt cho cấu trúc BiFPN và không thể thích ứng với các khối rep-vgg hoặc transformer hiện đại.
Kết luận
EfficientDet là một cột mốc quan trọng trong việc mở rộng hiệu quả, nhưng lĩnh vực này đã tiến bộ hơn nữa. YOLOv10 đã chứng minh điều đó. NMS Việc phát hiện lỗi không cần bảo mật là hoàn toàn khả thi, và YOLO26 đã hoàn thiện nó cho môi trường sản xuất. Đối với các nhà phát triển đang tìm kiếm sự cân bằng tốt nhất giữa tốc độ, độ chính xác và tính dễ sử dụng, Ultralytics YOLO26 là sự lựa chọn tối ưu. Kiến trúc tinh gọn kết hợp với sức mạnh vượt trội. Ultralytics Hệ sinh thái phần mềm cho phép bạn chuyển từ ý tưởng đến triển khai nhanh hơn bao giờ hết.
Để tìm hiểu thêm về kiến trúc mô hình, hãy xem các bài so sánh của chúng tôi về YOLOv8 so với YOLOv10 hoặc khám phá Nền tảng Ultralytics để bắt đầu huấn luyện ngay hôm nay.