So sánh EfficientDet với YOLOv7 Điều hướng các kiến trúc phát hiện đối tượng thời gian thực
Việc lựa chọn kiến trúc mạng nơ-ron hiệu quả nhất là yếu tố then chốt quyết định sự thành công của bất kỳ dự án thị giác máy tính nào . Khi nhu cầu về các giải pháp AI hiệu năng cao tăng nhanh, việc so sánh các mô hình đã được khẳng định như EfficientDet và... trở nên cần thiết. YOLOv7 Điều này trở nên thiết yếu đối với các nhà phát triển nhằm tối ưu hóa cả độ chính xác và hiệu quả tính toán.
Bản phân tích kỹ thuật toàn diện này sẽ đi sâu vào các sắc thái kiến trúc, các chỉ số hiệu suất và các kịch bản triển khai lý tưởng cho cả hai mô hình. Ngoài ra, chúng tôi sẽ minh họa lý do tại sao hệ sinh thái tích hợp được cung cấp bởi Ultralytics —đỉnh cao là Ultralytics YOLO26 hiện đại —cung cấp một giải pháp thay thế vượt trội cho các tác vụ thị giác máy tính hiện đại.
Hiểu về EfficientDet
EfficientDet được thiết kế để tối đa hóa độ chính xác đồng thời quản lý chi phí tính toán một cách có hệ thống trên nhiều ràng buộc tài nguyên khác nhau. Nó đạt được điều này thông qua một phương pháp mới về mở rộng quy mô và kết hợp các đặc trưng.
Thông tin chi tiết về EfficientDet:
Tác giả: Mingxing Tan, Ruoming Pang, và Quốc V. Lê
Tổ chức: Google
Ngày: 20/11/2019
Arxiv: EfficientDet: Phát hiện đối tượng hiệu quả và có khả năng mở rộng
GitHub: Kho lưu trữ Google AutoML
Kiến trúc và các cải tiến
Về bản chất, EfficientDet sử dụng Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN). Không giống như các FPN truyền thống, BiFPN cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng bằng cách đưa vào các trọng số có thể học được để tìm hiểu tầm quan trọng của các đặc trưng đầu vào khác nhau. Điều này được kết hợp với phương pháp mở rộng tỷ lệ phức hợp giúp mở rộng đồng đều độ phân giải, độ sâu và độ rộng của mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp cùng một lúc.
Điểm mạnh và Điểm yếu
EfficientDet có khả năng mở rộng cao. Các biến thể nhỏ hơn của nó (d0-d2) cực kỳ hiệu quả về tham số, khiến chúng phù hợp với các môi trường có giới hạn lưu trữ nghiêm ngặt. Các biến thể lớn hơn (như d7) đẩy giới hạn của Độ chính xác trung bình ( mAP ) lên mức cao nhất cho việc xử lý ngoại tuyến.
Tuy nhiên, EfficientDet phụ thuộc rất nhiều vào các triển khai TensorFlow cũ và các quy trình AutoML phức tạp. Cơ sở hạ tầng lỗi thời này khiến việc tích hợp nó vào các hệ thống hiện đại trở nên vô cùng khó khăn. PyTorch các quy trình làm việc tập trung vào. Hơn nữa, nó gặp phải độ trễ suy luận đáng kể trên các thiết bị biên khi mở rộng quy mô lên các biến thể có độ chính xác cao hơn.
Hiểu biết YOLOv7
YOLOv7 Được giới thiệu vào năm 2022, công nghệ này đã mang lại bước tiến vượt bậc về tốc độ và độ chính xác cho các ứng dụng thời gian thực, thiết lập một tiêu chuẩn mới cho lĩnh vực được sử dụng rộng rãi. YOLO gia đình vào thời điểm đó.
Thông tin chi tiết về YOLOv7 :
Các tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
Đơn vị tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Đài Loan
Ngày: 06/07/2022
Arxiv: YOLOv7 : Mô hình "túi quà tặng miễn phí" có thể huấn luyện thiết lập tiêu chuẩn mới cho các bộ phát hiện đối tượng thời gian thực
GitHub: Kho lưu trữ chính thức YOLOv7
Kiến trúc và các cải tiến
YOLOv7 Giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Cải tiến kiến trúc này giúp cải thiện khả năng học tập của mạng mà không phá hủy đường dẫn gradient ban đầu, cho phép mô hình học được nhiều đặc trưng đa dạng hơn một cách hiệu quả. Ngoài ra, nó triển khai "túi quà tặng có thể huấn luyện", tận dụng các kỹ thuật như tái tham số hóa theo kế hoạch và gán nhãn động để tăng độ chính xác mà không làm tăng chi phí suy luận.
Điểm mạnh và Điểm yếu
YOLOv7 Nó hoạt động xuất sắc trong các tình huống thời gian thực, chẳng hạn như phân tích video và điều hướng robot tốc độ cao. Nó có khả năng mở rộng vượt trội trên các GPU cấp máy chủ và cung cấp triển khai PyTorch gốc, giúp các nhà nghiên cứu học thuật dễ dàng tiếp cận.
Mặc dù có tốc độ ấn tượng, YOLOv7 vẫn dựa vào phương pháp triệt tiêu không tối đa (Non-Maximum Suppression) NMS (Đối với quá trình xử lý hậu kỳ), điều này có thể gây ra độ trễ thay đổi trong các cảnh phức tạp. Hơn nữa, dung lượng bộ nhớ mà nó sử dụng trong quá trình huấn luyện lớn hơn đáng kể so với các thế hệ mới hơn, đòi hỏi phần cứng mạnh mẽ hơn để xử lý kích thước lô lớn.
So sánh hiệu năng và số liệu
Khi so sánh các mô hình này, việc xem xét sự đánh đổi giữa độ chính xác, tốc độ suy luận và kích thước tham số là rất quan trọng. Dưới đây là đánh giá chi tiết về các mô hình EfficientDet và... YOLOv7 cấu hình.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Tóm tắt về hiệu suất
Trong khi EfficientDet-d7 đạt được hiệu suất cao nhất mAP Nó yêu cầu gần 128ms trên đường truyền T4. GPU Ngược lại hoàn toàn, YOLOv7x đạt được con số tương đương là 53,1. mAP Với tốc độ cực nhanh chỉ 11,57ms, thể hiện bước nhảy vọt vượt bậc về hiệu quả tính toán cho các triển khai thời gian thực.
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa EfficientDet và YOLOv7 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn EfficientDet
EfficientDet là một lựa chọn mạnh mẽ cho:
- Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
- Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
- Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.
Khi nào nên chọn YOLOv7
YOLOv7 được khuyến nghị cho:
- So sánh hiệu quả học tập: Tái tạo các kết quả tiên tiến nhất thời kỳ năm 2022 hoặc nghiên cứu tác động của E-ELAN và các kỹ thuật "túi quà tặng miễn phí" có thể huấn luyện được.
- Nghiên cứu về tái tham số hóa: Điều tra các phép tích chập tái tham số hóa theo kế hoạch và các chiến lược mở rộng mô hình phức hợp.
- Các quy trình tùy chỉnh hiện có: Các dự án với các quy trình được tùy chỉnh cao được xây dựng dựa trên... YOLOv7 Kiến trúc đặc thù của nó không dễ dàng để chỉnh sửa lại.
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Lợi thế của Ultralytics
Việc lựa chọn kiến trúc phù hợp không chỉ dựa vào các số liệu thô; nó còn bao gồm việc đánh giá toàn bộ vòng đời của máy học. Hệ sinh thái Ultralytics cung cấp trải nghiệm phát triển vượt trội, giúp giảm đáng kể rào cản gia nhập đối với việc triển khai AI mạnh mẽ.
- Dễ sử dụng: Ultralytics cung cấp một giải pháp thống nhất cao. Python API. Các nhà phát triển có thể huấn luyện, xác thực và xuất mô hình chỉ với một vài dòng mã, loại bỏ nhu cầu quản lý các cơ sở mã phức tạp, phân mảnh thường thấy ở EfficientDet.
- Hệ sinh thái được duy trì tốt: Được hưởng lợi từ các bản cập nhật nhanh chóng, tài liệu đầy đủ và một cộng đồng năng động, Ultralytics đảm bảo khả năng tương thích với các khung triển khai mới nhất như TensorRT Và OpenVINO .
- Yêu cầu bộ nhớ: Bằng cách sử dụng công nghệ tối ưu hóa cao. PyTorch bộ tải dữ liệu và cấu trúc mạng được tối ưu hóa, Ultralytics YOLO các mô hình yêu cầu ít hơn đáng kể CUDA Khả năng ghi nhớ trong quá trình huấn luyện so với các mạng đa nhánh và các mô hình sử dụng nhiều transformer.
- Tính linh hoạt: Không giống như các kiến trúc cũ chỉ giới hạn ở việc phát hiện khung bao, Ultralytics Các mô hình này là những cỗ máy đa nhiệm mạnh mẽ, hỗ trợ Phân đoạn đối tượng , Ước tính tư thế và Hộp giới hạn định hướng (OBB) .
Hiệu Quả Huấn Luyện với Ultralytics
Đoạn mã sau đây minh họa sự đơn giản của việc huấn luyện một mô hình hiện đại bằng cách sử dụng... Ultralytics Python gói phần mềm này hoàn toàn trái ngược với việc cấu hình hệ thống cũ. TensorFlow đường ống.
from ultralytics import YOLO
# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the model to TensorRT for deployment
model.export(format="engine")
Tiêu chuẩn mới: YOLO26
Trong khi YOLOv7 Và EfficientDet đã đặt nền móng cho thị giác máy tính hiện đại, nhưng bối cảnh đã thay đổi đáng kể với sự ra mắt của Ultralytics YOLO26 vào tháng 1 năm 2026. Được thiết kế để đạt độ chính xác cực cao và hiệu năng vượt trội tại cạnh, YOLO26 là sự lựa chọn tối ưu cho tất cả các dự án thị giác máy tính mới.
Những đổi mới chính của YOLO26
- Thiết kế không cần NMS từ đầu đến cuối: Được xây dựng trên nền tảng của YOLOv10 , YOLO26 là thiết kế từ đầu đến cuối. Bằng cách loại bỏ hoàn toàn hiện tượng Non-Maximum Suppression (NMS) ( NMS (Bằng cách xử lý hậu kỳ), nó mang lại độ trễ thấp hơn và ổn định hơn, điều này rất quan trọng đối với các hệ thống an toàn trọng yếu như xe tự lái.)
- Suy luận CPU nhanh hơn tới 43%: Nhờ loại bỏ Distribution Focal Loss (DFL) , YOLO26 có quy trình xuất dữ liệu được đơn giản hóa đáng kể và tốc độ vượt trội trên các thiết bị biên như Raspberry Pi, trở thành nhà vô địch không thể tranh cãi trong lĩnh vực điện toán biên.
- Trình tối ưu hóa MuSGD: YOLO26 tích hợp Trình tối ưu hóa MuSGD mang tính cách mạng — một sự kết hợp giữa... SGD và Muon được truyền cảm hứng từ những cải tiến trong huấn luyện LLM của Moonshot AI. Điều này dẫn đến động lực huấn luyện ổn định đáng kể và tốc độ hội tụ nhanh hơn nhiều.
- ProgLoss + STAL: Việc tích hợp Progressive Loss và Scale-Targeted Alignment Loss giúp cải thiện đáng kể khả năng của mô hình. detect Những vật thể nhỏ bé, giải quyết một vấn đề nan giải lớn đối với hình ảnh chụp từ máy bay không người lái và hệ thống báo động an ninh .
- Cải tiến chuyên biệt cho từng nhiệm vụ: YOLO26 không chỉ là một bộ dò tìm đối tượng. Nó tích hợp hàm mất mát phân đoạn ngữ nghĩa và proto đa tỷ lệ để phân đoạn hoàn hảo, ước lượng logarit xác suất dư (RLE) để theo dõi tư thế siêu chính xác và hàm mất mát góc chuyên dụng để giải quyết sự mơ hồ của ranh giới OBB .
Khám phá các mô hình thay thế
Mặc dù YOLO26 đại diện cho đỉnh cao của công nghệ hiện tại, nhưng Ultralytics Hệ sinh thái hỗ trợ nhiều mô hình được thiết kế riêng cho các trường hợp sử dụng khác nhau.
Đối với các nhà phát triển quản lý các hệ thống cũ vẫn yêu cầu mở rộng quy mô không cần neo truyền thống, YOLO11 vẫn là một lựa chọn mạnh mẽ và được hỗ trợ cao. Ultralytics Ngoài ra, đối với các trường hợp yêu cầu rõ ràng kiến trúc dựa trên transformer, RT-DETR cung cấp khả năng phát hiện thời gian thực bằng cách sử dụng vision transformer, thu hẹp khoảng cách giữa các cơ chế chú ý cao cấp và tốc độ thực thi thời gian thực.
Tóm lại, trong khi EfficientDet cung cấp những hiểu biết mang tính học thuật về việc mở rộng quy mô hợp chất và YOLOv7 Cung cấp hiệu năng thời gian thực mạnh mẽ, nền tảng Ultralytics sẽ phục vụ tốt nhất cho các doanh nghiệp hiện đại. Bằng cách tận dụng YOLO26, các nhóm có thể đảm bảo hiệu năng tối đa, giảm thiểu khó khăn trong quá trình đào tạo và đảm bảo khả năng tương thích trong tương lai cho các triển khai AI của họ.