YOLOv7 so với YOLO11 So sánh kỹ thuật giữa các thiết bị dò thời gian thực
Sự phát triển của các kiến trúc phát hiện đối tượng đã được đánh dấu bằng những tiến bộ nhanh chóng về tốc độ, độ chính xác và tính dễ triển khai. Hướng dẫn này cung cấp một so sánh kỹ thuật chuyên sâu giữa YOLOv7 , một mô hình tiên tiến từ năm 2022, và YOLO11 , một phiên bản hiện đại từ... Ultralytics Vào năm 2024, chúng tôi phân tích sự khác biệt về kiến trúc, các chỉ số hiệu suất và tính phù hợp của chúng đối với các ứng dụng thị giác máy tính hiện đại.
Tóm tắt điều hành
Trong khi YOLOv7 Với những cải tiến đáng kể về kiến trúc như E-ELAN, YOLO11 đại diện cho một bước tiến vượt bậc về khả năng sử dụng, hỗ trợ hệ sinh thái và hiệu quả. YOLO11 Mang lại hiệu năng vượt trội trên phần cứng hiện đại, quy trình đào tạo dễ dàng hơn đáng kể và hỗ trợ đầy đủ các tác vụ vượt xa khả năng phát hiện đơn giản.
| Tính năng | YOLOv7 | YOLO11 |
|---|---|---|
| Kiến trúc | E-ELAN, dựa trên sự kết hợp | C3k2, SPPF, Tối ưu hóa cho GPU |
| Nhiệm vụ | Phát hiện, Tư thế, Phân đoạn (giới hạn) | detect, segment, classify, ước tính tư thế, obb, track |
| Dễ sử dụng | Độ phức tạp cao (nhiều kịch bản) | Hợp lý hóa (Thống nhất) Python API) |
| Hệ sinh thái | Phân tán (Trọng tâm nghiên cứu) | Tích hợp ( Ultralytics Hệ sinh thái) |
| Triển khai | Yêu cầu các tập lệnh xuất thủ công | Xuất dữ liệu chỉ với một dòng lệnh sang hơn 10 định dạng khác nhau. |
Phân tích chi tiết
YOLOv7 Kiến trúc "Túi đồ miễn phí"
Được phát hành vào tháng 7 năm 2022, YOLOv7 Nó được thiết kế để vượt qua giới hạn của việc phát hiện đối tượng trong thời gian thực bằng cách tối ưu hóa quá trình huấn luyện mà không làm tăng chi phí suy luận - một khái niệm được gọi là "túi quà tặng miễn phí".
Các Tính năng Kỹ thuật Chính:
- E-ELAN (Extended Efficient Layer Aggregation Network): Kiến trúc này cho phép mạng học được nhiều đặc điểm đa dạng hơn bằng cách kiểm soát các đường dẫn gradient ngắn nhất và dài nhất, cải thiện khả năng hội tụ.
- Điều chỉnh tỷ lệ mô hình: YOLOv7 Đã giới thiệu các phương pháp điều chỉnh tỷ lệ phức hợp, cho phép thay đổi đồng thời chiều sâu và chiều rộng để phù hợp với các ràng buộc tài nguyên khác nhau.
- Đầu phụ: Nó sử dụng bộ gán nhãn dẫn hướng "từ thô đến tinh", trong đó đầu phụ giúp giám sát quá trình học ở các lớp sâu hơn.
YOLOv7 Chi tiết:
- Các tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
- Tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Trung Quốc
- Ngày: 06/07/2022
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
YOLO11: Hiệu quả và tính linh hoạt được tinh chỉnh
YOLO11 xây dựng dựa trên Ultralytics Kế thừa truyền thống ưu tiên trải nghiệm của nhà phát triển song song với hiệu năng thô. Nó giới thiệu những cải tiến kiến trúc giúp giảm thiểu chi phí tính toán trong khi vẫn duy trì độ chính xác cao, làm cho nó hoạt động cực kỳ nhanh trên cả thiết bị biên và GPU đám mây.
Các Tính năng Kỹ thuật Chính:
- Khối C3k2: Một sự phát triển của thuật toán CSP (Cross Stage Partial) được sử dụng trong các phiên bản trước, cung cấp khả năng trích xuất đặc trưng tốt hơn với ít tham số hơn.
- SPPF nâng cao: Lớp Spatial Pyramid Pooling - Fast được tối ưu hóa để nắm bắt ngữ cảnh đa tỷ lệ hiệu quả hơn.
- Tính linh hoạt trong công việc: Không giống như YOLOv7 Đây chủ yếu là một mô hình phát hiện với một số khả năng nhận diện tư thế. YOLO11 Được thiết kế từ đầu để xử lý việc phân đoạn đối tượng , ước lượng tư thế , hộp giới hạn định hướng (OBB) và phân loại một cách tự nhiên.
- Đào tạo tối ưu hóa: YOLO11 Sử dụng các chiến lược tăng cường dữ liệu tiên tiến và các hàm mất mát được cải tiến giúp ổn định quá trình huấn luyện, giảm thiểu việc người dùng phải tinh chỉnh siêu tham số.
YOLO11 Chi tiết:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 27/09/2024
- Tài liệu: Tài liệu chính thức
So sánh hiệu suất
Khi so sánh các mô hình này, điều quan trọng là phải xem xét sự đánh đổi giữa tốc độ (độ trễ) và độ chính xác ( mAP ). YOLO11 Nhìn chung, phương pháp này mang lại sự cân bằng tốt hơn, cung cấp độ chính xác cao với yêu cầu tính toán (FLOPs) thấp hơn đáng kể và tốc độ suy luận nhanh hơn trên các GPU hiện đại như... NVIDIA T4.
Hiệu quả là yếu tố then chốt
YOLO11 Đạt được độ chính xác tương đương hoặc tốt hơn so với các mô hình cũ hơn với số lượng tham số ít hơn. "Hiệu quả tham số" này trực tiếp dẫn đến việc sử dụng bộ nhớ thấp hơn trong quá trình huấn luyện và thực thi nhanh hơn trên các thiết bị biên như... NVIDIA Jetson Orin Nano.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Như thể hiện trong bảng, YOLO11x vượt trội hơn YOLOv7 -X về độ chính xác (54,7% so với 53,1%) trong khi vẫn duy trì mức độ tương đương. GPU tốc độ suy luận. Quan trọng hơn, các biến thể nhỏ hơn của YOLO11 (n/s/m) mang lại lợi thế tốc độ đáng kinh ngạc cho các ứng dụng cần xử lý thời gian thực, chẳng hạn như phân tích video .
Hệ sinh thái và Dễ sử dụng
Yếu tố khác biệt quan trọng nhất đối với các nhà phát triển là hệ sinh thái xung quanh mô hình. Đây là nơi mà Ultralytics Các mô hình xuất sắc.
Lợi thế của Ultralytics
YOLO11 được tích hợp vào ultralytics Python gói phần mềm này cung cấp giao diện thống nhất cho toàn bộ vòng đời của học máy.
- API đơn giản: Bạn có thể tải, huấn luyện và xác thực mô hình chỉ với vài dòng mã. Python mã số.
- Hệ sinh thái được duy trì tốt: Ultralytics Cộng đồng cung cấp hỗ trợ tích cực, cập nhật thường xuyên và tích hợp liền mạch với các công cụ như Ultralytics Platform để quản lý dữ liệu.
- Tính linh hoạt trong triển khai: Xuất khẩu YOLO11 ĐẾN ONNX , TensorRT , CoreML , hoặc TFLite chỉ cần một lệnh duy nhất. Ngược lại, YOLOv7 Thường đòi hỏi các kho lưu trữ phức tạp của bên thứ ba hoặc điều chỉnh kịch bản thủ công cho các định dạng xuất khác nhau.
So sánh mã nguồn:
Đào tạo YOLO11 :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Hướng dẫn sử dụng YOLOv7 : Thông thường, cần sao chép kho lưu trữ, cài đặt các thư viện phụ thuộc cụ thể và chạy các lệnh dòng lệnh dài:
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
Các trường hợp sử dụng thực tế
Khi nào nên chọn YOLOv7
- So sánh hiệu năng với các công nghệ cũ: Nếu bạn đang thực hiện nghiên cứu học thuật và cần so sánh các kiến trúc mới với các tiêu chuẩn tiên tiến nhất năm 2022.
- Các triển khai tùy chỉnh cụ thể: Nếu bạn có một quy trình hiện có được tùy chỉnh nhiều xung quanh các yêu cầu cụ thể YOLOv7 đầu vào/đầu ra tensor Cấu trúc hiện tại không cho phép tái cấu trúc.
Khi nào nên chọn YOLO11
- Ứng dụng trong sản xuất: Dành cho các ứng dụng thương mại trong lĩnh vực bán lẻ, an ninh hoặc sản xuất, nơi độ tin cậy và dễ bảo trì là yếu tố tối quan trọng.
- Điện toán biên: Hiệu quả của YOLO11n và YOLO11s khiến chúng trở nên lý tưởng để chạy trên Raspberry Pi hoặc các thiết bị di động có nguồn điện hạn chế.
- Ứng dụng đa nhiệm: Nếu dự án của bạn yêu cầu phát hiện đối tượng, phân đoạn chúng và ước tính tư thế của chúng cùng một lúc, YOLO11 Nó xử lý việc này một cách tự nhiên.
Xu hướng tiên tiến: YOLO26
Trong khi YOLO11 Đây là sự lựa chọn tuyệt vời cho hầu hết các ứng dụng. Ultralytics Tiếp tục đổi mới. Mẫu YOLO26 vừa được ra mắt (tháng 1 năm 2026) đã đẩy giới hạn lên một tầm cao mới.
- NMS từ đầu đến cuối - Miễn phí: YOLO26 loại bỏ hiện tượng Non-Maximmum Suppression (Ứng dụng loại bỏ tối đa không cần thiết) NMS ), dẫn đến quy trình triển khai đơn giản hơn và độ trễ thấp hơn.
- Tối ưu hóa tại biên: Bằng cách loại bỏ tổn thất tiêu điểm phân phối (DFL), YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% , trở thành lựa chọn vượt trội cho AI tại biên.
- Trình tối ưu hóa MuSGD: Lấy cảm hứng từ huấn luyện LLM, trình tối ưu hóa lai này đảm bảo sự hội tụ ổn định.
Đối với các nhà phát triển đang bắt đầu một dự án hiệu năng cao mới hiện nay, việc tìm hiểu YOLO26 là rất được khuyến khích.
Kết luận
Cả hai YOLOv7 Và YOLO11 Đây là những cột mốc quan trọng trong lịch sử thị giác máy tính. YOLOv7 YOLO11 đã giới thiệu những khái niệm kiến trúc mạnh mẽ, góp phần thúc đẩy sự phát triển của lĩnh vực này. Tuy nhiên, YOLO11 đã tinh chỉnh những ý tưởng đó thành một gói sản phẩm thực tiễn hơn, nhanh hơn và thân thiện hơn với người dùng.
Đối với đại đa số người dùng—từ các nhà nghiên cứu đến các kỹ sư doanh nghiệp— YOLO11 (hoặc YOLO26 phiên bản mới hơn) cung cấp sự kết hợp tốt nhất giữa độ chính xác, tốc độ và trải nghiệm dành cho nhà phát triển, được hỗ trợ bởi nền tảng Ultralytics mạnh mẽ.
Các Mô hình Khác để Khám phá
- YOLO26 : Tin tức mới nhất NMS - Mô hình miễn phí cho tốc độ và độ chính xác tối ưu.
- YOLOv10 : Người tiên phong của NMS -Đào tạo miễn phí về phát hiện thời gian thực.
- RT-DETR : Một thiết bị dò dựa trên biến áp dành cho các tình huống đòi hỏi độ chính xác cao.
- SAM 2 : Mô hình Phân đoạn Bất kỳ của Meta dành cho phân đoạn không cần dữ liệu huấn luyện.