Chuyển đến nội dung

Ultralytics YOLOv10 so với YOLOv5 Sự tiến hóa của phát hiện đối tượng thời gian thực

Việc lựa chọn mô hình phát hiện đối tượng phù hợp đòi hỏi sự cân bằng giữa hiệu quả kiến ​​trúc, các ràng buộc triển khai và sự hỗ trợ của cộng đồng. Bài so sánh toàn diện này khám phá những khác biệt kỹ thuật giữa YOLOv10 , một bước đột phá trong giới học thuật về phát hiện từ đầu đến cuối, và YOLOv5 , tiêu chuẩn ngành huyền thoại đã định nghĩa lại tính dễ sử dụng trong thị giác máy tính.

Cả hai mô hình đều thể hiện những bước tiến đáng kể trong lĩnh vực này. YOLO dòng dõi. Trong khi YOLOv5 Đã thiết lập tiêu chuẩn vàng về trải nghiệm người dùng và độ tin cậy. YOLOv10 đẩy mạnh giới hạn độ trễ bằng cách loại bỏ hiện tượng triệt tiêu không tối đa ( NMS ) từ quy trình suy luận. Đối với các nhà phát triển đang tìm kiếm tốc độ và kiến ​​trúc đầu cuối tiên tiến nhất, Ultralytics YOLO26 mới ra mắt được xây dựng dựa trên những nền tảng này với khả năng tối ưu hóa vượt trội cho các thiết bị biên.

So sánh Các chỉ số Hiệu suất

Bảng dưới đây nêu bật sự đánh đổi về hiệu năng giữa hai kiến ​​trúc. YOLOv10 thường mang lại độ chính xác cao hơn ( mAP ) và loại bỏ NMS chi phí chung, trong khi YOLOv5 Nó vẫn là một lựa chọn có tính cạnh tranh cao nhờ vào sự hỗ trợ triển khai rộng rãi và tính ổn định của nó.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv10: Nhà đổi mới từ đầu đến cuối

YOLOv10 giới thiệu một sự thay đổi mô hình bằng cách loại bỏ sự cần thiết của việc ức chế không tối đa (Non-Maximum Suppression) NMS ) trong quá trình xử lý hậu kỳ. Điều này cho phép triển khai thực sự từ đầu đến cuối, giảm độ trễ và độ phức tạp của suy luận.

Các tính năng kiến trúc chính

  • NMS - Đào tạo miễn phí: Sử dụng các bài tập kép nhất quán cho NMS - Huấn luyện miễn phí, cho phép mô hình dự đoán trực tiếp các hộp giới hạn riêng biệt.
  • Thiết kế hiệu quả toàn diện: Tối ưu hóa các thành phần khác nhau (như trục chính và cổ chai) để giảm sự dư thừa về mặt tính toán.
  • Giảm kích thước bản đồ đặc trưng bằng phương pháp tách kênh không gian: Cải thiện khả năng giữ lại thông tin trong quá trình giảm kích thước bản đồ đặc trưng.
  • Thiết kế khối dựa trên thứ hạng: Điều chỉnh các giai đoạn của khối để giảm sự dư thừa dựa trên phân tích thứ hạng nội tại.

Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Ngày: 23/05/2024
Liên kết: Arxiv | GitHub

Độ trễ đầu cuối

Bằng cách loại bỏ NMS , YOLOv10 Giảm đáng kể sự biến thiên trong suy luận. Trong tiêu chuẩn YOLO đường ống, NMS Thời gian xử lý tỷ lệ thuận với số lượng đối tượng được phát hiện, có thể gây ra hiện tượng tăng đột biến độ trễ trong các cảnh có nhiều đối tượng. YOLOv10 Thời gian xuất tín hiệu ổn định của nó làm cho nó trở nên lý tưởng cho các hệ thống thời gian thực với ngân sách thời gian nghiêm ngặt.

Tìm hiểu thêm về YOLOv10

YOLOv5 Tiêu chuẩn ngành

Được phát hành bởi Ultralytics vào năm 2020, YOLOv5 Nó đã cách mạng hóa lĩnh vực này không chỉ thông qua kiến ​​trúc mà còn thông qua khả năng truy cập. Nó ưu tiên trải nghiệm liền mạch "ngay từ khi cài đặt", khả năng xuất khẩu mạnh mẽ và một hệ sinh thái hỗ trợ rộng lớn.

Điểm mạnh chính

  • Hệ sinh thái hoàn thiện: Tài liệu đầy đủ, hướng dẫn và hỗ trợ cộng đồng giúp việc khắc phục sự cố trở nên dễ dàng.
  • Khả năng tương thích rộng: Hỗ trợ xuất khẩu cho TFLite , CoreML , ONNX , Và TensorRT Đảm bảo khả năng triển khai trên hầu hết mọi phần cứng, từ thiết bị iOS đến TPU biên.
  • Tính linh hoạt: Hỗ trợ gốc cho việc phân đoạn đối tượng và phân loại hình ảnh cùng với phát hiện.
  • Tính ổn định của quá trình huấn luyện: Được biết đến với khả năng chống chịu tốt với các biến thể siêu tham số và hội tụ đáng tin cậy trên nhiều tập dữ liệu tùy chỉnh khác nhau.

Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 26/06/2020
Liên kết: GitHub | Tài liệu

Tìm hiểu thêm về YOLOv5

So sánh chi tiết

Kiến trúc và huấn luyện

YOLOv10 Nó tận dụng các tối ưu hóa kiểu Transformer và khả năng phân biệt kênh nâng cao để đạt được độ chính xác cao với ít tham số hơn. Chiến lược "phân công kép nhất quán" cho phép nó học cách ghép cặp một-đối-một trong quá trình huấn luyện, loại bỏ... NMS yêu cầu.

YOLOv5 Nó sử dụng kiến ​​trúc xương sống CSPDarknet cổ điển với phần cổ PANet, được tối ưu hóa để cân bằng giữa tốc độ và độ chính xác. Nó sử dụng phương pháp phát hiện dựa trên neo, đòi hỏi phải tinh chỉnh hộp neo cẩn thận để đạt hiệu suất tối ưu trên các tập dữ liệu độc đáo, mặc dù tính năng tự động tiến hóa neo của nó sẽ xử lý việc này một cách tự động cho hầu hết người dùng.

Các trường hợp sử dụng và Ứng dụng thực tế

Các kịch bản lý tưởng cho YOLOv10 :

  • Đám đông mật độ cao: Ở đâu NMS Thông thường, quá trình xử lý sẽ chậm lại do có nhiều ô chồng chéo nhau.
  • Robot độ trễ thấp: Nơi thời gian suy luận nhất quán là yếu tố then chốt cho các vòng điều khiển.
  • Nghiên cứu học thuật: Để nghiên cứu các cơ chế phát hiện từ đầu đến cuối và các chiến lược gán nhãn.

Các kịch bản lý tưởng cho YOLOv5 :

  • Triển khai trên thiết bị di động: Các quy trình đã được chứng minh cho Android Và iOS ứng dụng sử dụng TFLite Và CoreML .
  • Kiểm tra công nghiệp: Nơi mà tính ổn định lâu dài và khả năng tái lập quan trọng hơn công nghệ tiên tiến nhất. mAP .
  • Các dự án dành cho người mới bắt đầu: Điểm khởi đầu dễ nhất cho sinh viên học về thị giác máy tính .

Dễ sử dụng và hệ sinh thái

YOLOv5 Nền tảng này nổi bật nhờ khả năng tích hợp vào hệ sinh thái Ultralytics . Người dùng có thể trực quan hóa các lần chạy huấn luyện với Comet ML . track Các thí nghiệm và triển khai mô hình một cách liền mạch. Nền tảng Ultralytics còn đơn giản hóa điều này hơn nữa bằng cách cung cấp giao diện không cần lập trình để quản lý tập dữ liệu và huấn luyện mô hình.

Trong khi YOLOv10 được tích hợp vào Ultralytics Python Gói này, với cú pháp quen thuộc, chủ yếu là một đóng góp mang tính học thuật. Do đó, nó có thể không nhận được tần suất cập nhật hoặc độ sâu bảo trì như phần cốt lõi. Ultralytics các mẫu như YOLO11 hoặc YOLO26 tiên tiến.

Ví dụ mã

Cả hai mẫu đều có chung thiết kế thống nhất. Ultralytics API giúp việc chuyển đổi giữa chúng để so sánh hiệu năng trở nên dễ dàng.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")

# Train YOLOv10 on a custom dataset
model_v10.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a pretrained YOLOv5 model (via the v8/v11/26 compatible loader)
model_v5 = YOLO("yolov5nu.pt")

# Train YOLOv5 using the modern Ultralytics engine
model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)

Kết luận: Bạn nên chọn cái nào?

Nếu ưu tiên của bạn là độ chính xác cao nhấtđộ trễ ổn định , đặc biệt là trong các cảnh đông người dùng, YOLOv10 là một lựa chọn tuyệt vời. Những cải tiến về kiến ​​trúc của nó mang đến cái nhìn thoáng qua về tương lai của công nghệ. NMS - Phát hiện miễn phí.

Tuy nhiên, nếu bạn cần một giải pháp đã được kiểm chứng qua thực tế với hướng dẫn triển khai chi tiết, hỗ trợ phần cứng rộng rãi và độ ổn định tối đa, YOLOv5 vẫn là một lựa chọn mạnh mẽ.

Dành cho các nhà phát triển muốn có được những ưu điểm tốt nhất của cả hai thế giới — suy luận hoàn toàn không cần NMS , độ chính xác vượt trội và sự hỗ trợ đầy đủ từ phía nhà phát triển. Ultralytics hệ sinh thái—chúng tôi đặc biệt khuyên bạn nên khám phá YOLO26 . YOLO26 tích hợp NMS - Thiết kế miễn phí tiên phong bởi YOLOv10 nhưng được cải tiến với trình tối ưu hóa MuSGD và các hàm mất mát được tối ưu hóa, giúp tăng tốc độ lên tới 43%. CPU suy luận.

Khám phá thêm các mô hình

  • YOLO11 : Thế hệ SOTA trước đó, mang lại tính linh hoạt tuyệt vời trong nhiều tác vụ.
  • RT-DETR : Một bộ dò thời gian thực dựa trên biến áp, đồng thời cũng loại bỏ NMS .
  • YOLO26 : Mẫu mới nhất và tiên tiến nhất từ... Ultralytics , với khả năng xử lý từ đầu đến cuối và tối ưu hóa tại biên.

Bình luận