Chuyển đến nội dung

YOLOv10 so với YOLOv7 Sự tiến hóa của phát hiện đối tượng thời gian thực

Sự phát triển nhanh chóng của thị giác máy tính trong vài năm qua đã tạo ra các kiến ​​trúc ngày càng hiệu quả hơn cho các ứng dụng thời gian thực. Việc so sánh YOLOv10YOLOv7 làm nổi bật một giai đoạn chuyển tiếp quan trọng trong quá trình tiến hóa này. Trong khi đó, YOLOv7 Đã giới thiệu các chiến lược đào tạo hiệu quả cao và mở rộng quy mô kiến ​​trúc. YOLOv10 đã cách mạng hóa việc triển khai bằng cách loại bỏ sự phụ thuộc lâu nay vào phương pháp đàn áp không tối đa (Non-Maximum Suppression) ( NMS ).

Cả hai mô hình đều đã vượt qua những giới hạn của việc phát hiện đối tượng khi được ra mắt, tuy nhiên hệ sinh thái Ultralytics hiện đại và sự ra đời của các mô hình thế hệ tiếp theo như YOLO26 mang đến quy trình làm việc vượt trội hơn nhiều cho các chuyên gia AI hiện nay.

Hồ sơ và nguồn gốc của các mẫu sản phẩm

Việc hiểu rõ nguồn gốc của những mô hình này cung cấp bối cảnh quan trọng liên quan đến các lựa chọn thiết kế kiến ​​trúc và nghiên cứu học thuật thúc đẩy chúng.

YOLOv10 Chi tiết

Tìm hiểu thêm về YOLOv10

YOLOv7 Chi tiết

Tìm hiểu thêm về YOLOv7

Đổi mới Kiến trúc

Cái YOLOv7 Tiếp cận

Ra mắt năm 2022, YOLOv7 Bài báo tập trung mạnh vào việc tối ưu hóa đường dẫn gradient. Nó giới thiệu Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN), cho phép mô hình học được nhiều đặc trưng đa dạng hơn mà không làm hỏng đường dẫn gradient ban đầu. Hơn nữa, các tác giả đã triển khai phương pháp "túi quà tặng có thể huấn luyện", sử dụng các kỹ thuật tái tham số hóa trong quá trình huấn luyện có thể được loại bỏ trong quá trình suy luận để duy trì tốc độ thực thi nhanh. Mặc dù có những tối ưu hóa ấn tượng này, YOLOv7 vẫn phụ thuộc rất nhiều vào NMS Để xử lý hậu kỳ, tạo ra độ trễ thay đổi trong quá trình phân tích cảnh phức tạp.

Cái YOLOv10 Đột phá

YOLOv10 đã giải quyết NMS Điểm nghẽn được giải quyết trực tiếp. Bằng cách áp dụng các bài tập kép nhất quán trong quá trình đào tạo, nhóm nghiên cứu Đại học Thanh Hoa đã tạo điều kiện để... NMS - Phát hiện đầu cuối miễn phí. Phương pháp hai đầu này sử dụng một nhánh với các gán một-nhiều cho các tín hiệu giám sát phong phú trong quá trình huấn luyện, và một nhánh khác với các gán một-một cho NMS Suy luận không mất dữ liệu. Sự thay đổi kiến ​​trúc này đảm bảo độ trễ suy luận cực thấp, nhất quán, phù hợp với phân tích video tốc độ cao. Hơn nữa, YOLOv10 Nó sử dụng thiết kế mô hình toàn diện hướng đến hiệu quả và độ chính xác, loại bỏ sự dư thừa về mặt tính toán thường thấy ở các thế hệ trước.

Tác động của xử lý hậu kỳ

Loại bỏ NMS Xử lý hậu kỳ không chỉ giúp tăng tốc quá trình suy luận mà còn đơn giản hóa đáng kể việc triển khai trên phần cứng AI biên, chẳng hạn như bộ tăng tốc AI và NPU, nơi cần xử lý hậu kỳ tùy chỉnh. NMS Việc biên dịch các thao tác này nổi tiếng là khó khăn.

So sánh hiệu suất

Khi so sánh các chỉ số thô trên tập dữ liệu MS COCO , khoảng cách giữa các thế hệ trở nên rõ ràng. YOLOv10 Đạt được sự cân bằng tối ưu hơn nhiều giữa các tham số, yêu cầu tính toán và độ chính xác.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Như đã thấy ở trên, YOLOv10x mang lại hiệu suất vượt trội. mAP Hiệu suất đạt 54,4% so với 53,1% của YOLOv7x, trong khi sử dụng ít hơn khoảng 20% ​​tham số. Hơn nữa, phiên bản nhẹ này còn có ưu điểm là 54,4%. YOLOv10 Các mô hình (Nano và Small) cung cấp tốc độ triển khai TensorRT vượt trội, khiến chúng trở nên rất hấp dẫn cho việc triển khai trên thiết bị di động.

Lợi thế Hệ sinh thái Ultralytics

Mặc dù việc nghiên cứu các tài liệu kiến ​​trúc rất hữu ích, nhưng sự phát triển thị giác máy tính hiện đại dựa trên các khung phần mềm mạnh mẽ và được bảo trì tốt. Việc lựa chọn một... Ultralytics Mô hình được hỗ trợ mang lại lợi thế rất lớn cho các nhà phát triển muốn nhanh chóng chuyển từ giai đoạn nguyên mẫu sang sản phẩm hoàn chỉnh.

Phát triển tinh gọn

Cả hai YOLOv10 Và YOLOv7 có thể truy cập thông qua tiêu chuẩn Ultralytics Python Gói này mang lại sự dễ sử dụng chưa từng có, thay thế hàng nghìn dòng mã lặp đi lặp lại bằng một API đơn giản, trực quan. Hơn nữa, Ultralytics YOLO các mô hình yêu cầu mức thấp hơn đáng kể CUDA Bộ nhớ trong quá trình huấn luyện được cải thiện so với các kiến ​​trúc Transformer nặng nề, cho phép sử dụng kích thước lô lớn hơn trên phần cứng cấp người tiêu dùng.

Tính Đa Năng Vượt Trội

Trong khi các kho lưu trữ cũ thường chỉ tập trung vào việc phát hiện hộp giới hạn, thì sự tích hợp này Ultralytics Khung phần mềm hỗ trợ liền mạch rất nhiều tác vụ khác nhau. Cho dù bạn đang thực hiện Phân đoạn đối tượng , Ước tính tư thế hay Phát hiện hộp giới hạn định hướng (OBB) , quy trình làm việc vẫn giống nhau.

Ví dụ mã: Quy trình đào tạo nhất quán

Đoạn mã sau đây minh họa quy trình huấn luyện liền mạch, tự động xử lý việc tăng cường dữ liệu và lập lịch tốc độ học:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLOv10 Và YOLOv7 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn YOLOv10

YOLOv10 là một lựa chọn tốt cho:

  • NMS - Phát hiện thời gian thực không cần hệ thống quản lý truy cập (NMS): Các ứng dụng được hưởng lợi từ khả năng phát hiện toàn diện mà không cần hệ thống loại bỏ truy cập không tối đa (Non-Maximum Suppression), giúp giảm độ phức tạp khi triển khai.
  • Cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng tốt giữa tốc độ suy luận và độ chính xác phát hiện trên nhiều quy mô mô hình khác nhau.
  • Ứng dụng độ trễ ổn định: Các kịch bản triển khai mà thời gian suy luận có thể dự đoán được là rất quan trọng, chẳng hạn như robot hoặc hệ thống tự hành.

Khi nào nên chọn YOLOv7

YOLOv7 được khuyến nghị cho:

  • So sánh hiệu quả học tập: Tái tạo các kết quả tiên tiến nhất thời kỳ năm 2022 hoặc nghiên cứu tác động của E-ELAN và các kỹ thuật "túi quà tặng miễn phí" có thể huấn luyện được.
  • Nghiên cứu về tái tham số hóa: Điều tra các phép tích chập tái tham số hóa theo kế hoạch và các chiến lược mở rộng mô hình phức hợp.
  • Các quy trình tùy chỉnh hiện có: Các dự án với các quy trình được tùy chỉnh cao được xây dựng dựa trên... YOLOv7 Kiến trúc đặc thù của nó không dễ dàng để chỉnh sửa lại.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Tiêu chuẩn mới: Giới thiệu YOLO26

Trong khi YOLOv10 Năm 2024 là một bước tiến vượt bậc, lĩnh vực thị giác máy tính phát triển cực kỳ nhanh chóng. Đối với tất cả các dự án phát triển mới, chúng tôi đặc biệt khuyên dùng mô hình thế hệ mới nhất: Ultralytics YOLO26 . Được phát hành vào tháng 1 năm 2026, nó đại diện cho đỉnh cao tuyệt đối của trí tuệ nhân tạo thị giác thời gian thực, vượt trội hơn hẳn so với cả hai thế hệ trước. YOLOv7 Và YOLOv10 .

Tìm hiểu thêm về YOLO26

YOLO26 mang đến những cải tiến chưa từng có, được thiết kế đặc biệt cho môi trường triển khai hiện đại:

  • Hệ NMS từ đầu đến cuối - Thiết kế miễn phí: Xây dựng trên nền tảng đã được thiết lập bởi YOLOv10 YOLO26 loại bỏ một cách tự nhiên NMS Xử lý hậu kỳ để đơn giản hóa quy trình triển khai và suy luận tốc độ cao ổn định.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho điện toán biên và các thiết bị không có GPU chuyên dụng, giúp tiết kiệm đáng kể chi phí phần cứng.
  • Loại bỏ DFL: Hiện tượng suy hao tiêu điểm phân phối (Distribution Focal Loss - DFL) đã được loại bỏ hoàn toàn, giúp đơn giản hóa đáng kể logic xuất dữ liệu và cải thiện đáng kể khả năng tương thích với các thiết bị biên và vi điều khiển công suất thấp.
  • MuSGD Optimizer: Lấy cảm hứng từ Kimi K2 của Moonshot AI, đây là sự kết hợp của... SGD Và Muon mang những cải tiến trong huấn luyện Mô hình Ngôn ngữ Lớn (LLM) trực tiếp vào lĩnh vực thị giác máy tính, tạo ra động lực huấn luyện cực kỳ ổn định và tốc độ hội tụ nhanh hơn.
  • ProgLoss + STAL: Các hàm suy hao tiên tiến này mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ, một lĩnh vực vốn dĩ khó khăn nhưng lại rất quan trọng đối với máy bay không người lái, robot và giám sát thành phố thông minh .
  • Cải tiến chuyên biệt cho từng tác vụ: YOLO26 không chỉ là một bộ dò tìm. Nó bao gồm các thuật toán mất mát phân đoạn ngữ nghĩa chuyên dụng, ước lượng logarit xác suất dư (RLE) để theo dõi tư thế cực kỳ chính xác và các thuật toán mất mát góc chuyên dụng để loại bỏ các vấn đề về ranh giới OBB.

Quản lý tập dữ liệu và đào tạo

Để có trải nghiệm tốt nhất trong việc quản lý tập dữ liệu, huấn luyện YOLO26 và triển khai mô hình lên đám mây, hãy khám phá Nền tảng Ultralytics . Nền tảng này cung cấp giao diện không cần lập trình, hoàn toàn phù hợp với... Python Bộ công cụ phát triển phần mềm (SDK).

Các trường hợp sử dụng thực tế

Việc lựa chọn kiến ​​trúc phù hợp phụ thuộc rất nhiều vào các ràng buộc về phần cứng và ứng dụng của bạn.

Khi nào nên sử dụng YOLOv7

YOLOv7 vẫn là một lựa chọn đáng tin cậy để duy trì các quy trình kế thừa đã được tích hợp sâu với các hệ thống chuyên dụng của nó. tensor hoặc khi sao chép các tiêu chuẩn đánh giá học thuật từ năm 2022 và 2023. Nó hoạt động rất tốt trên các GPU máy chủ cao cấp.

Khi nào nên sử dụng YOLOv10

YOLOv10 Nó tỏa sáng trong các tình huống yêu cầu độ trễ nghiêm ngặt và không thay đổi. Bởi vì nó là NMS -Miễn phí, nó rất tuyệt vời cho việc đếm đám đông mật độ cao hoặc phát hiện lỗi sản xuất, nơi số lượng đối tượng biến động mạnh nhưng thời gian xử lý mỗi khung hình phải không đổi.

Khi nào nên sử dụng YOLO26

YOLO26 là sự lựa chọn tối ưu cho mọi dự án mới. Từ việc triển khai các hệ thống báo động an ninh phức tạp trên một chiếc Raspberry Pi cơ bản đến việc vận hành hệ thống phân tích video dựa trên đám mây quy mô lớn, YOLO26 vượt trội hơn hẳn. CPU Tốc độ và khả năng phát hiện vật thể nhỏ tiên tiến giúp nó vượt trội hơn hẳn so với các thế hệ cũ.

Đối với các nhà phát triển quan tâm đến việc khám phá các kiến ​​trúc hiện đại thay thế, chúng tôi cũng cung cấp hỗ trợ rộng rãi cho các bộ dò dựa trên transformer như RT-DETR và các sản phẩm chủ lực thế hệ trước như Ultralytics YOLO11 .


Bình luận