Chuyển đến nội dung

YOLOv7 So với YOLO26: Một bước tiến vượt bậc về công nghệ trong phát hiện đối tượng

Lĩnh vực thị giác máy tính đang thay đổi với tốc độ chóng mặt. Năm 2022, YOLOv7 đã thiết lập một chuẩn mực mới về tốc độ và độ chính xác, giới thiệu những cải tiến kiến ​​trúc như E-ELAN. Đến tháng 1 năm 2026, YOLO26 đã định nghĩa lại trạng thái tiên tiến nhất với thiết kế đầu cuối hoàn chỉnh. CPU các tối ưu hóa và tính ổn định trong quá trình huấn luyện được kế thừa từ các Mô hình Ngôn ngữ Lớn (LLM).

Hướng dẫn này cung cấp sự so sánh kỹ thuật giữa hai cột mốc quan trọng này trong lịch sử phát hiện đối tượng, giúp các nhà phát triển lựa chọn công cụ phù hợp cho việc triển khai hiện đại.

Sự tiến hóa kiến trúc

Sự chuyển đổi từ YOLOv7 YOLO26 đại diện cho một sự thay đổi cơ bản trong cách thiết kế mạng nơ-ron nhằm đạt hiệu quả và dễ sử dụng.

YOLOv7 Di sản của E-ELAN

YOLOv7 , được phát hành vào ngày 6 tháng 7 năm 2022, do Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Trung Quốc biên soạn.

Điểm đột phá cốt lõi của nó là Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN) . Kiến trúc này cho phép mạng học được nhiều đặc điểm đa dạng hơn bằng cách kiểm soát các đường dẫn gradient ngắn nhất và dài nhất. Nó cũng giới thiệu một "gói quà tặng miễn phí", bao gồm việc tái tham số hóa theo kế hoạch, giúp cải thiện độ chính xác mà không làm tăng chi phí suy luận. Tuy nhiên, YOLOv7 Phương pháp này dựa vào các hộp neo và yêu cầu xử lý hậu kỳ Non-Maximum Suppression ( NMS ) , điều này gây ra sự biến đổi về độ trễ và làm phức tạp việc triển khai trên các thiết bị biên.

Tìm hiểu thêm về YOLOv7

YOLO26: Cuộc cách mạng từ đầu đến cuối

YOLO26 , được Ultralytics phát hành vào tháng 1 năm 2026, được xây dựng cho kỷ nguyên điện toán biên và các hoạt động học máy được đơn giản hóa.

Điểm đột phá chính: Giải pháp toàn diện từ đầu đến cuối NMS -Miễn phí

YOLO26 là một hệ thống hoàn chỉnh từ đầu đến cuối , loại bỏ nhu cầu về... NMS Xử lý hậu kỳ. Bước đột phá này, lần đầu tiên được tiên phong trong YOLOv10 , giúp giảm đáng kể độ trễ suy luận và đơn giản hóa quy trình triển khai, đảm bảo rằng kết quả đầu ra của mô hình sẵn sàng để sử dụng ngay lập tức.

YOLO26 giới thiệu một số cải tiến quan trọng:

  1. Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Kimi K2 và LLM của Moonshot AI, sự kết hợp giữa SGD và Muon này mang lại sự ổn định chưa từng có cho việc huấn luyện thị giác máy tính, dẫn đến sự hội tụ nhanh hơn.
  2. Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss (DFL), YOLO26 đơn giản hóa lớp đầu ra. Điều này giúp việc xuất sang các định dạng như ONNX hoặc TensorRT mượt mà hơn và cải thiện khả năng tương thích với các thiết bị biên công suất thấp.
  3. ProgLoss + STAL: Các hàm mất mát được cải tiến này mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ , một yêu cầu quan trọng đối với ảnh chụp từ máy bay không người lái và cảm biến IoT.

Tìm hiểu thêm về YOLO26

Phân tích hiệu suất

Khi so sánh các chỉ số thô, YOLO26 thể hiện rõ những cải tiến về hiệu quả đạt được sau bốn năm nghiên cứu. Nó cung cấp độ chính xác cao hơn với số lượng tham số ít hơn đáng kể và tốc độ suy luận nhanh hơn đáng kể, đặc biệt là trên CPU.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Tốc độ và Hiệu quả

YOLO26 được tối ưu hóa đặc biệt cho các môi trường không có GPU mạnh. Với việc loại bỏ các bước xử lý hậu kỳ nặng nề và các khối được tối ưu hóa, nó mang lại khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ trước. Đối với các nhà phát triển triển khai trên Raspberry Pi, điện thoại di động hoặc CPU thông thường, YOLO26 là lựa chọn tối ưu nhất.

Ngược lại, YOLOv7 được thiết kế chủ yếu với các sản phẩm cao cấp. GPU Cần lưu ý đến thông lượng (cụ thể là V100 và A100). Mặc dù tốc độ vẫn nhanh trên... CUDA Các thiết bị này thiếu thiết kế kiến ​​trúc tinh gọn cần thiết cho trí tuệ nhân tạo biên hiện đại.

Đào tạo và Hệ sinh thái

Sự khác biệt về trải nghiệm người dùng giữa hai mô hình là rất rõ rệt. YOLOv7 Nó dựa trên các cấu trúc kho lưu trữ cũ, thường yêu cầu thiết lập môi trường phức tạp, định dạng dữ liệu thủ công và các đối số dòng lệnh dài dòng.

Lợi thế của Ultralytics

YOLO26 được tích hợp hoàn toàn vào hệ sinh thái Ultralytics , mang đến trải nghiệm "từ con số không đến chuyên gia" được tối ưu hóa.

  • Dễ sử dụng: Bạn có thể cài đặt thư viện thông qua pip install ultralytics và bắt đầu huấn luyện chỉ trong vài giây. API này nhất quán, tuân thủ nguyên tắc Python và được tài liệu hóa đầy đủ.
  • Nền tảng Ultralytics : Người dùng YOLO26 có thể tận dụng Nền tảng Ultralytics để quản lý tập dữ liệu, tự động chú thích và huấn luyện trên đám mây chỉ với một cú nhấp chuột.
  • Tính linh hoạt: Trong khi YOLOv7 Tập trung chủ yếu vào phát hiện (với một số nhánh về tư thế/phân đoạn), YOLO26 hỗ trợ nguyên bản Phát hiện đối tượng , Phân đoạn đối tượng , Ước tính tư thế , Phân loạiHộp giới hạn định hướng (OBB) trong cùng một khung phần mềm.

Ví dụ mã

So sánh độ phức tạp khi sử dụng, Ultralytics YOLO26 đơn giản hóa quy trình làm việc một cách đáng kể.

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version for speed)
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
# No complex config files needed, just point to your data.yaml
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with NMS-free speed
# The results object contains easy-to-parse boxes and masks
results = model("path/to/image.jpg")

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn YOLOv7

YOLOv7 Đây vẫn là một mô hình được đánh giá cao trong cộng đồng học thuật và có thể phù hợp với:

  • Hệ thống kế thừa: Các dự án tích hợp sâu với các hệ thống cụ thể YOLOv7 Mã nguồn không thể dễ dàng chuyển đổi.
  • So sánh hiệu suất nghiên cứu: Các nhà nghiên cứu so sánh các kiến ​​trúc mới với các tiêu chuẩn tiên tiến nhất năm 2022.
  • Các quy trình làm việc GPU cụ thể: Các trường hợp mà cấu trúc E-ELAN cụ thể mang lại lợi thế riêng biệt trên phần cứng cũ hơn, mặc dù điều này đang trở nên hiếm gặp.

Khi nào nên chọn YOLO26

YOLO26 là lựa chọn được khuyến nghị cho hầu hết các dự án thương mại và nghiên cứu mới nhờ sự cân bằng về hiệu suấthiệu quả đào tạo .

  • Điện toán biên: Lý tưởng để triển khai trên thiết bị di động ( iOS / Android ) hoặc các thiết bị nhúng (Jetson, Raspberry Pi) nhờ kích thước nhỏ gọn và CPU tốc độ.
  • Phân tích thời gian thực: NMS Thiết kế không có bộ lọc đảm bảo độ trễ ổn định, điều cực kỳ quan trọng đối với các ứng dụng an toàn cao như lái xe tự hành hoặc robot.
  • Các tác vụ phức tạp: Khi dự án của bạn yêu cầu chuyển đổi giữa phát hiện, phân đoạn và OBB (ví dụ: phân tích ảnh chụp từ trên không ), kiến ​​trúc đầu cảm biến đa năng của YOLO26 sẽ vượt trội hơn.
  • Môi trường bộ nhớ thấp: YOLO26 yêu cầu ít hơn đáng kể. CUDA so sánh với các mô hình nặng về Transformer hoặc các kiến ​​trúc cũ hơn, bộ nhớ được sử dụng hiệu quả hơn trong quá trình huấn luyện, cho phép kích thước batch lớn hơn trên GPU dành cho người tiêu dùng.

Kết luận

Trong khi YOLOv7 Là một thời điểm then chốt trong lịch sử phát hiện đối tượng, YOLO26 đại diện cho tương lai. Bằng cách kết hợp tính ổn định của các thuật toán tối ưu hóa lấy cảm hứng từ LLM (MuSGD) với một quy trình được tinh giản, NMS - Kiến trúc tự do, Ultralytics đã tạo ra một mô hình nhanh hơn, chính xác hơn và dễ sử dụng hơn đáng kể.

Đối với các nhà phát triển muốn xây dựng các ứng dụng thị giác máy tính mạnh mẽ, có khả năng đáp ứng nhu cầu trong tương lai, hệ sinh thái tích hợp, tài liệu đầy đủ và hiệu năng vượt trội khiến YOLO26 trở thành sự lựa chọn tối ưu.

Khám phá các Mô hình Khác

Nếu bạn quan tâm đến việc tìm hiểu các lựa chọn khác trong phạm vi này Ultralytics Nếu bạn thuộc nhóm này, hãy cân nhắc YOLO11 cho các tác vụ đa năng hoặc RT-DETR cho việc phát hiện dựa trên Transformer, trong đó ngữ cảnh toàn cục được ưu tiên hơn tốc độ suy luận thuần túy.


Bình luận