Chuyển đến nội dung

YOLOv7 So với YOLO26: Một bước tiến vượt bậc trong phát hiện đối tượng thời gian thực

Sự phát triển của thị giác máy tính đã được đánh dấu bằng những cột mốc quan trọng, và việc so sánh các kiến ​​trúc cũ với các mô hình hiện đại tiên tiến mang lại những hiểu biết giá trị cho các kỹ sư học máy. Bài so sánh kỹ thuật này đi sâu vào sự khác biệt giữa YOLOv7 có tầm ảnh hưởng lớn và Ultralytics YOLO26 mang tính cách mạng, làm nổi bật những tiến bộ về kiến ​​trúc, phương pháp huấn luyện và hiệu quả triển khai.

YOLOv7 Người tiên phong trong phong trào "Túi quà tặng miễn phí"

Được giới thiệu vào giữa năm 2022, YOLOv7 đã vượt qua những giới hạn của những điều có thể xảy ra. GPU phần cứng được cải tiến bằng cách áp dụng một số tối ưu hóa kiến ​​trúc giúp nâng cao độ chính xác mà không làm tăng chi phí suy luận.

Chi tiết mô hình

YOLOv7 Mô hình này đã giới thiệu khái niệm "túi quà tặng miễn phí" có thể huấn luyện được, sử dụng rộng rãi các kỹ thuật tái tham số hóa và mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN). Điều này cho phép mô hình học được nhiều đặc trưng đa dạng hơn và liên tục cải thiện khả năng học tập của mạng mà không phá hủy đường dẫn gradient ban đầu. Mặc dù đã đạt được một chuẩn mực ấn tượng hàng đầu trên tập dữ liệu COCO vào thời điểm đó, kiến ​​trúc của nó vẫn phụ thuộc nhiều vào đầu ra dựa trên anchor và yêu cầu xử lý hậu kỳ Non-Maximum Suppression ( NMS ) phức tạp, có thể gây ra tắc nghẽn độ trễ trong quá trình triển khai.

Tìm hiểu thêm về YOLOv7

YOLO26: Tiêu chuẩn AI thị giác ưu tiên thiết bị biên

Ra mắt vào tháng 1 năm 2026, Ultralytics YOLO26 đại diện cho một sự thay đổi mang tính đột phá, hoàn toàn định hình lại quy trình phát hiện để ưu tiên tính dễ triển khai, sự ổn định trong quá trình huấn luyện và hiệu quả phần cứng.

Chi tiết mô hình

YOLO26 được xây dựng từ đầu để giải quyết những thách thức kỹ thuật hiện đại. Kiến trúc của nó mang đến một số cải tiến quan trọng vượt trội so với các thế hệ tiền nhiệm:

  • Hệ NMS toàn diện - Thiết kế miễn phí: YOLO26 loại bỏ... NMS Xử lý hậu kỳ trực tiếp, một phương pháp đột phá lần đầu tiên được tiên phong trong YOLOv10 . Điều này giúp quy trình triển khai nhanh hơn và đơn giản hơn nhiều, tránh được độ trễ thay đổi thường do các cảnh phức tạp gây ra.
  • Loại bỏ DFL: Bằng cách loại bỏ tổn hao tiêu điểm phân tán (DFL), mô hình được đơn giản hóa đáng kể để xuất khẩu, mang lại khả năng tương thích tốt hơn nhiều với các thiết bị biên và phần cứng IoT công suất thấp.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Nhờ những cải tiến về kiến ​​trúc và tối ưu hóa cấu trúc, YOLO26 được tối ưu hóa đặc biệt cho điện toán biên và các thiết bị không có GPU chuyên dụng, dễ dàng vượt trội so với các kiến ​​trúc cũ hơn trên bộ xử lý tiêu chuẩn.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện mô hình ngôn ngữ quy mô lớn (cụ thể là Kimi K2 của Moonshot AI), YOLO26 sử dụng bộ tối ưu hóa MuSGD—một sự kết hợp giữa thuật toán Stochastic Gradient Descent và Muon. Điều này mang lại sự ổn định huấn luyện vượt trội và tốc độ hội tụ nhanh hơn nhiều cho các tác vụ thị giác máy tính.
  • ProgLoss + STAL: Việc giới thiệu các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ, điều rất quan trọng đối với ảnh chụp từ trên không , robot và kiểm tra chất lượng tự động.
  • Cải tiến dành riêng cho từng nhiệm vụ: Ngoài khả năng phát hiện đối tượng tiêu chuẩn, YOLO26 giới thiệu hàm mất mát phân đoạn ngữ nghĩa đa tỷ lệ và chuyên biệt cho các tác vụ phân đoạn , ước lượng logarit xác suất dư (RLE) cho ước lượng tư thế và các thuật toán mất mát góc chuyên biệt để giải quyết các vấn đề về ranh giới trong hộp giới hạn định hướng (OBB) .

Tìm hiểu thêm về YOLO26

Chuyển sang YOLO26

Nâng cấp từ kiến ​​trúc cũ lên YOLO26 rất đơn giản, chỉ cần thay đổi chuỗi mô hình trong tệp của bạn. Python mã để yolo26n.pt. Cái Ultralytics Gói phần mềm này xử lý toàn bộ quá trình chuyển đổi, bao gồm cả việc tự động tải xuống trọng lượng và điều chỉnh cấu hình.

So sánh hiệu năng và số liệu

Khi so sánh về mức độ yêu cầu tính toán, YOLO26 thể hiện sự vượt trội rõ rệt trong việc cân bằng hiệu năng và yêu cầu bộ nhớ. Các mô hình dựa trên Transformer hoặc các kiến ​​trúc cũ nặng nề thường đòi hỏi lượng bộ nhớ khổng lồ. CUDA Việc phân bổ bộ nhớ không hiệu quả, nhưng YOLO26 hoạt động tốt trên các GPU dành cho người tiêu dùng.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Như đã thấy ở trên, YOLO26m mô hình đạt độ chính xác tương đương (53.1 mAP ) đến mức độ khổng lồ YOLOv7xnhưng thực hiện điều đó với số lượng tham số ít hơn một phần ba (20,4 triệu so với 71,3 triệu) và thời gian suy luận cực nhanh thông qua TensorRT.

Lợi thế Hệ sinh thái Ultralytics

Việc triển khai các mô hình cũ thường liên quan đến việc phải vật lộn với các kho lưu trữ của bên thứ ba phức tạp, sự phụ thuộc rắc rối và các tập lệnh xuất thủ công. Ngược lại, Nền tảng Ultralytics cung cấp một hệ sinh thái được duy trì tốt, mạch lạc, giúp đơn giản hóa toàn bộ vòng đời học máy.

  • Dễ sử dụng: Với giao diện trực quan Python Với API và tài liệu đầy đủ, bạn có thể chú thích, huấn luyện và triển khai mô hình chỉ trong vài phút. Việc xuất sang các định dạng như ONNX hoặc CoreML chỉ cần một dòng mã duy nhất.
  • Yêu cầu bộ nhớ: Ultralytics Các mô hình này nổi tiếng với khả năng sử dụng bộ nhớ thấp. Không giống như một số bộ chuyển đổi hình ảnh cồng kềnh khác, YOLO26 có thể dễ dàng được tinh chỉnh trên phần cứng tiêu chuẩn mà không gặp phải lỗi hết bộ nhớ (OOM).
  • Tính linh hoạt: Trong khi YOLOv7 YOLO26, ban đầu chủ yếu là một công cụ phát hiện đối tượng (với một số nhánh thử nghiệm cho các nhiệm vụ khác), là một khung phần mềm thống nhất xử lý việc phát hiện, phân loại, theo dõi, định vị và OBB với hiệu quả như nhau.

Khác Ultralytics Mô hình

Mặc dù YOLO26 là tiêu chuẩn được khuyến nghị, các nhà phát triển chuyển đổi hệ thống cũ cũng có thể tìm hiểu YOLO11 , một thế hệ khác có khả năng cao. Ultralytics Dòng sản phẩm này mang lại sự ổn định tuyệt vời cho các dự án hỗ trợ dài hạn.

Ví dụ mã: Đào tạo và triển khai

Ví dụ sau đây minh họa sự đơn giản tinh tế của... ultralytics gói. Hãy chú ý giao diện gọn gàng hơn nhiều so với việc gọi các đối số dòng lệnh dài dòng đối với các mô hình cũ hơn.

from ultralytics import YOLO

# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # Efficient memory usage allows larger batch sizes
    device=0,
)

# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")

Các trường hợp sử dụng thực tế

Việc lựa chọn kiến ​​trúc phù hợp hoàn toàn phụ thuộc vào các ràng buộc sản xuất của bạn.

Khi nào nên cân nhắc sử dụng YOLOv7 : YOLOv7 vẫn là một công cụ có giá trị để đánh giá học thuật so với các tiêu chuẩn năm 2022. Nếu cơ sở hạ tầng của bạn sử dụng các đường dẫn CUDA cũ phức tạp được mã hóa cứng thành... YOLOv7 Nếu bạn không thể phân bổ nguồn lực cho việc tái cấu trúc các đầu ra neo cụ thể của nó, thì nó sẽ tiếp tục hoạt động như một công cụ phát hiện đường cơ sở mạnh mẽ.

Khi nào nên chọn YOLO26: Đối với bất kỳ dự án mới nào, YOLO26 là sự lựa chọn tối ưu. NMS Kiến trúc không cần bộ nhớ đệm (free architecture) làm cho nó hoàn hảo cho hệ thống điều hướng tự động độ trễ thấp và hệ thống an ninh thời gian thực. Việc loại bỏ DFL và khối lượng lớn CPU Tốc độ được cải thiện giúp nó trở thành nhà vô địch không thể tranh cãi trong việc triển khai AI tại biên, chẳng hạn như triển khai trên Raspberry Pi hoặc bên trong các thiết bị điện tử tiêu dùng. Hơn nữa, các cải tiến ProgLoss + STAL giúp nó cực kỳ hiệu quả trong việc phát hiện các bất thường nhỏ trong đảm bảo chất lượng sản xuất hoặc hình ảnh vệ tinh.

Tóm lại, YOLO26 cung cấp cho các nhà phát triển sự kết hợp tuyệt vời giữa độ chính xác, tốc độ và tính đơn giản, được hỗ trợ bởi sự hỗ trợ toàn diện từ cộng đồng mã nguồn mở.


Bình luận