Chuyển đến nội dung

YOLO26 vs YOLOv8 Những tiến bộ trong phát hiện đối tượng thế hệ tiếp theo

Sự phát triển của thị giác máy tính được định hình bởi việc theo đuổi hiệu năng thời gian thực mà không làm giảm độ chính xác. Khi các nhà phát triển và nhà nghiên cứu khám phá lĩnh vực học máy hiện đại, việc lựa chọn kiến ​​trúc mô hình phù hợp là vô cùng quan trọng. Bài so sánh kỹ thuật toàn diện này sẽ khám phá bước nhảy vọt giữa các thế hệ từ Ultralytics YOLOv8 , một kiến ​​trúc cực kỳ phổ biến đã định nghĩa lại tiêu chuẩn vào năm 2023, đến Ultralytics YOLO26 tiên tiến, được phát hành vào tháng 1 năm 2026.

Bằng cách đi sâu vào kiến ​​trúc, các chỉ số hiệu suất và phương pháp huấn luyện của chúng, chúng tôi nhấn mạnh lý do tại sao việc nâng cấp lên những cải tiến mới nhất mang lại những lợi thế rõ rệt cho việc phát hiện đối tượng , phân đoạn và nhiều ứng dụng khác.

Thông tin cơ bản và siêu dữ liệu của mô hình

Việc hiểu rõ nguồn gốc của các kiến ​​trúc này giúp hiểu được bối cảnh của những đột phá tương ứng của chúng. Cả hai mô hình đều được phát triển bởi Ultralytics , một công ty nổi tiếng với việc giúp cho trí tuệ nhân tạo tiên tiến trở nên dễ tiếp cận và dễ triển khai.

Thông tin chi tiết về YOLO26:
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 14/01/2026
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu: ultralytics

Tìm hiểu thêm về YOLO26

Thông tin chi tiết về YOLOv8 :
Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 10/01/2023
GitHub: https://github.com/ ultralytics / ultralytics
Tài liệu yolov8 ultralytics

Tìm hiểu thêm về YOLOv8

Đổi mới Kiến trúc

Sự chuyển đổi từ YOLOv8 YOLO26 mang đến những thay đổi mang tính đột phá đáng kể trong cách mạng thần kinh xử lý dữ liệu hình ảnh và tính toán tổn thất.

YOLO26: Đỉnh cao của hiệu suất biên

YOLO26 được thiết kế từ đầu để loại bỏ các nút thắt cổ chai trong quá trình triển khai và tối đa hóa tốc độ suy luận trên phần cứng có hạn chế.

  • Thiết kế không cần NMS từ đầu đến cuối: Dựa trên các khái niệm được tiên phong lần đầu tiên trong YOLOv10 , YOLO26 sử dụng kiến ​​trúc từ đầu đến cuối một cách tự nhiên. Bằng cách loại bỏ hoàn toàn nhu cầu về Non-Maximum Suppression (NMS) ( NMS Nhờ xử lý hậu kỳ, sự biến thiên độ trễ hầu như được loại bỏ. Điều này đơn giản hóa logic triển khai cho các ứng dụng yêu cầu đảm bảo thời gian thực nghiêm ngặt.
  • Loại bỏ DFL: Việc loại bỏ hiện tượng suy hao tiêu điểm phân tán (DFL) giúp đơn giản hóa đáng kể đầu ra. Lựa chọn kiến ​​trúc này cho phép khả năng tương thích tốt hơn đáng kể với các thiết bị biên công suất thấp và xuất dữ liệu đơn giản hơn sang các định dạng như ONNXCoreML .
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ sự ổn định trong quá trình huấn luyện được thấy ở các Mô hình Ngôn ngữ Lớn (LLM) như Kimi K2 của Moonshot AI, YOLO26 sử dụng bộ tối ưu hóa MuSGD—một sự kết hợp giữa Thuật toán Giảm Độ dốc Ngẫu nhiên (Stochastic Gradient Descent) và Muon. Điều này mang lại những cải tiến trong huấn luyện quy mô LLM vào lĩnh vực thị giác máy tính, giúp hội tụ nhanh hơn và các lần huấn luyện có độ ổn định cao.
  • ProgLoss + STAL: Để giải quyết vấn đề khó khăn trong việc nhận dạng các đối tượng nhỏ, YOLO26 sử dụng thuật toán Progressive Loss (ProgLoss) kết hợp với Scale-Tolerant Anchor Loss (STAL). Điều này mang lại những cải tiến quan trọng cho việc phát hiện vật thể nhỏ , lý tưởng cho các ứng dụng máy bay không người lái.

Cải tiến cụ thể theo nhiệm vụ

YOLO26 cũng mang đến những nâng cấp có mục tiêu trên nhiều lĩnh vực thị giác máy tính. Nó sử dụng hàm mất mát Phân đoạn ngữ nghĩa và proto đa tỷ lệ để phân đoạn đối tượng tốt hơn, Ước lượng logarit xác suất dư (RLE) để ước lượng tư thế với độ chính xác cao, và các thuật toán mất mát góc chuyên dụng để giải quyết các vấn đề về ranh giới trong Hộp giới hạn định hướng (OBB) .

YOLOv8 : Con ngựa thồ đa năng

Khi được phát hành vào năm 2023, YOLOv8 Thiết lập một chuẩn mực mới bằng cách chuyển đổi hoàn toàn sang thiết kế không có neo, giúp tổng quát hóa tốt hơn trên các tỷ lệ khung hình dữ liệu khác nhau.

  • Mô-đun C2f: Mô-đun này thay thế mô-đun C3 cũ hơn bằng khối C2f, cho phép truyền tải gradient tốt hơn trên toàn bộ mạng trục chính.
  • Đầu tách rời: YOLOv8 có tính năng đầu tách rời, trong đó phân loại và hồi quy hộp giới hạn được tính toán độc lập, giúp tăng đáng kể độ chính xác trung bình (Average Precision) mAP ).
  • Tính linh hoạt trong tác vụ: Đây là một trong những mô hình đầu tiên cung cấp API thực sự thống nhất cho các tác vụ phân loại, phát hiện, phân đoạn và xác định tư thế hình ảnh ngay từ đầu.

Các chỉ số hiệu suất và yêu cầu về nguồn lực

Khi đánh giá các mô hình để đưa vào sản xuất, sự cân bằng giữa độ chính xác, tốc độ suy luận và kích thước mô hình là tối quan trọng. YOLO26 thể hiện ưu thế vượt trội rõ rệt trên tất cả các biến thể kích thước.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Lưu ý: Các giá trị được tô sáng thể hiện sự cân bằng hiệu năng và những cải tiến về hiệu quả của kiến ​​trúc YOLO26 so với thế hệ tiền nhiệm.

Phân tích

YOLO26 đạt được thành tựu đáng kể Nhanh hơn tới 43% CPU suy luận so với các sản phẩm tương tự YOLOv8 các mô hình. Ví dụ, YOLO26n đạt được 38,9 ms trên CPU sử dụng ONNX so với YOLOv8ncủa 's là 80,4 ms, đồng thời tăng lên mAP từ 37,3 lên 40,9. Bước nhảy vọt khổng lồ này CPU Hiệu quả đạt được là kết quả trực tiếp của việc loại bỏ DFL và NMS - Thiết kế không cần cấu hình đặc biệt, biến YOLO26 trở thành một công cụ mạnh mẽ tuyệt đối cho các môi trường thiếu GPU chuyên dụng.

Hơn nữa, các mô hình YOLO26 có số lượng tham số và FLOPs thấp hơn so với các cấp kích thước tương ứng, dẫn đến việc giảm đáng kể mức sử dụng bộ nhớ GPU trong quá trình suy luận và huấn luyện so với các kiến ​​trúc dựa trên transformer truyền thống.

Lợi thế Hệ sinh thái Ultralytics

Một yếu tố quan trọng cần xem xét khi lựa chọn mô hình AI là cơ sở hạ tầng xung quanh. Cả YOLO26 và YOLOv8 Được hưởng lợi rất nhiều từ Nền tảng Ultralytics thống nhất, mang đến trải nghiệm phát triển vượt trội.

  1. Dễ sử dụng: Triết lý "từ con số không đến anh hùng" đảm bảo các nhà phát triển có thể tải, huấn luyện và xuất mô hình chỉ với một lượng mã tối thiểu. Python API vẫn nhất quán giữa các thế hệ mô hình.
  2. Hiệu quả đào tạo: Ultralytics YOLO các mẫu này yêu cầu mức thấp hơn đáng kể CUDA Bộ nhớ được sử dụng hiệu quả hơn trong quá trình huấn luyện so với các mô hình Transformer (như RT-DETR ). Điều này cho phép sử dụng kích thước batch lớn hơn trên phần cứng dành cho người tiêu dùng, dân chủ hóa nghiên cứu AI.
  3. Hệ sinh thái được duy trì tốt: Được hỗ trợ bởi các bản cập nhật liên tục, quy trình CI/CD nghiêm ngặt và sự tích hợp sâu rộng với các công cụ như Weights & BiasesTensorRT , Ultralytics Kho lưu trữ này mạnh mẽ và sẵn sàng cho môi trường sản xuất.
  4. Tính linh hoạt vượt trội: Ultralytics Các mô hình không chỉ có một chức năng duy nhất; một lần nhập dữ liệu duy nhất có thể xử lý nhiều tập dữ liệu khác nhau, tăng cường quy trình làm việc cho các hệ thống phức tạp yêu cầu theo dõi, phân loại và phân đoạn đồng thời.

Nâng cấp được tối ưu hóa

Bởi vì Ultralytics API được tiêu chuẩn hóa cao, việc nâng cấp hệ thống sản xuất từ... YOLOv8 Việc chuyển sang YOLO26 thực sự đơn giản như việc thay đổi chuỗi. "yolov8n.pt" đến "yolo26n.pt" trong kịch bản của bạn.

Các ứng dụng thực tế

Việc lựa chọn giữa các mô hình này thường phụ thuộc vào các ràng buộc triển khai của bạn, mặc dù YOLO26 được khuyến nghị rộng rãi cho các dự án mới.

Điện toán biên và mạng IoT

Đối với môi trường biên – chẳng hạn như triển khai Raspberry Pi hoặc các cảm biến cục bộ trên sàn nhà máy – YOLO26 là nhà vô địch không thể tranh cãi. Nó được tối ưu hóa nguyên bản. CPU tốc độ và NMS - Cấu trúc không phụ thuộc vào thư viện có nghĩa là camera thông minh có thể xử lý video tốc độ khung hình cao để quản lý bãi đậu xe mà không bị mất khung hình do tắc nghẽn xử lý hậu kỳ.

Hình ảnh từ trên không và độ cao lớn

Trong giám sát nông nghiệp hoặc kiểm tra cơ sở hạ tầng bằng máy bay không người lái, phát hiện vật thể nhỏ là vô cùng quan trọng. Việc triển khai ProgLoss + STAL trong YOLO26 cho phép nó hoạt động một cách nhất quán. detect các loại côn trùng nhỏ hoặc các vết nứt siêu nhỏ trong đường ống mà các kiến ​​trúc cũ hơn như YOLOv8 có thể bỏ sót, mang lại khả năng thu hồi và độ chính xác vượt trội trên các tập dữ liệu như VisDrone .

Di sản GPU Hệ thống

YOLOv8 vẫn phù hợp với các hệ thống phụ thuộc chặt chẽ vào các kết quả kiểm định hồi quy hộp giới hạn cụ thể của nó hoặc các triển khai cấp doanh nghiệp bị ràng buộc bởi các chu kỳ kiểm định kéo dài và không thể dễ dàng chuyển đổi kiến ​​trúc.

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLO26 và YOLOv8 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn YOLO26

YOLO26 là một lựa chọn tốt cho:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Khi nào nên chọn YOLOv8

YOLOv8 được khuyến nghị cho:

  • Triển khai đa nhiệm linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh để phát hiện , phân đoạn , phân loạiước tính tư thế trong phạm vi... Ultralytics hệ sinh thái.
  • Hệ thống sản xuất hiện có: Môi trường sản xuất hiện tại đã được xây dựng trên hệ thống này. YOLOv8 kiến trúc với các quy trình triển khai ổn định, đã được kiểm thử kỹ lưỡng.
  • Hỗ trợ cộng đồng và hệ sinh thái rộng rãi: Các ứng dụng được hưởng lợi từ YOLOv8 Hệ thống này có các hướng dẫn chi tiết, tích hợp với bên thứ ba và nguồn lực cộng đồng năng động.

Ví dụ mã: Bắt đầu

Tận dụng sức mạnh của những công nghệ mới nhất Ultralytics Mô hình này vô cùng đơn giản. Sau đây là các mô hình tiếp theo: Python Đoạn mã này minh họa quá trình huấn luyện mô hình YOLO26 trên một tập dữ liệu tùy chỉnh, quan sát cách trình tối ưu hóa MuSGD tự động thúc đẩy sự hội tụ nhanh chóng.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

Các mô hình khác để xem xét

Mặc dù YOLO26 đại diện cho công nghệ tiên tiến nhất hiện nay, các nhà phát triển xây dựng nhiều ứng dụng khác nhau cũng có thể xem xét:

  • YOLO11 : Phiên bản tiền nhiệm trực tiếp của YOLO26, mang đến sự cải tiến vượt trội so với các phiên bản trước đó. YOLOv8 và vẫn được sử dụng rộng rãi trong các hệ thống sản xuất tiên tiến.
  • RT-DETR : Bộ chuyển đổi phát hiện thời gian thực của Baidu. Đây là một lựa chọn tuyệt vời cho các nhà nghiên cứu khám phá cơ chế chú ý trong các nhiệm vụ thị giác, mặc dù nó đòi hỏi nhiều tài nguyên hơn đáng kể. CUDA khả năng ghi nhớ để rèn luyện so với tiêu chuẩn thông thường Ultralytics YOLO mô hình.

Để có bộ công cụ toàn diện về đào tạo trên nền tảng đám mây, gắn nhãn dữ liệu và triển khai tức thì, hãy khám phá Nền tảng Ultralytics ngay hôm nay.


Bình luận