Chuyển đến nội dung

YOLOv8 so với YOLO11 So sánh kỹ thuật toàn diện các mô hình thị giác thời gian thực

Sự phát triển nhanh chóng của thị giác máy tính được thúc đẩy mạnh mẽ bởi những tiến bộ liên tục trong các khung phát hiện đối tượng thời gian thực. Đối với các nhà phát triển và nhà nghiên cứu đang hoạt động trong bối cảnh hiện đại, việc lựa chọn mô hình phù hợp là rất quan trọng để cân bằng giữa độ chính xác, tốc độ và hiệu quả tài nguyên. Trong bài so sánh kỹ thuật này, chúng ta sẽ khám phá sự khác biệt giữa hai mô hình nền tảng từ hệ sinh thái Ultralytics : Ultralytics YOLOv8Ultralytics YOLO11 .

Cả hai mô hình đều thể hiện những đặc điểm nổi bật của kiến trúc Ultralytics—dễ sử dụng, hệ sinh thái được bảo trì tốt, và hiệu quả huấn luyện vượt trội với yêu cầu bộ nhớ thấp. Hãy cùng tìm hiểu sâu về thiết kế kiến trúc, điểm chuẩn hiệu suất và các kịch bản triển khai lý tưởng của chúng.

Tổng quan về mô hình

Trước khi so sánh những ưu điểm kỹ thuật cụ thể của chúng, sẽ hữu ích nếu xác định nguồn gốc và các thông số kỹ thuật cốt lõi của cả hai mô hình.

Ultralytics YOLOv8

Được phát hành vào đầu năm 2023 như một bước tiến lớn, YOLOv8 Giới thiệu phương pháp phát hiện không cần neo và những cải tiến đáng kể cho các hàm mất mát, nhanh chóng trở thành tiêu chuẩn vàng cho nhiều nhiệm vụ học máy khác nhau.

Tìm hiểu thêm về YOLOv8

Ultralytics YOLO11

Dựa trên thành công của các phiên bản tiền nhiệm, YOLO11 đã tinh chỉnh kiến trúc cốt lõi để đẩy ranh giới Pareto về độ chính xác và độ trễ đi xa hơn nữa, giới thiệu một số lượng tham số được tối ưu hóa cao mà không làm giảm sức mạnh dự đoán.

Tìm hiểu thêm về YOLO11

Các kiến ​​trúc khác

Nếu bạn đang tìm kiếm các phương pháp tiếp cận khác, Ultralytics Ngoài ra, nó còn hỗ trợ các mô hình dựa trên transformer như RT-DETR và các bộ dò từ vựng mở không cần huấn luyện như YOLO -World . Tuy nhiên, để có độ trễ tối ưu và hiệu quả bộ nhớ, cần sử dụng các phương pháp tiêu chuẩn. YOLO Các kiến ​​trúc này thường vẫn là sự lựa chọn ưu tiên.

Sự khác biệt về kiến trúc và phương pháp luận

Sự chuyển đổi từ YOLOv8 ĐẾN YOLO11 Điều này thể hiện sự phát triển cẩn trọng trong thiết kế mạng nơ-ron chứ không phải là một cuộc đại tu hoàn toàn, đảm bảo rằng hệ sinh thái được duy trì tốt xung quanh các mô hình vẫn ổn định.

Tối ưu hóa Backbone và Neck

YOLOv8 Bài báo này giới thiệu một kiến ​​trúc mạng CNN được tinh giản, loại bỏ các hộp neo truyền thống, coi việc phát hiện đối tượng hoàn toàn là một bài toán dự đoán điểm trung tâm. Cách tiếp cận không sử dụng hộp neo này đã giảm đáng kể độ phức tạp của việc hồi quy hộp giới hạn. YOLO11 Dựa trên nền tảng này, chúng tôi đã giới thiệu một mạng lưới kim tự tháp tính năng (FPN) được tối ưu hóa và sửa đổi các khối C2f thành các mô-đun C3k2. Sự sửa đổi này cho phép YOLO11 để trích xuất các đặc điểm không gian phong phú hơn, điều này giúp cải thiện độ chính xác trên các đối tượng nhỏ thường thấy trong tập dữ liệu COCO .

Yêu cầu bộ nhớ và hiệu quả huấn luyện

Một trong những ưu điểm đáng chú ý nhất của cả hai YOLOv8 Và YOLO11 Ưu điểm của chúng là yêu cầu bộ nhớ thấp trong quá trình huấn luyện. Không giống như các mô hình Vision Transformer nặng nề có thể dễ dàng làm cạn kiệt VRAM trên phần cứng tiêu dùng, các mô hình này được tối ưu hóa để dễ dàng huấn luyện PyTorch trên các GPU tiêu chuẩn. YOLO11 giúp giảm đáng kể tổng số tham số — giảm tới 22% số tham số ở biến thể lớn (L) so với YOLOv8 —đồng thời tăng độ chính xác trung bình (Mean Average Precision) mAP Điều này có nghĩa là thời gian xử lý mỗi chu kỳ ngắn hơn và lượng khí thải carbon thấp hơn trong quá trình huấn luyện mô hình.

Các chỉ số hiệu suất

Để đánh giá chính xác sự cân bằng hiệu năng của các mô hình này, chúng ta cần xem xét các tiêu chuẩn khách quan. Bảng dưới đây so sánh... YOLOv8 Và YOLO11 trên các biến thể kích thước tiêu chuẩn (từ nano đến cực lớn).

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Như đã chứng minh, YOLO11 luôn vượt trội hơn YOLOv8 về độ chính xác trong khi sử dụng ít tham số và FLOPs hơn. Tốc độ suy luận CPU, được đo bằng ONNX Runtime, làm nổi bật hiệu quả vượt trội của YOLO11 cho các triển khai biên. Khi được xuất sang NVIDIA TensorRT, cả hai mô hình đều mang lại độ trễ dưới 15ms đặc biệt, điều cần thiết cho phân tích luồng video trong thế giới thực.

Hệ sinh thái và Dễ sử dụng

Cả hai mô hình đều hưởng lợi rất nhiều từ sự thống nhất ultralytics Python gói này. Cái này dễ sử dụng cho phép các kỹ sư chuyển đổi liền mạch giữa YOLOv8 và YOLO11. Huấn luyện, xác thực và xuất có thể được thực hiện chỉ với vài dòng mã.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model (you can simply swap to "yolov8n.pt")
model = YOLO("yolo11n.pt")

# Train the model efficiently on a local dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the optimized model to ONNX
model.export(format="onnx")

Sự tích hợp liền mạch này mở rộng đến Nền tảng Ultralytics , giúp đơn giản hóa việc đào tạo dựa trên đám mây, giám sát mô hình và triển khai mà không yêu cầu kiến ​​thức DevOps nâng cao.

Tính linh hoạt và các ứng dụng thực tế

Một đặc điểm nổi bật của framework Ultralytics là tính linh hoạt vốn có của nó. Cả YOLOv8 và YOLO11 đều hỗ trợ nhiều tác vụ thị giác máy tính ngoài phát hiện đối tượng tiêu chuẩn:

YOLOv8 Với thời gian ra mắt lâu hơn, nền tảng này tự hào sở hữu một kho lưu trữ khổng lồ các hướng dẫn từ cộng đồng và các triển khai doanh nghiệp đã được kiểm thử kỹ lưỡng. Nếu bạn đang tích hợp với các quy trình cũ yêu cầu khắt khe... YOLOv8 tensor Về hình dạng, nó vẫn là một lựa chọn rất đáng tin cậy. Tuy nhiên, đối với các dự án mới ưu tiên hiệu quả tối đa—chẳng hạn như triển khai trên các thiết bị biên nhúng như Raspberry Pi— YOLO11 Đây là giải pháp vận hành vượt trội nhờ tỷ lệ tốc độ trên thông số cao hơn hẳn.

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa YOLOv8 và YOLO11 phụ thuộc vào các yêu cầu dự án cụ thể, ràng buộc triển khai và sở thích hệ sinh thái của bạn.

Khi nào nên chọn YOLOv8

YOLOv8 là một lựa chọn tốt cho:

  • Triển khai đa tác vụ linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh cho detection, segmentation, classificationước tính tư thế trong hệ sinh thái Ultralytics.
  • Hệ thống sản xuất đã được thiết lập: Các môi trường sản xuất hiện có đã được xây dựng trên kiến trúc YOLOv8 với các pipeline triển khai ổn định, đã được kiểm thử kỹ lưỡng.
  • Hỗ trợ cộng đồng và hệ sinh thái rộng lớn: Các ứng dụng hưởng lợi từ các hướng dẫn mở rộng của YOLOv8, tích hợp bên thứ ba và tài nguyên cộng đồng tích cực.

Khi nào nên chọn YOLO11

YOLO11 Được khuyến nghị cho:

  • Triển khai biên sản xuất: Các ứng dụng thương mại trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson, nơi độ tin cậy và việc bảo trì tích cực là tối quan trọng.
  • Ứng dụng thị giác đa nhiệm: Các dự án yêu cầu detect, segmentation, ước tính tư thế, và OBB trong một framework thống nhất duy nhất.
  • Tạo mẫu và triển khai nhanh: Các nhóm cần chuyển nhanh từ thu thập dữ liệu sang sản xuất bằng cách sử dụng API Python của Ultralytics được tối ưu hóa.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • Triển khai biên không NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của xử lý hậu kỳ Non-Maximum Suppression.
  • Môi trường chỉ có CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi khả năng suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Detect đối tượng nhỏ: Các kịch bản đầy thách thức như hình ảnh từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các đối tượng rất nhỏ.

Công nghệ tiên tiến: Ưu điểm của YOLO26

Trong khi YOLOv8 Và YOLO11 Với những kiến ​​trúc tuyệt vời, lĩnh vực trí tuệ nhân tạo (AI) không ngừng vận động. Đối với các nhà phát triển hướng đến công nghệ tiên tiến nhất vào năm 2026, Ultralytics YOLO26 đại diện cho bước tiến vượt bậc tiếp theo.

YOLO26 đã định hình lại hoàn toàn quy trình triển khai. Nó sở hữu thiết kế không cần hệ thống quản lý mạng NMS từ đầu đến cuối , một phương pháp đột phá lần đầu tiên được tiên phong trong... YOLOv10 Điều này giúp loại bỏ các bước xử lý hậu kỳ phức tạp. Hơn nữa, việc loại bỏ DFL (Distribution Focal Loss) giúp đơn giản hóa đáng kể việc xuất logic và tăng cường khả năng tương thích với các thiết bị biên công suất thấp, dẫn đến tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước.

Tính ổn định trong quá trình huấn luyện và tốc độ hội tụ được cải thiện đáng kể nhờ thuật toán tối ưu hóa MuSGD mới, một thuật toán lai lấy cảm hứng từ các kỹ thuật huấn luyện LLM. Ngoài ra, các công thức hàm mất mát mới như ProgLoss + STAL giúp tăng cường đáng kể khả năng nhận dạng vật thể nhỏ — một vấn đề nan giải lâu nay đối với IoT và robot. Với những cải tiến chuyên biệt cho từng tác vụ như RLE để ước lượng tư thế và multi-scale proto để phân đoạn, YOLO26 thực sự vượt trội.

Tìm hiểu thêm về YOLO26

Lựa chọn mô hình phù hợp

Hãy bắt đầu hành trình của bạn với YOLOv8 nếu bạn cần sự hỗ trợ cộng đồng mạnh mẽ từ những người dùng lâu năm. Nâng cấp lên YOLO11 để có sự cân bằng tối ưu giữa tốc độ và số lượng tham số được giảm thiểu. Chuyển sang YOLO26 để có trải nghiệm tối ưu hóa biên tuyệt vời nhất. NMS - Kiến trúc tự do của tương lai.

Kết luận

Việc lựa chọn giữa YOLOv8 và YOLO11 cuối cùng phụ thuộc vào tiến độ dự án và các ràng buộc về phần cứng của bạn. YOLOv8 là một "người khổng lồ" đã được thử nghiệm trong ngành, mang lại sự ổn định vượt trội. Ngược lại, YOLO11 tinh chỉnh kiến trúc đó, mang lại mAP cao hơn với ít tham số hơn, khiến nó cực kỳ hấp dẫn cho các ứng dụng biên bị hạn chế tài nguyên. Bất kể lựa chọn của bạn là gì, API python Ultralytics liền mạch đảm bảo quy trình phát triển của bạn vẫn linh hoạt, hiệu quả và được hỗ trợ đầy đủ. Và khi bạn sẵn sàng vượt qua giới hạn của những gì có thể trên các thiết bị biên, YOLO26 đã sẵn sàng chờ đợi.


Bình luận