YOLOv8 so với YOLO11 So sánh kỹ thuật toàn diện các mô hình thị giác thời gian thực
Sự phát triển nhanh chóng của thị giác máy tính được thúc đẩy mạnh mẽ bởi những tiến bộ liên tục trong các khung phát hiện đối tượng thời gian thực. Đối với các nhà phát triển và nhà nghiên cứu đang hoạt động trong bối cảnh hiện đại, việc lựa chọn mô hình phù hợp là rất quan trọng để cân bằng giữa độ chính xác, tốc độ và hiệu quả tài nguyên. Trong bài so sánh kỹ thuật này, chúng ta sẽ khám phá sự khác biệt giữa hai mô hình nền tảng từ hệ sinh thái Ultralytics : Ultralytics YOLOv8 và Ultralytics YOLO11 .
Cả hai mẫu đều thể hiện những đặc điểm nổi bật của Ultralytics Các kiến trúc này nổi bật nhờ tính dễ sử dụng , hệ sinh thái được duy trì tốt và hiệu quả đào tạo vượt trội với yêu cầu bộ nhớ thấp. Hãy cùng tìm hiểu sâu hơn về thiết kế kiến trúc, điểm chuẩn hiệu năng và các kịch bản triển khai lý tưởng của chúng.
Tổng quan về mô hình
Trước khi so sánh những ưu điểm kỹ thuật cụ thể của chúng, việc xác định nguồn gốc và thông số kỹ thuật cốt lõi của cả hai mẫu là điều hữu ích.
Ultralytics YOLOv8
Được phát hành vào đầu năm 2023 như một bước tiến lớn, YOLOv8 Giới thiệu phương pháp phát hiện không cần neo và những cải tiến đáng kể cho các hàm mất mát, nhanh chóng trở thành tiêu chuẩn vàng cho nhiều nhiệm vụ học máy khác nhau.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2023-01-10
- GitHub:ultralytics/ultralytics
Ultralytics YOLO11
Tiếp nối thành công của các phiên bản tiền nhiệm, YOLO11 Đã tinh chỉnh kiến trúc cốt lõi để đẩy giới hạn Pareto về độ chính xác và độ trễ lên cao hơn nữa, giới thiệu số lượng tham số được tối ưu hóa cao mà không làm giảm khả năng dự đoán.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2024-09-27
- GitHub:ultralytics/ultralytics
Các kiến trúc khác
Nếu bạn đang tìm kiếm các phương pháp tiếp cận khác, Ultralytics Ngoài ra, nó còn hỗ trợ các mô hình dựa trên transformer như RT-DETR và các bộ dò từ vựng mở không cần huấn luyện như YOLO -World . Tuy nhiên, để có độ trễ tối ưu và hiệu quả bộ nhớ, cần sử dụng các phương pháp tiêu chuẩn. YOLO Các kiến trúc này thường vẫn là sự lựa chọn ưu tiên.
Sự khác biệt về kiến trúc và phương pháp luận
Sự chuyển đổi từ YOLOv8 ĐẾN YOLO11 Điều này thể hiện sự phát triển cẩn trọng trong thiết kế mạng nơ-ron chứ không phải là một cuộc đại tu hoàn toàn, đảm bảo rằng hệ sinh thái được duy trì tốt xung quanh các mô hình vẫn ổn định.
Tối ưu hóa xương sống và cổ
YOLOv8 Bài báo này giới thiệu một kiến trúc mạng CNN được tinh giản, loại bỏ các hộp neo truyền thống, coi việc phát hiện đối tượng hoàn toàn là một bài toán dự đoán điểm trung tâm. Cách tiếp cận không sử dụng hộp neo này đã giảm đáng kể độ phức tạp của việc hồi quy hộp giới hạn. YOLO11 Dựa trên nền tảng này, chúng tôi đã giới thiệu một mạng lưới kim tự tháp tính năng (FPN) được tối ưu hóa và sửa đổi các khối C2f thành các mô-đun C3k2. Sự sửa đổi này cho phép YOLO11 để trích xuất các đặc điểm không gian phong phú hơn, điều này giúp cải thiện độ chính xác trên các đối tượng nhỏ thường thấy trong tập dữ liệu COCO .
Yêu cầu bộ nhớ và hiệu quả huấn luyện
Một trong những ưu điểm đáng chú ý nhất của cả hai YOLOv8 Và YOLO11 Ưu điểm của chúng là yêu cầu bộ nhớ thấp trong quá trình huấn luyện. Không giống như các mô hình Vision Transformer nặng nề có thể dễ dàng làm cạn kiệt VRAM trên phần cứng tiêu dùng, các mô hình này được tối ưu hóa để dễ dàng huấn luyện PyTorch trên các GPU tiêu chuẩn. YOLO11 giúp giảm đáng kể tổng số tham số — giảm tới 22% số tham số ở biến thể lớn (L) so với YOLOv8 —đồng thời tăng độ chính xác trung bình (Mean Average Precision) mAP Điều này có nghĩa là thời gian xử lý mỗi chu kỳ ngắn hơn và lượng khí thải carbon thấp hơn trong quá trình huấn luyện mô hình.
Các chỉ số hiệu suất
Để đánh giá chính xác sự cân bằng hiệu năng của các mô hình này, chúng ta cần xem xét các tiêu chuẩn khách quan. Bảng dưới đây so sánh... YOLOv8 Và YOLO11 trên các biến thể kích thước tiêu chuẩn (từ nano đến cực lớn).
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Như đã chứng minh, YOLO11 luôn vượt trội YOLOv8 về độ chính xác trong khi sử dụng ít tham số và phép tính FLOP hơn. CPU Tốc độ suy luận, được đo bằng ONNX Runtime , làm nổi bật những điểm sau: YOLO11 Hiệu quả vượt trội của nó dành cho các triển khai ở biên. Khi xuất sang NVIDIA TensorRT , cả hai mô hình đều mang lại độ trễ dưới 15ms đặc biệt tốt, điều cần thiết cho việc phân tích luồng video thực tế.
Hệ sinh thái và Dễ sử dụng
Cả hai mẫu xe đều được hưởng lợi rất nhiều từ sự thống nhất. ultralytics Python gói này. Cái này dễ sử dụng cho phép các kỹ sư chuyển đổi liền mạch giữa các chế độ. YOLOv8 Và YOLO11 Việc huấn luyện, xác thực và xuất dữ liệu có thể được thực hiện chỉ với một vài dòng mã.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (you can simply swap to "yolov8n.pt")
model = YOLO("yolo11n.pt")
# Train the model efficiently on a local dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the optimized model to ONNX
model.export(format="onnx")
Sự tích hợp liền mạch này mở rộng đến Nền tảng Ultralytics , giúp đơn giản hóa việc đào tạo dựa trên đám mây, giám sát mô hình và triển khai mà không yêu cầu kiến thức DevOps nâng cao.
Tính linh hoạt và các ứng dụng thực tế
Một đặc điểm nổi bật của Ultralytics Điểm mạnh của khung này là tính linh hoạt vốn có của nó. Cả hai YOLOv8 Và YOLO11 Hỗ trợ nhiều tác vụ thị giác máy tính khác nhau, vượt xa khả năng phát hiện đối tượng tiêu chuẩn:
- Phân đoạn đối tượng : Mặt nạ cấp độ pixel có độ chính xác cao, hữu ích cho hình ảnh y tế và lái xe tự động.
- Ước lượng tư thế : Phát hiện điểm mấu chốt được thiết kế riêng cho phân tích thể thao và tương tác người-máy.
- Phân loại hình ảnh : Phân loại nhẹ sử dụng các mô hình xương sống được huấn luyện trên ImageNet .
- Hộp giới hạn định hướng (OBB) : Rất quan trọng để xác định các đối tượng bị xoay trong ảnh vệ tinh.
YOLOv8 Với thời gian ra mắt lâu hơn, nền tảng này tự hào sở hữu một kho lưu trữ khổng lồ các hướng dẫn từ cộng đồng và các triển khai doanh nghiệp đã được kiểm thử kỹ lưỡng. Nếu bạn đang tích hợp với các quy trình cũ yêu cầu khắt khe... YOLOv8 tensor Về hình dạng, nó vẫn là một lựa chọn rất đáng tin cậy. Tuy nhiên, đối với các dự án mới ưu tiên hiệu quả tối đa—chẳng hạn như triển khai trên các thiết bị biên nhúng như Raspberry Pi— YOLO11 Đây là giải pháp vận hành vượt trội nhờ tỷ lệ tốc độ trên thông số cao hơn hẳn.
Các trường hợp sử dụng và Khuyến nghị
Lựa chọn giữa YOLOv8 Và YOLO11 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Khi nào nên chọn YOLOv8
YOLOv8 là một lựa chọn tốt cho:
- Triển khai đa nhiệm linh hoạt: Các dự án yêu cầu một mô hình đã được chứng minh để phát hiện , phân đoạn , phân loại và ước tính tư thế trong phạm vi... Ultralytics hệ sinh thái.
- Hệ thống sản xuất hiện có: Môi trường sản xuất hiện tại đã được xây dựng trên hệ thống này. YOLOv8 kiến trúc với các quy trình triển khai ổn định, đã được kiểm thử kỹ lưỡng.
- Hỗ trợ cộng đồng và hệ sinh thái rộng rãi: Các ứng dụng được hưởng lợi từ YOLOv8 Hệ thống này có các hướng dẫn chi tiết, tích hợp với bên thứ ba và nguồn lực cộng đồng năng động.
Khi nào nên chọn YOLO11
YOLO11 Được khuyến nghị cho:
- Triển khai tại biên môi trường sản xuất: Các ứng dụng thương mại trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson , nơi độ tin cậy và bảo trì thường xuyên là yếu tố tối quan trọng.
- Ứng dụng thị giác đa nhiệm: Các dự án yêu cầu phát hiện , phân đoạn , ước lượng tư thế và OBB trong một khung thống nhất duy nhất.
- Tạo mẫu và triển khai nhanh chóng: Các nhóm cần chuyển nhanh từ thu thập dữ liệu sang sản xuất bằng cách sử dụng API Python Ultralytics được tối ưu hóa.
Khi nào nên lựa chọn Ultralytics (YOLO26)
Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:
- NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
- Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.
Công nghệ tiên tiến: Ưu điểm của YOLO26
Trong khi YOLOv8 Và YOLO11 Với những kiến trúc tuyệt vời, lĩnh vực trí tuệ nhân tạo (AI) không ngừng vận động. Đối với các nhà phát triển hướng đến công nghệ tiên tiến nhất vào năm 2026, Ultralytics YOLO26 đại diện cho bước tiến vượt bậc tiếp theo.
YOLO26 đã định hình lại hoàn toàn quy trình triển khai. Nó sở hữu thiết kế không cần hệ thống quản lý mạng NMS từ đầu đến cuối , một phương pháp đột phá lần đầu tiên được tiên phong trong... YOLOv10 Điều này giúp loại bỏ các bước xử lý hậu kỳ phức tạp. Hơn nữa, việc loại bỏ DFL (Distribution Focal Loss) giúp đơn giản hóa đáng kể việc xuất logic và tăng cường khả năng tương thích với các thiết bị biên công suất thấp, dẫn đến tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước.
Tính ổn định trong quá trình huấn luyện và tốc độ hội tụ được cải thiện đáng kể nhờ thuật toán tối ưu hóa MuSGD mới, một thuật toán lai lấy cảm hứng từ các kỹ thuật huấn luyện LLM. Ngoài ra, các công thức hàm mất mát mới như ProgLoss + STAL giúp tăng cường đáng kể khả năng nhận dạng vật thể nhỏ — một vấn đề nan giải lâu nay đối với IoT và robot. Với những cải tiến chuyên biệt cho từng tác vụ như RLE để ước lượng tư thế và multi-scale proto để phân đoạn, YOLO26 thực sự vượt trội.
Lựa chọn mô hình phù hợp
Hãy bắt đầu hành trình của bạn với YOLOv8 nếu bạn cần sự hỗ trợ cộng đồng mạnh mẽ từ những người dùng lâu năm. Nâng cấp lên YOLO11 để có sự cân bằng tối ưu giữa tốc độ và số lượng tham số được giảm thiểu. Chuyển sang YOLO26 để có trải nghiệm tối ưu hóa biên tuyệt vời nhất. NMS - Kiến trúc tự do của tương lai.
Kết luận
Lựa chọn giữa YOLOv8 Và YOLO11 Tóm lại, mọi thứ phụ thuộc vào tiến độ dự án và các hạn chế về phần cứng của bạn. YOLOv8 là một gã khổng lồ dày dạn kinh nghiệm trong ngành, mang đến sự ổn định vô song. Ngược lại, YOLO11 tinh chỉnh kiến trúc đó, mang lại hiệu suất cao hơn. mAP Với ít tham số hơn, nó trở nên vô cùng hấp dẫn đối với các ứng dụng biên có tài nguyên hạn chế. Bất kể lựa chọn của bạn là gì, sự liền mạch Ultralytics Python API đảm bảo quy trình phát triển của bạn luôn linh hoạt, hiệu quả và được hỗ trợ toàn diện. Và khi bạn sẵn sàng vượt qua những giới hạn của các thiết bị biên, YOLO26 đã sẵn sàng chờ đón bạn.