YOLO11 so với YOLOv5 : So sánh kỹ thuật toàn diện của Ultralytics Kiến trúc

Việc lựa chọn kiến trúc mạng nơ-ron phù hợp là một quyết định then chốt đối với bất kỳ dự án thị giác máy tính nào. Khi lĩnh vực trí tuệ nhân tạo phát triển, các công cụ dành cho nhà phát triển và nhà nghiên cứu cũng vậy. Hướng dẫn toàn diện này cung cấp sự so sánh kỹ thuật chuyên sâu giữa hai mô hình nổi bật từ hệ sinh thái Ultralytics : mô hình được đánh giá cao và YOLOv5 và nâng cao YOLO11 .

Cho dù bạn đang triển khai các mô hình nhẹ cho các ứng dụng AI biên hay xử lý các luồng video độ phân giải cao trên GPU đám mây, việc hiểu rõ các sắc thái kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng cho các mô hình này sẽ đảm bảo bạn đưa ra lựa chọn dựa trên dữ liệu phù hợp với các ràng buộc triển khai cụ thể của mình.

Nguồn gốc và thông tin kỹ thuật của mẫu xe

Cả hai mô hình đều phản ánh Ultralytics Cam kết của 'đối với sự hợp tác mã nguồn mở, hiệu năng mạnh mẽ và tính dễ sử dụng vượt trội, khiến chúng được cộng đồng học máy toàn cầu đánh giá cao.

YOLO11 Chi tiết

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 27/09/2024
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLO11

Tìm hiểu thêm về YOLO11

YOLOv5 Chi tiết

Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 26/06/2020
GitHub: ultralytics / yolov5
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv5

Tìm hiểu thêm về YOLOv5

Sự khác biệt về kiến trúc

Sự tiến hóa từ YOLOv5 ĐẾN YOLO11 Giới thiệu một số thay đổi kiến trúc sâu sắc được thiết kế để tối ưu hóa độ chính xác và hiệu quả tham số.

YOLOv5 PyTorch là một công cụ tiên phong, giới thiệu kiến trúc mạng CSPNet (Cross Stage Partial Network) được tối ưu hóa cao và mạng PANet (Path Aggregation Network) ở phần cổ. Nó dựa trên phát hiện dựa trên neo, yêu cầu các hộp neo được xác định trước để dự đoán ranh giới đối tượng. Mặc dù rất hiệu quả, việc điều chỉnh các neo này cho các tập dữ liệu thị giác máy tính tùy chỉnh có thể khá phức tạp.

Ngược lại, YOLO11 Chuyển sang mô hình phát hiện không cần anchor hiện đại hơn. Điều này loại bỏ nhu cầu điều chỉnh anchor box thủ công, giúp đơn giản hóa quá trình huấn luyện và cải thiện khả năng khái quát hóa trên các tập dữ liệu đa dạng như tập dữ liệu COCO . Ngoài ra, YOLO11 Đặc điểm nổi bật là đầu xử lý được tách rời, nghĩa là các tác vụ phân loại và hồi quy hộp giới hạn được xử lý trong các nhánh riêng biệt. Sự tách biệt này cải thiện đáng kể tốc độ hội tụ và độ chính xác trung bình ( mAP ) , đặc biệt là đối với các kịch bản phát hiện đối tượng phức tạp.

Các chỉ số hiệu suất và điểm chuẩn

Bảng dưới đây so sánh các chỉ số chính giữa các kích thước mô hình khác nhau. Ultralytics Các mẫu máy này nổi tiếng về yêu cầu bộ nhớ, thường tiêu thụ ít hơn. CUDA so sánh với các giải pháp thay thế dựa trên Transformer nặng nề hơn, bộ nhớ được sử dụng trong quá trình huấn luyện sẽ giảm đáng kể rào cản phần cứng.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Như đã quan sát, YOLO11 Đạt được sự cân bằng hiệu suất rất thuận lợi, liên tục mang lại kết quả cao hơn. mAP điểm số ở số lượng tham số tương đương với nó YOLOv5 đối tác.

Phương pháp luận đào tạo và Tính khả dụng

Một nguyên tắc cốt lõi của Ultralytics Triết lý của sản phẩm là mang lại sự dễ sử dụng vượt trội, được hỗ trợ bởi một hệ sinh thái được duy trì tốt và sự hỗ trợ rộng rãi từ cộng đồng.

YOLOv5 Trong lịch sử, nó dựa vào giao diện dòng lệnh mạnh mẽ ( CLI ) kịch bản (train.py, detect.py) để thực thi. Mặc dù mạnh mẽ, việc tích hợp trực tiếp các tập lệnh này vào các hệ thống tùy chỉnh cần phải được thực hiện cẩn thận. Python Các ứng dụng thường yêu cầu các giải pháp thay thế.

YOLO11 đã tạo ra một cuộc cách mạng bằng cách giới thiệu hệ thống được tinh giản. ultralytics Python gói. API thống nhất này xử lý mọi thứ từ đào tạo đến xuất khẩu mô hình các định dạng như ONNX, OpenVINO, và TensorRT bản địa.

Triển khai được tối ưu hóa với Ultralytics Nền tảng

Để có trải nghiệm hoàn toàn không cần lập trình, các nhà phát triển có thể sử dụng Nền tảng Ultralytics để chú thích dữ liệu, huấn luyện mô hình trên đám mây và triển khai chúng đến các thiết bị biên một cách liền mạch.

So sánh mã

Đào tạo một Ultralytics Mô hình hiện nay vô cùng hiệu quả. Dưới đây là cách bạn có thể huấn luyện. YOLO11 sử dụng bản địa của nó Python API:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the model to ONNX for deployment
model.export(format="onnx")

Đối với các hệ thống cũ sử dụng YOLOv5 đào tạo thông qua CLI Trông như thế này:

# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt

Các trường hợp sử dụng lý tưởng và ứng dụng thực tế

Cả hai mô hình đều sở hữu những ưu điểm riêng biệt, phù hợp với các môi trường hoạt động khác nhau.

Khi nào nên sử dụng YOLOv5

Bất chấp thế hệ mới hơn, YOLOv5 Vẫn là một thế lực mạnh mẽ. Nó được đánh giá cao trong các trường hợp sau:

Tích hợp hệ thống kế thừa: Môi trường được tích hợp sâu rộng với YOLOv5 đặc thù của tensor Các cấu trúc hoặc quy trình triển khai không thể dễ dàng được chỉnh sửa lại.
Các tiêu chuẩn cơ bản trong nghiên cứu học thuật: Các nhà nghiên cứu cần các tiêu chuẩn cơ bản đã được thiết lập và duy trì lâu dài để thực hiện các nghiên cứu học thuật có thể tái lập trong lĩnh vực phân tích hình ảnh y tế .

Khi nào nên sử dụng YOLO11

YOLO11 Nhờ tính linh hoạt vượt trội, đây là sự lựa chọn lý tưởng cho các dây chuyền sản xuất hiện đại:

Môi trường đa nhiệm: Không giống như YOLOv5 , chủ yếu là một bộ dò (sau này sẽ có thêm chức năng phân đoạn), YOLO11 Hỗ trợ sẵn các chức năng phân đoạn đối tượng , phân loại hình ảnh , ước lượng tư thế và phát hiện hộp giới hạn định hướng (OBB) .
Phân tích video mật độ cao: Lý tưởng cho các hệ thống giao thông thông minh hoặc quản lý hàng tồn kho bán lẻ , nơi việc trích xuất độ chính xác tối đa từ các cảnh quay phức tạp là rất quan trọng.

Hướng tới tương lai: Kiến trúc YOLO26

Trong khi YOLO11 Với tiêu chuẩn vượt trội, lĩnh vực thị giác máy tính vẫn tiếp tục phát triển nhanh chóng. Các nhà phát triển tìm kiếm hiệu quả tối ưu tuyệt đối cũng nên xem xét Ultralytics YOLO26 mới nhất (phát hành tháng 1 năm 2026).

YOLO26 đại diện cho một bước tiến vượt bậc, được thiết kế đặc biệt cho cả việc tối ưu hóa tại biên và quy mô doanh nghiệp. Các cải tiến chính bao gồm:

Thiết kế không cần NMS từ đầu đến cuối: YOLO26 được thiết kế từ đầu đến cuối, loại bỏ quá trình xử lý hậu kỳ Non-Maximum Suppression ( NMS ) giúp triển khai nhanh hơn và đơn giản hơn.
Loại bỏ DFL: Hiện tượng suy hao tiêu điểm phân bố (Distribution Focal Loss - DFL) đã được loại bỏ để đơn giản hóa việc xuất mô hình và tăng cường khả năng tương thích với các thiết bị công suất thấp.
MuSGD Optimizer: Một sự kết hợp đột phá của... SGD và Muon, mang lại sự ổn định cho quá trình huấn luyện LLM trong lĩnh vực thị giác máy tính, giúp hội tụ nhanh hơn.
Tốc độ suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho các triển khai IoT và các thiết bị không có GPU chuyên dụng.
ProgLoss + STAL: Các hàm mất mát được cải tiến đáng kể, mang lại những cải thiện rõ rệt trong việc nhận dạng vật thể nhỏ, rất quan trọng đối với ảnh chụp từ máy bay không người lái.

Tìm hiểu thêm về YOLO26

Tóm tắt

Lựa chọn giữa YOLO11 Và YOLOv5 Điều này cuối cùng phụ thuộc vào giai đoạn vòng đời của dự án. YOLOv5 Di sản của YOLO11 là không thể phủ nhận, mang lại sự ổn định tuyệt đối và sự hỗ trợ mạnh mẽ từ cộng đồng. Tuy nhiên, đối với bất kỳ dự án mới nào, YOLO11 vẫn được đánh giá cao hơn so với các thế hệ cũ. Nó kết hợp độ chính xác tiên tiến, một giao diện cực kỳ thanh lịch. Python API và giảm thiểu chi phí bộ nhớ huấn luyện, củng cố Ultralytics ' vị trí tiên phong trong đổi mới trí tuệ nhân tạo. Đối với những người muốn vượt qua mọi giới hạn, việc khám phá YOLO26 hiện đại trên nền tảng Ultralytics sẽ mang lại kết quả vượt trội.