Meet YOLO26: next-gen vision AI.

Link to this sectionXuất Intel OpenVINO#

OpenVINO Intel AI inference toolkit

Trong hướng dẫn này, chúng tôi đề cập đến việc xuất các model YOLO26 sang định dạng OpenVINO, có thể cung cấp tốc độ nhanh hơn tới 3 lần trên CPU, cũng như tăng tốc suy luận YOLO trên phần cứng GPUNPU của Intel.

OpenVINO, viết tắt của Open Visual Inference & Neural Network Optimization toolkit, là một bộ công cụ toàn diện để tối ưu hóa và triển khai các model suy luận AI. Mặc dù tên gọi chứa từ Visual, OpenVINO cũng hỗ trợ nhiều tác vụ bổ sung bao gồm ngôn ngữ, âm thanh, chuỗi thời gian, v.v.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Link to this sectionVí dụ Sử dụng#

Định dạng OpenVINO hỗ trợ các chế độ Export, Predict, và Validate. Hãy xuất model của bạn, sau đó tải model đã xuất để chạy suy luận hoặc xác thực độ chính xác của nó trên CPU, GPU tích hợp/rời hoặc NPU của Intel.

Xuất (Export)
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to OpenVINO format
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'
Dự đoán (Predict)
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")
Xác thực
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionĐối số xuất#

Đối sốLoạiMặc địnhMô tả
formatstr'openvino'Định dạng đích cho model được xuất, xác định khả năng tương thích với các môi trường triển khai khác nhau.
imgszint hoặc tuple640Kích thước hình ảnh mong muốn cho đầu vào của model. Có thể là một số nguyên cho hình ảnh vuông hoặc một tuple (height, width) cho các kích thước cụ thể.
quantizeint hoặc strNoneĐộ chính xác lượng tử hóa: 16 (FP16) hoặc 8 (INT8/PTQ; yêu cầu data/fraction hiệu chỉnh); 32/không thiết lập là FP32. Thay thế cho các cờ half/int8 đã lỗi thời.
dynamicboolFalseCho phép kích thước đầu vào động, tăng tính linh hoạt trong việc xử lý các kích thước hình ảnh khác nhau.
nmsboolFalseThêm Non-Maximum Suppression (NMS), rất cần thiết cho việc xử lý hậu kỳ phát hiện chính xác và hiệu quả.
batchint1Chỉ định kích thước batch inference của model khi xuất hoặc số lượng ảnh tối đa mà model đã xuất sẽ xử lý đồng thời ở chế độ predict.
datastr'coco8.yaml'Đường dẫn đến tệp cấu hình dataset (mặc định: coco8.yaml), cần thiết cho việc lượng tử hóa (quantization).
fractionfloat1.0Chỉ định phân đoạn của dataset để sử dụng cho hiệu chuẩn lượng tử hóa INT8. Cho phép hiệu chuẩn trên một tập hợp con của toàn bộ dataset, hữu ích cho các thử nghiệm hoặc khi tài nguyên hạn chế. Nếu không được chỉ định trong khi INT8 đã được bật, toàn bộ dataset sẽ được sử dụng.

Để biết thêm chi tiết về quy trình xuất, hãy truy cập trang tài liệu của Ultralytics về việc xuất.

Cảnh báo

OpenVINO™ tương thích với hầu hết các bộ xử lý Intel® nhưng để đảm bảo hiệu suất tối ưu:

  1. Xác minh khả năng hỗ trợ của OpenVINO™ Kiểm tra xem chip Intel® của bạn có được OpenVINO™ hỗ trợ chính thức hay không bằng cách sử dụng danh sách tương thích của Intel.

  2. Xác định bộ tăng tốc của bạn Xác định xem bộ xử lý của bạn có bao gồm NPU (Neural Processing Unit) hoặc GPU (GPU tích hợp) hay không bằng cách tham khảo hướng dẫn phần cứng của Intel.

  3. Cài đặt các trình điều khiển mới nhất Nếu chip của bạn hỗ trợ NPU hoặc GPU nhưng OpenVINO™ không phát hiện ra, bạn có thể cần cài đặt hoặc cập nhật các trình điều khiển liên quan. Hãy làm theo hướng dẫn cài đặt trình điều khiển để kích hoạt toàn bộ khả năng tăng tốc.

Bằng cách làm theo ba bước này, bạn có thể đảm bảo OpenVINO™ chạy tối ưu trên phần cứng Intel® của mình.

Link to this sectionLợi ích của OpenVINO#

  1. Hiệu suất: OpenVINO mang lại khả năng suy luận hiệu suất cao bằng cách tận dụng sức mạnh của CPU, GPU tích hợp và rời, cùng các FPGA của Intel.
  2. Hỗ trợ thực thi không đồng nhất: OpenVINO cung cấp API để viết một lần và triển khai trên mọi phần cứng Intel được hỗ trợ (CPU, GPU, FPGA, VPU, v.v.).
  3. Model Optimizer: OpenVINO cung cấp một Model Optimizer cho phép nhập, chuyển đổi và tối ưu hóa các model từ các framework deep learning phổ biến như PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle và Caffe.
  4. Dễ sử dụng: Bộ công cụ đi kèm với một bộ sưu tập lớn các tutorial notebooks (bao gồm tối ưu hóa YOLO26) hướng dẫn các khía cạnh khác nhau của bộ công cụ.

Link to this sectionCấu trúc xuất OpenVINO#

Khi bạn xuất một model sang định dạng OpenVINO, nó tạo ra một thư mục chứa những thành phần sau:

  1. Tệp XML: Mô tả cấu trúc liên kết mạng.
  2. Tệp BIN: Chứa dữ liệu nhị phân về trọng số và thiên vị (weights and biases).
  3. Tệp Mapping: Chứa thông tin ánh xạ các tensor đầu ra của model gốc sang tên tensor của OpenVINO.

Bạn có thể sử dụng các tệp này để chạy suy luận với OpenVINO Inference Engine.

Link to this sectionSử dụng xuất OpenVINO trong triển khai#

Sau khi model của bạn đã được xuất thành công sang định dạng OpenVINO, bạn có hai lựa chọn chính để chạy suy luận:

  1. Sử dụng gói ultralytics, cung cấp API cấp cao và bao bọc OpenVINO Runtime.

  2. Sử dụng gói openvino gốc để kiểm soát nâng cao hoặc tùy chỉnh hơn đối với hành vi suy luận.

Link to this sectionSuy luận với Ultralytics#

Gói ultralytics cho phép bạn dễ dàng chạy suy luận bằng model OpenVINO đã xuất thông qua phương thức predict. Bạn cũng có thể chỉ định thiết bị mục tiêu (ví dụ: intel:gpu, intel:npu, intel:cpu) bằng cách sử dụng đối số device.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

Cách tiếp cận này lý tưởng cho việc tạo mẫu nhanh hoặc triển khai khi bạn không cần toàn quyền kiểm soát quy trình suy luận.

Link to this sectionSuy luận với OpenVINO Runtime#

OpenVINO Runtime cung cấp một API thống nhất để suy luận trên tất cả các phần cứng Intel được hỗ trợ. Nó cũng cung cấp các tính năng nâng cao như cân bằng tải trên phần cứng Intel và thực thi không đồng bộ. Để biết thêm thông tin về việc chạy suy luận, hãy tham khảo YOLO26 notebooks.

Hãy nhớ rằng bạn sẽ cần các tệp XML và BIN cũng như mọi cài đặt cụ thể của ứng dụng như kích thước đầu vào, hệ số tỉ lệ để chuẩn hóa, v.v., để thiết lập và sử dụng đúng cách model với Runtime.

Trong ứng dụng triển khai của bạn, thông thường bạn sẽ thực hiện các bước sau:

  1. Khởi tạo OpenVINO bằng cách tạo core = Core().
  2. Tải model bằng phương thức core.read_model().
  3. Biên dịch model bằng hàm core.compile_model().
  4. Chuẩn bị đầu vào (hình ảnh, văn bản, âm thanh, v.v.).
  5. Chạy suy luận bằng compiled_model(input_data).

Để biết thêm các bước chi tiết và đoạn mã mẫu, hãy tham khảo tài liệu OpenVINO hoặc API tutorial.

Link to this sectionĐiểm chuẩn YOLO26 của OpenVINO#

Đội ngũ Ultralytics đã đánh giá YOLO26 trên nhiều định dạng model và precision, đánh giá tốc độ và độ chính xác trên các thiết bị Intel khác nhau tương thích với OpenVINO.

Lưu ý
  • Kết quả điểm chuẩn dưới đây chỉ mang tính chất tham khảo và có thể thay đổi tùy thuộc vào cấu hình phần cứng và phần mềm chính xác của hệ thống, cũng như khối lượng công việc hiện tại của hệ thống tại thời điểm chạy điểm chuẩn.

  • Tất cả các điểm chuẩn được chạy với gói Python openvino phiên bản 2026.2.0.

  • Các model YOLO26 trên NPU chỉ được hỗ trợ trên các hệ thống Intel® Core™ Ultra™ với dòng 2xxV và 3xx series trở lên.

Link to this sectionIntel® Core™ Ultra#

Dòng Intel® Core™ Ultra™ đại diện cho một tiêu chuẩn mới trong tính toán hiệu suất cao, được thiết kế để đáp ứng nhu cầu ngày càng tăng của người dùng hiện đại—từ game thủ và nhà sáng tạo đến các chuyên gia tận dụng AI. Dòng sản phẩm thế hệ tiếp theo này không chỉ là một dòng CPU truyền thống; nó kết hợp các lõi CPU mạnh mẽ, khả năng GPU tích hợp hiệu suất cao và bộ xử lý NPU chuyên dụng trong một con chip duy nhất, mang đến một giải pháp thống nhất cho các khối lượng công việc tính toán đa dạng và chuyên sâu.

Trọng tâm của kiến trúc Intel® Core Ultra™ là thiết kế lai cho phép đạt hiệu suất vượt trội trên các tác vụ xử lý truyền thống, các khối lượng công việc tăng tốc bởi GPU và các hoạt động điều khiển bằng AI. Việc tích hợp NPU giúp nâng cao khả năng suy luận AI trên thiết bị, cho phép học máy và xử lý dữ liệu nhanh hơn, hiệu quả hơn trên nhiều ứng dụng.

Dòng sản phẩm Core Ultra™ bao gồm nhiều model khác nhau được thiết kế riêng cho các nhu cầu hiệu suất khác nhau, với các tùy chọn từ thiết kế tiết kiệm năng lượng đến các biến thể công suất cao được đánh dấu bằng ký hiệu "H"—lý tưởng cho máy tính xách tay và các yếu tố hình thức nhỏ gọn đòi hỏi sức mạnh tính toán lớn. Trên toàn bộ dòng sản phẩm, người dùng được hưởng lợi từ sự kết hợp của tích hợp CPU, GPU và NPU, mang lại hiệu quả, khả năng phản hồi và khả năng đa nhiệm đáng kinh ngạc.

Là một phần trong sự đổi mới không ngừng của Intel, dòng Core Ultra™ thiết lập một tiêu chuẩn mới cho điện toán sẵn sàng cho tương lai. Với nhiều model hiện có và nhiều model khác sắp ra mắt, dòng sản phẩm này nhấn mạnh cam kết của Intel trong việc cung cấp các giải pháp tiên tiến cho thế hệ thiết bị thông minh, tích hợp AI tiếp theo.

Các điểm chuẩn dưới đây chạy trên Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V và Intel® Core™ Ultra™ 7 155H ở độ chính xác FP32, FP16 và INT8.

Link to this sectionIntel® Core™ Ultra™ X7 358H#

Điểm chuẩn (Benchmarks)
Intel Core Ultra GPU benchmarks
Kết quả điểm chuẩn chi tiết
Mô hìnhĐịnh dạngPrecisionTrạng tháiKích thước (MB)metrics/mAP50-95(B)Thời gian suy luận (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Link to this sectionIntel® Core™ Ultra™ 7 258V#

Điểm chuẩn (Benchmarks)
Intel Core Ultra GPU benchmarks
Kết quả điểm chuẩn chi tiết
Mô hìnhĐịnh dạngPrecisionTrạng tháiKích thước (MB)metrics/mAP50-95(B)Thời gian suy luận (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Link to this sectionIntel® Core™ Ultra™ 7 155H#

Điểm chuẩn (Benchmarks)
Intel Core Ultra GPU benchmarks
Kết quả điểm chuẩn chi tiết
Mô hìnhĐịnh dạngPrecisionTrạng tháiKích thước (MB)metrics/mAP50-95(B)Thời gian suy luận (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

Link to this sectionTái tạo kết quả của chúng tôi#

Để tái hiện các điểm chuẩn của Ultralytics ở trên trên tất cả các định dạng xuất, hãy chạy mã này:

Ví dụ
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

Lưu ý rằng kết quả đo điểm chuẩn có thể thay đổi tùy thuộc vào cấu hình phần cứng và phần mềm chính xác của hệ thống, cũng như khối lượng công việc hiện tại của hệ thống tại thời điểm chạy các điểm chuẩn. Để có kết quả đáng tin cậy nhất, hãy sử dụng tập dữ liệu có số lượng ảnh lớn, ví dụ: data='coco.yaml' (5000 ảnh kiểm thử).

Link to this sectionKết luận#

Kết quả đo điểm chuẩn chứng minh rõ ràng những lợi ích của việc xuất mô hình YOLO26 sang định dạng OpenVINO. Trên các mô hình và nền tảng phần cứng khác nhau, định dạng OpenVINO luôn vượt trội hơn các định dạng khác về tốc độ suy luận trong khi vẫn duy trì độ chính xác tương đương.

Các điểm chuẩn nhấn mạnh tính hiệu quả của OpenVINO như một công cụ để triển khai các mô hình deep learning. Bằng cách chuyển đổi các mô hình sang định dạng OpenVINO, các lập trình viên có thể đạt được những cải thiện hiệu suất đáng kể, giúp việc triển khai các mô hình này trong các ứng dụng thực tế trở nên dễ dàng hơn.

Để biết thêm thông tin chi tiết và hướng dẫn về cách sử dụng OpenVINO, hãy tham khảo tài liệu chính thức của OpenVINO.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionLàm thế nào để xuất mô hình YOLO26 sang định dạng OpenVINO?#

Việc xuất các mô hình YOLO26 sang định dạng OpenVINO có thể tăng đáng kể tốc độ CPU và cho phép tăng tốc GPU và NPU trên phần cứng của Intel. Để xuất, bạn có thể sử dụng Python hoặc CLI như hiển thị dưới đây:

Ví dụ
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

Để biết thêm thông tin, hãy tham khảo tài liệu về các định dạng xuất.

Link to this sectionLợi ích của việc sử dụng OpenVINO với các mô hình YOLO26 là gì?#

Việc sử dụng bộ công cụ OpenVINO của Intel với các mô hình YOLO26 mang lại một số lợi ích:

  1. Hiệu suất: Đạt tốc độ suy luận nhanh hơn tới 3 lần trên CPU và tận dụng GPU và NPU của Intel để tăng tốc.
  2. Model Optimizer: Chuyển đổi, tối ưu hóa và thực thi các mô hình từ các framework phổ biến như PyTorch, TensorFlow và ONNX.
  3. Dễ sử dụng: Một bộ sưu tập lớn các notebook hướng dẫn được cung cấp để giúp người dùng bắt đầu, bao gồm cả những notebook cho YOLO26.
  4. Thực thi không đồng nhất: Triển khai các mô hình trên nhiều phần cứng Intel khác nhau với một API thống nhất.

Để có so sánh chi tiết về hiệu suất, hãy truy cập phần điểm chuẩn của chúng tôi.

Link to this sectionLàm thế nào để tôi có thể chạy suy luận bằng mô hình YOLO26 đã xuất sang OpenVINO?#

Sau khi xuất mô hình YOLO26n sang định dạng OpenVINO, bạn có thể chạy suy luận bằng Python hoặc CLI:

Ví dụ
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

Tham khảo tài liệu chế độ dự đoán (predict mode) của chúng tôi để biết thêm chi tiết.

Link to this sectionTại sao tôi nên chọn Ultralytics YOLO26 thay vì các mô hình khác cho việc xuất sang OpenVINO?#

Ultralytics YOLO26 được tối ưu hóa cho việc nhận diện đối tượng theo thời gian thực với độ chính xác và tốc độ cao. Cụ thể, khi kết hợp với OpenVINO, YOLO26 cung cấp:

  • Tăng tốc độ lên tới 3 lần trên CPU Intel
  • Triển khai liền mạch trên GPU và NPU Intel
  • Độ chính xác ổn định và tương đương trên nhiều định dạng xuất khác nhau

Để phân tích hiệu suất chuyên sâu, hãy kiểm tra các điểm chuẩn YOLO26 chi tiết của chúng tôi trên các loại phần cứng khác nhau.

Link to this sectionTôi có thể đo điểm chuẩn các mô hình YOLO26 trên các định dạng khác nhau như PyTorch, ONNX và OpenVINO không?#

Có, bạn có thể đo điểm chuẩn các mô hình YOLO26 ở nhiều định dạng khác nhau bao gồm PyTorch, TorchScript, ONNX và OpenVINO. Sử dụng đoạn mã sau để chạy các điểm chuẩn trên tập dữ liệu bạn đã chọn:

Ví dụ
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

Để biết kết quả điểm chuẩn chi tiết, hãy tham khảo phần điểm chuẩn và tài liệu các định dạng xuất của chúng tôi.

Bình luận