Hướng dẫn xuất mô hình YOLO26 sang TFLite để triển khai
Việc triển khai các mô hình computer vision trên các thiết bị biên (edge devices) hoặc thiết bị nhúng đòi hỏi một định dạng có thể đảm bảo hiệu suất liền mạch.
Định dạng xuất TensorFlow Lite hay TFLite cho phép bạn tối ưu hóa các mô hình Ultralytics YOLO26 của mình cho các tác vụ như object detection và image classification trong các ứng dụng trên thiết bị biên. Trong hướng dẫn này, chúng ta sẽ đi qua các bước chuyển đổi mô hình sang định dạng TFLite, giúp mô hình của bạn hoạt động hiệu quả hơn trên nhiều thiết bị biên khác nhau.
Tại sao bạn nên xuất sang TFLite?
Được Google giới thiệu vào tháng 5 năm 2017 như một phần của framework TensorFlow, TensorFlow Lite, viết tắt là TFLite, là một framework deep learning mã nguồn mở được thiết kế cho suy luận trên thiết bị (on-device inference), hay còn gọi là edge computing. Nó cung cấp cho các nhà phát triển những công cụ cần thiết để thực thi các mô hình đã huấn luyện trên thiết bị di động, thiết bị nhúng, thiết bị IoT cũng như các máy tính truyền thống.
TensorFlow Lite tương thích với nhiều nền tảng, bao gồm Linux nhúng, Android, iOS và vi điều khiển (MCU). Việc xuất mô hình sang TFLite giúp ứng dụng của bạn nhanh hơn, đáng tin cậy hơn và có khả năng chạy ngoại tuyến.
Các tính năng chính của mô hình TFLite
Các mô hình TFLite cung cấp một loạt các tính năng chính cho phép machine learning trên thiết bị bằng cách hỗ trợ các nhà phát triển chạy mô hình của họ trên thiết bị di động, thiết bị nhúng và thiết bị biên:
-
Tối ưu hóa trên thiết bị (On-device Optimization): TFLite tối ưu hóa cho ML trên thiết bị, giảm độ trễ bằng cách xử lý dữ liệu cục bộ, tăng cường quyền riêng tư bằng cách không truyền dữ liệu cá nhân và giảm thiểu kích thước mô hình để tiết kiệm không gian.
-
Hỗ trợ đa nền tảng: TFLite cung cấp khả năng tương thích nền tảng rộng rãi, hỗ trợ Android, iOS, Linux nhúng và vi điều khiển.
-
Hỗ trợ đa ngôn ngữ: TFLite tương thích với nhiều ngôn ngữ lập trình khác nhau, bao gồm Java, Swift, Objective-C, C++ và Python.
-
Hiệu năng cao: Đạt được hiệu năng vượt trội thông qua tăng tốc phần cứng và tối ưu hóa mô hình.
Các tùy chọn triển khai trong TFLite
Trước khi xem mã nguồn để xuất các mô hình YOLO26 sang định dạng TFLite, hãy cùng tìm hiểu cách các mô hình TFLite thường được sử dụng.
TFLite cung cấp nhiều tùy chọn triển khai trên thiết bị cho các mô hình machine learning, bao gồm:
- Triển khai với Android và iOS: Cả ứng dụng Android và iOS với TFLite đều có thể phân tích các nguồn cấp dữ liệu camera và cảm biến tại biên để phát hiện và nhận diện đối tượng. TFLite cũng cung cấp các thư viện iOS gốc được viết bằng Swift và Objective-C. Sơ đồ kiến trúc dưới đây cho thấy quy trình triển khai một mô hình đã huấn luyện lên các nền tảng Android và iOS sử dụng TensorFlow Lite.
-
Triển khai với Linux nhúng: Nếu việc chạy suy luận trên Raspberry Pi sử dụng Hướng dẫn Ultralytics không đáp ứng yêu cầu về tốc độ cho trường hợp sử dụng của bạn, bạn có thể sử dụng mô hình TFLite đã xuất để tăng tốc thời gian suy luận. Ngoài ra, có thể cải thiện hiệu năng hơn nữa bằng cách sử dụng thiết bị Coral Edge TPU.
-
Triển khai với vi điều khiển: Các mô hình TFLite cũng có thể được triển khai trên vi điều khiển và các thiết bị khác chỉ với vài kilobyte bộ nhớ. Runtime cốt lõi chỉ chiếm 16 KB trên Arm Cortex M3 và có thể chạy nhiều mô hình cơ bản. Nó không yêu cầu hỗ trợ hệ điều hành, bất kỳ thư viện C hoặc C++ tiêu chuẩn nào hay cấp phát bộ nhớ động.
Xuất sang TFLite: Chuyển đổi mô hình YOLO26 của bạn
Bạn có thể cải thiện hiệu quả thực thi mô hình trên thiết bị và tối ưu hóa hiệu năng bằng cách chuyển đổi các mô hình của mình sang định dạng TFLite.
Cài đặt
Để cài đặt các gói cần thiết, hãy chạy:
# Install the required package for YOLO26
pip install ultralyticsĐể biết hướng dẫn chi tiết và các phương pháp thực hành tốt nhất liên quan đến quy trình cài đặt, hãy xem hướng dẫn Cài đặt Ultralytics của chúng tôi. Trong quá trình cài đặt các gói cần thiết cho YOLO26, nếu gặp bất kỳ khó khăn nào, hãy tham khảo hướng dẫn về các vấn đề phổ biến để tìm giải pháp và mẹo xử lý.
Cách sử dụng
Tất cả các mô hình Ultralytics YOLO26 đều được thiết kế để hỗ trợ xuất ngay lập tức, giúp dễ dàng tích hợp chúng vào quy trình triển khai ưa thích của bạn. Bạn có thể xem danh sách đầy đủ các định dạng xuất và tùy chọn cấu hình được hỗ trợ để chọn thiết lập tốt nhất cho ứng dụng của mình.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to TFLite format
model.export(format="tflite") # creates 'yolo26n_float32.tflite'
# Load the exported TFLite model
tflite_model = YOLO("yolo26n_float32.tflite")
# Run inference
results = tflite_model("https://ultralytics.com/images/bus.jpg")Các đối số Xuất
| Đối số | Loại | Mặc định | Mô tả |
|---|---|---|---|
format | str | 'tflite' | Định dạng mục tiêu cho model đã xuất, xác định khả năng tương thích với các môi trường triển khai khác nhau. |
imgsz | int hoặc tuple | 640 | Kích thước hình ảnh mong muốn cho đầu vào của model. Có thể là một số nguyên cho hình ảnh vuông hoặc một tuple (height, width) cho các kích thước cụ thể. |
half | bool | False | Kích hoạt lượng tử hóa FP16 (độ chính xác một nửa), giảm kích thước model và có khả năng tăng tốc suy luận trên phần cứng được hỗ trợ. |
int8 | bool | False | Kích hoạt lượng tử hóa INT8, nén model thêm nữa và tăng tốc suy luận với mức giảm độ chính xác tối thiểu, chủ yếu cho các thiết bị biên. |
nms | bool | False | Thêm Non-Maximum Suppression (NMS), cần thiết cho việc hậu xử lý phát hiện chính xác và hiệu quả. |
batch | int | 1 | Chỉ định kích thước suy luận batch của model xuất hoặc số lượng ảnh tối đa mà model xuất sẽ xử lý đồng thời ở chế độ predict. |
data | str | 'coco8.yaml' | Đường dẫn đến tệp cấu hình dataset (mặc định: coco8.yaml), rất cần thiết cho việc lượng tử hóa (quantization). |
fraction | float | 1.0 | Chỉ định phần trăm dataset cần sử dụng cho hiệu chuẩn lượng tử hóa INT8. Cho phép hiệu chuẩn trên một tập con của toàn bộ dataset, hữu ích cho các thử nghiệm hoặc khi tài nguyên bị hạn chế. Nếu không được chỉ định trong khi INT8 đã được bật, toàn bộ dataset sẽ được sử dụng. |
device | str | None | Chỉ định thiết bị để xuất: CPU (device=cpu), MPS cho Apple silicon (device=mps). |
Để biết thêm chi tiết về quy trình xuất, hãy truy cập trang tài liệu Ultralytics về xuất model.
Triển khai các mô hình YOLO26 TFLite đã xuất
Sau khi xuất thành công các mô hình Ultralytics YOLO26 sang định dạng TFLite, bạn có thể triển khai chúng. Bước đầu tiên chính yếu và được khuyến nghị để chạy một mô hình TFLite là sử dụng phương thức YOLO("model.tflite"), như đã nêu trong đoạn mã sử dụng trước đó. Tuy nhiên, để có hướng dẫn chuyên sâu về việc triển khai các mô hình TFLite trong nhiều môi trường khác, hãy xem các tài nguyên sau:
-
Android: Hướng dẫn bắt đầu nhanh để tích hợp TensorFlow Lite vào các ứng dụng Android, cung cấp các bước dễ làm theo để thiết lập và chạy các mô hình machine learning.
-
iOS: Xem hướng dẫn chi tiết này dành cho các nhà phát triển về việc tích hợp và triển khai các mô hình TensorFlow Lite trong các ứng dụng iOS, cung cấp hướng dẫn từng bước và các tài nguyên.
-
Ví dụ toàn diện (End-To-End): Trang này cung cấp cái nhìn tổng quan về nhiều ví dụ TensorFlow Lite khác nhau, giới thiệu các ứng dụng thực tế và các bài hướng dẫn được thiết kế để giúp các nhà phát triển triển khai TensorFlow Lite trong các dự án machine learning của họ trên thiết bị di động và thiết bị biên.
Tóm tắt
Trong hướng dẫn này, chúng tôi đã tập trung vào cách xuất sang định dạng TFLite. Bằng cách chuyển đổi các mô hình Ultralytics YOLO26 của bạn sang định dạng mô hình TFLite, bạn có thể cải thiện hiệu quả và tốc độ của các mô hình YOLO26, khiến chúng trở nên hiệu quả và phù hợp hơn cho các môi trường edge computing.
Để biết thêm chi tiết về cách sử dụng, hãy truy cập tài liệu chính thức của TFLite.
Ngoài ra, nếu bạn tò mò về các tích hợp Ultralytics YOLO26 khác, hãy xem trang hướng dẫn tích hợp của chúng tôi. Bạn sẽ tìm thấy rất nhiều thông tin và thông tin chi tiết hữu ích ở đó.
Câu hỏi thường gặp (FAQ)
Làm thế nào để xuất mô hình YOLO26 sang định dạng TFLite?
Để xuất mô hình YOLO26 sang định dạng TFLite, bạn có thể sử dụng thư viện Ultralytics. Trước tiên, hãy cài đặt gói cần thiết bằng:
pip install ultralyticsSau đó, sử dụng đoạn mã sau để xuất mô hình của bạn:
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to TFLite format
model.export(format="tflite") # creates 'yolo26n_float32.tflite'Đối với người dùng CLI, bạn có thể thực hiện việc này với:
yolo export model=yolo26n.pt format=tflite # creates 'yolo26n_float32.tflite'Để biết thêm chi tiết, hãy truy cập hướng dẫn xuất của Ultralytics.
Lợi ích của việc sử dụng TensorFlow Lite cho việc triển khai mô hình YOLO26 là gì?
TensorFlow Lite (TFLite) là một framework deep learning mã nguồn mở được thiết kế cho suy luận trên thiết bị, khiến nó trở nên lý tưởng để triển khai các mô hình YOLO26 trên thiết bị di động, thiết bị nhúng và thiết bị IoT. Các lợi ích chính bao gồm:
- Tối ưu hóa trên thiết bị: Giảm thiểu độ trễ và tăng cường quyền riêng tư bằng cách xử lý dữ liệu cục bộ.
- Tương thích nền tảng: Hỗ trợ Android, iOS, Linux nhúng và MCU.
- Hiệu năng: Sử dụng tăng tốc phần cứng để tối ưu hóa tốc độ và hiệu quả của mô hình.
Để tìm hiểu thêm, hãy xem hướng dẫn TFLite.
Có thể chạy các mô hình TFLite của YOLO26 trên Raspberry Pi không?
Có, bạn có thể chạy các mô hình TFLite của YOLO26 trên Raspberry Pi để cải thiện tốc độ suy luận. Trước tiên, hãy xuất mô hình của bạn sang định dạng TFLite như đã giải thích ở trên. Sau đó, sử dụng một công cụ như TensorFlow Lite Interpreter để thực thi mô hình trên Raspberry Pi của bạn.
Để tối ưu hóa thêm, bạn có thể cân nhắc sử dụng Coral Edge TPU. Để biết các bước chi tiết, hãy tham khảo hướng dẫn triển khai Raspberry Pi và hướng dẫn tích hợp Edge TPU của chúng tôi.
Tôi có thể sử dụng các mô hình TFLite trên vi điều khiển để dự đoán với YOLO26 không?
Có, TFLite hỗ trợ triển khai trên các vi điều khiển có tài nguyên hạn chế. Runtime cốt lõi của TFLite chỉ yêu cầu 16 KB bộ nhớ trên Arm Cortex M3 và có thể chạy các mô hình YOLO26 cơ bản. Điều này làm cho nó phù hợp để triển khai trên các thiết bị có sức mạnh tính toán và bộ nhớ tối thiểu.
Để bắt đầu, hãy truy cập hướng dẫn TFLite Micro cho vi điều khiển.
Những nền tảng nào tương thích với các mô hình YOLO26 đã xuất sang TFLite?
TensorFlow Lite cung cấp khả năng tương thích nền tảng rộng rãi, cho phép bạn triển khai các mô hình YOLO26 trên nhiều loại thiết bị, bao gồm:
- Android và iOS: Hỗ trợ gốc thông qua các thư viện Android và iOS của TFLite.
- Embedded Linux (Linux nhúng): Lý tưởng cho các máy tính bảng đơn (single-board computers) như Raspberry Pi.
- Vi điều khiển: Phù hợp cho các MCU với tài nguyên bị hạn chế.
Để biết thêm thông tin về các tùy chọn triển khai, hãy xem hướng dẫn triển khai chi tiết của chúng tôi.
Làm thế nào để khắc phục các sự cố thường gặp trong quá trình xuất mô hình YOLO26 sang TFLite?
Nếu bạn gặp lỗi khi xuất các mô hình YOLO26 sang TFLite, các giải pháp thường gặp bao gồm:
- Kiểm tra tính tương thích của gói: Đảm bảo bạn đang sử dụng các phiên bản tương thích của Ultralytics và TensorFlow. Tham khảo hướng dẫn cài đặt của chúng tôi.
- Hỗ trợ mô hình: Xác minh rằng mô hình YOLO26 cụ thể hỗ trợ xuất TFLite bằng cách kiểm tra trang tài liệu xuất của Ultralytics.
- Sự cố lượng tử hóa (Quantization): Khi sử dụng lượng tử hóa INT8, hãy đảm bảo đường dẫn tập dữ liệu của bạn được chỉ định chính xác trong tham số
data.
Để biết thêm các mẹo khắc phục sự cố, hãy truy cập hướng dẫn Các vấn đề thường gặp của chúng tôi.