Link to this sectionHướng dẫn Xuất Model YOLO26 sang TFLite để Triển khai#
Việc triển khai các model computer vision trên thiết bị biên hoặc thiết bị nhúng yêu cầu một định dạng có thể đảm bảo hiệu năng liền mạch.
Định dạng xuất TensorFlow Lite hay TFLite cho phép bạn tối ưu hóa các model Ultralytics YOLO26 của mình cho các tác vụ như object detection và image classification trong các ứng dụng trên thiết bị biên. Trong hướng dẫn này, chúng ta sẽ đi qua các bước chuyển đổi model sang định dạng TFLite, giúp model của bạn dễ dàng đạt hiệu suất tốt trên nhiều thiết bị biên khác nhau.
Link to this sectionTại sao Bạn nên Xuất sang TFLite?#
Được Google giới thiệu vào tháng 5 năm 2017 như một phần của framework TensorFlow, TensorFlow Lite, hay viết tắt là TFLite, là một framework deep learning mã nguồn mở được thiết kế cho suy luận trên thiết bị, còn được gọi là edge computing. Nó cung cấp cho các nhà phát triển những công cụ cần thiết để thực thi các model đã huấn luyện trên thiết bị di động, thiết bị nhúng, thiết bị IoT, cũng như máy tính truyền thống.
TensorFlow Lite tương thích với nhiều nền tảng, bao gồm Linux nhúng, Android, iOS và các vi điều khiển (MCU). Việc xuất model sang TFLite giúp ứng dụng của bạn nhanh hơn, đáng tin cậy hơn và có khả năng chạy ngoại tuyến.
Link to this sectionCác Tính năng Chính của Model TFLite#
Model TFLite cung cấp một loạt các tính năng chính cho phép machine learning trên thiết bị bằng cách hỗ trợ nhà phát triển chạy model trên thiết bị di động, thiết bị nhúng và thiết bị biên:
-
Tối ưu hóa trên thiết bị (On-device Optimization): TFLite tối ưu hóa cho ML trên thiết bị, giảm độ trễ bằng cách xử lý dữ liệu cục bộ, tăng cường quyền riêng tư bằng cách không truyền dữ liệu cá nhân, và giảm thiểu kích thước model để tiết kiệm không gian.
-
Hỗ trợ Đa nền tảng: TFLite cung cấp khả năng tương thích nền tảng sâu rộng, hỗ trợ Android, iOS, Linux nhúng và vi điều khiển.
-
Hỗ trợ Ngôn ngữ Đa dạng: TFLite tương thích với nhiều ngôn ngữ lập trình, bao gồm Java, Swift, Objective-C, C++ và Python.
-
Hiệu năng Cao: Đạt được hiệu năng vượt trội thông qua tăng tốc phần cứng và tối ưu hóa model.
Link to this sectionCác Tùy chọn Triển khai trong TFLite#
Trước khi chúng ta xem xét mã nguồn để xuất model YOLO26 sang định dạng TFLite, hãy cùng hiểu cách model TFLite thường được sử dụng.
TFLite cung cấp nhiều tùy chọn triển khai trên thiết bị cho các model machine learning, bao gồm:
- Triển khai với Android và iOS: Cả ứng dụng Android và iOS với TFLite đều có thể phân tích các luồng camera và cảm biến tại biên để phát hiện và nhận diện đối tượng. TFLite cũng cung cấp các thư viện iOS gốc được viết bằng Swift và Objective-C. Sơ đồ kiến trúc dưới đây cho thấy quy trình triển khai một model đã huấn luyện lên các nền tảng Android và iOS bằng cách sử dụng TensorFlow Lite.
-
Triển khai với Linux Nhúng: Nếu việc chạy suy luận trên Raspberry Pi sử dụng Hướng dẫn Ultralytics không đáp ứng yêu cầu tốc độ cho trường hợp sử dụng của bạn, bạn có thể sử dụng model TFLite đã xuất để tăng tốc thời gian suy luận. Ngoài ra, có thể cải thiện hiệu năng hơn nữa bằng cách sử dụng thiết bị Coral Edge TPU.
-
Triển khai với Vi điều khiển: Model TFLite cũng có thể được triển khai trên các vi điều khiển và các thiết bị khác chỉ có vài kilobyte bộ nhớ. Runtime cốt lõi chỉ vừa với 16 KB trên Arm Cortex M3 và có thể chạy nhiều model cơ bản. Nó không yêu cầu hỗ trợ hệ điều hành, bất kỳ thư viện chuẩn C hoặc C++ nào, hay cấp phát bộ nhớ động.
Link to this sectionXuất sang TFLite: Chuyển đổi Model YOLO26 của Bạn#
Bạn có thể cải thiện hiệu quả thực thi model trên thiết bị và tối ưu hóa hiệu năng bằng cách chuyển đổi model của mình sang định dạng TFLite.
Link to this sectionCài đặt#
Để cài đặt các gói cần thiết, hãy chạy:
# Install the required package for YOLO26
pip install ultralyticsĐể biết hướng dẫn chi tiết và các phương pháp tốt nhất liên quan đến quy trình cài đặt, hãy xem Hướng dẫn cài đặt Ultralytics của chúng tôi. Trong khi cài đặt các gói cần thiết cho YOLO26, nếu bạn gặp bất kỳ khó khăn nào, hãy tham khảo Hướng dẫn các vấn đề thường gặp để tìm giải pháp và mẹo.
Link to this sectionCách sử dụng#
Tất cả các mô hình Ultralytics YOLO26 đều được thiết kế để hỗ trợ xuất ngay lập tức, giúp dễ dàng tích hợp chúng vào quy trình triển khai ưa thích của bạn. Bạn có thể xem danh sách đầy đủ các định dạng xuất và tùy chọn cấu hình được hỗ trợ để chọn thiết lập tốt nhất cho ứng dụng của mình.
Định dạng TFLite hỗ trợ các chế độ Export, Predict, và Validate. Hãy xuất model của bạn, sau đó tải model đã xuất để chạy suy luận hoặc kiểm tra độ chính xác của nó.
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to TFLite format
model.export(format="tflite") # creates 'yolo26n_float32.tflite'from ultralytics import YOLO
# Load the exported TFLite model
model = YOLO("yolo26n_float32.tflite")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")from ultralytics import YOLO
# Load the exported TFLite model
model = YOLO("yolo26n_float32.tflite")
# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")Link to this sectionĐối số xuất#
| Đối số | Loại | Mặc định | Mô tả |
|---|---|---|---|
format | str | 'tflite' | Định dạng đích cho model được xuất, xác định khả năng tương thích với các môi trường triển khai khác nhau. |
imgsz | int hoặc tuple | 640 | Kích thước hình ảnh mong muốn cho đầu vào của model. Có thể là một số nguyên cho hình ảnh vuông hoặc một tuple (height, width) cho các kích thước cụ thể. |
quantize | int hoặc str | None | Độ chính xác lượng tử hóa: 16 (FP16) hoặc 8 (INT8/PTQ; yêu cầu data/fraction hiệu chỉnh); 32/không thiết lập là FP32. Thay thế cho các cờ half/int8 đã lỗi thời. |
nms | bool | False | Thêm Non-Maximum Suppression (NMS), rất cần thiết cho việc xử lý hậu kỳ phát hiện chính xác và hiệu quả. |
batch | int | 1 | Chỉ định kích thước batch inference của model khi xuất hoặc số lượng ảnh tối đa mà model đã xuất sẽ xử lý đồng thời ở chế độ predict. |
data | str | 'coco8.yaml' | Đường dẫn đến tệp cấu hình dataset (mặc định: coco8.yaml), cần thiết cho việc lượng tử hóa (quantization). |
fraction | float | 1.0 | Chỉ định phân đoạn của dataset để sử dụng cho hiệu chuẩn lượng tử hóa INT8. Cho phép hiệu chuẩn trên một tập hợp con của toàn bộ dataset, hữu ích cho các thử nghiệm hoặc khi tài nguyên hạn chế. Nếu không được chỉ định trong khi INT8 đã được bật, toàn bộ dataset sẽ được sử dụng. |
device | str | None | Chỉ định thiết bị để xuất: CPU (device=cpu), MPS cho Apple silicon (device=mps). |
Để biết thêm chi tiết về quy trình xuất, hãy truy cập trang tài liệu của Ultralytics về việc xuất.
Link to this sectionTriển khai các Model YOLO26 TFLite đã Xuất#
Sau khi xuất thành công các model Ultralytics YOLO26 sang định dạng TFLite, giờ đây bạn có thể triển khai chúng. Bước đầu tiên quan trọng và được khuyến nghị để chạy một model TFLite là sử dụng phương thức YOLO("model.tflite"), như đã nêu trong đoạn mã sử dụng trước đó. Tuy nhiên, để có hướng dẫn chuyên sâu về việc triển khai các model TFLite trong nhiều bối cảnh khác, hãy xem qua các tài nguyên sau:
-
Android: Hướng dẫn nhanh để tích hợp TensorFlow Lite vào các ứng dụng Android, cung cấp các bước dễ làm theo để thiết lập và chạy các model machine learning.
-
iOS: Kiểm tra hướng dẫn chi tiết này dành cho nhà phát triển về việc tích hợp và triển khai các model TensorFlow Lite trong các ứng dụng iOS, cung cấp hướng dẫn từng bước và các tài nguyên.
-
Các Ví dụ End-To-End: Trang này cung cấp tổng quan về các ví dụ khác nhau của TensorFlow Lite, giới thiệu các ứng dụng thực tế và các hướng dẫn được thiết kế để giúp nhà phát triển triển khai TensorFlow Lite trong các dự án machine learning của họ trên các thiết bị di động và biên.
Link to this sectionTóm tắt#
Trong hướng dẫn này, chúng tôi đã tập trung vào cách xuất sang định dạng TFLite. Bằng cách chuyển đổi các model Ultralytics YOLO26 của bạn sang định dạng model TFLite, bạn có thể cải thiện hiệu quả và tốc độ của các model YOLO26, làm cho chúng hiệu quả và phù hợp hơn cho các môi trường điện toán biên.
Để biết thêm chi tiết về cách sử dụng, hãy truy cập tài liệu chính thức của TFLite.
Ngoài ra, nếu bạn tò mò về các tích hợp khác của Ultralytics YOLO26, hãy kiểm tra trang hướng dẫn tích hợp của chúng tôi. Bạn sẽ tìm thấy rất nhiều thông tin và thông tin chi tiết hữu ích ở đó.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionLàm thế nào để tôi xuất model YOLO26 sang định dạng TFLite?#
Để xuất model YOLO26 sang định dạng TFLite, bạn có thể sử dụng thư viện Ultralytics. Đầu tiên, cài đặt gói cần thiết bằng cách sử dụng:
pip install ultralyticsSau đó, sử dụng đoạn mã sau để xuất model của bạn:
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to TFLite format
model.export(format="tflite") # creates 'yolo26n_float32.tflite'Đối với người dùng CLI, bạn có thể thực hiện việc này với:
yolo export model=yolo26n.pt format=tflite # creates 'yolo26n_float32.tflite'Để biết thêm chi tiết, hãy truy cập hướng dẫn xuất Ultralytics.
Link to this sectionNhững lợi ích của việc sử dụng TensorFlow Lite để triển khai model YOLO26 là gì?#
TensorFlow Lite (TFLite) là một framework deep learning mã nguồn mở được thiết kế cho suy luận trên thiết bị, làm cho nó trở nên lý tưởng để triển khai các model YOLO26 trên các thiết bị di động, thiết bị nhúng và thiết bị IoT. Các lợi ích chính bao gồm:
- Tối ưu hóa trên thiết bị: Giảm thiểu độ trễ và tăng cường quyền riêng tư bằng cách xử lý dữ liệu cục bộ.
- Tương thích nền tảng: Hỗ trợ Android, iOS, Linux nhúng và MCU.
- Hiệu năng: Tận dụng tăng tốc phần cứng để tối ưu hóa tốc độ và hiệu quả của model.
Để tìm hiểu thêm, hãy kiểm tra hướng dẫn TFLite.
Link to this sectionCó thể chạy các model YOLO26 TFLite trên Raspberry Pi không?#
Có, bạn có thể chạy các model YOLO26 TFLite trên Raspberry Pi để cải thiện tốc độ suy luận. Đầu tiên, hãy xuất model của bạn sang định dạng TFLite như đã giải thích ở trên. Sau đó, sử dụng một công cụ như TensorFlow Lite Interpreter để thực thi model trên Raspberry Pi của bạn.
Để tối ưu hóa thêm, bạn có thể cân nhắc sử dụng Coral Edge TPU. Để biết các bước chi tiết, hãy tham khảo hướng dẫn triển khai Raspberry Pi và hướng dẫn tích hợp Edge TPU của chúng tôi.
Link to this sectionTôi có thể sử dụng model TFLite trên vi điều khiển cho các dự đoán YOLO26 không?#
Có, TFLite hỗ trợ triển khai trên các vi điều khiển có tài nguyên hạn chế. Runtime cốt lõi của TFLite chỉ yêu cầu 16 KB bộ nhớ trên Arm Cortex M3 và có thể chạy các model YOLO26 cơ bản. Điều này làm cho nó phù hợp để triển khai trên các thiết bị có sức mạnh tính toán và bộ nhớ tối thiểu.
Để bắt đầu, hãy truy cập hướng dẫn TFLite Micro cho Vi điều khiển.
Link to this sectionNhững nền tảng nào tương thích với các model YOLO26 đã xuất sang TFLite?#
TensorFlow Lite cung cấp khả năng tương thích nền tảng sâu rộng, cho phép bạn triển khai các model YOLO26 trên nhiều thiết bị, bao gồm:
- Android và iOS: Hỗ trợ gốc thông qua các thư viện TFLite Android và iOS.
- Linux nhúng: Lý tưởng cho các máy tính bo mạch đơn như Raspberry Pi.
- Vi điều khiển: Phù hợp cho các MCU với tài nguyên bị hạn chế.
Để biết thêm thông tin về các tùy chọn triển khai, hãy xem hướng dẫn triển khai chi tiết của chúng tôi.
Link to this sectionLàm thế nào để tôi khắc phục các sự cố thường gặp trong quá trình xuất model YOLO26 sang TFLite?#
Nếu bạn gặp lỗi khi xuất các model YOLO26 sang TFLite, các giải pháp thông thường bao gồm:
- Kiểm tra tính tương thích của gói: Đảm bảo bạn đang sử dụng các phiên bản tương thích của Ultralytics và TensorFlow. Tham khảo hướng dẫn cài đặt của chúng tôi.
- Hỗ trợ model: Xác minh rằng model YOLO26 cụ thể có hỗ trợ xuất TFLite bằng cách kiểm tra trang tài liệu export của Ultralytics.
- Các vấn đề về lượng tử hóa: Khi sử dụng lượng tử hóa INT8, hãy đảm bảo đường dẫn tập dữ liệu của bạn được chỉ định chính xác trong tham số
data.
Để biết thêm các mẹo khắc phục sự cố, hãy truy cập Hướng dẫn Vấn đề Thường gặp của chúng tôi.