Ứng Dụng Ultralytics iOS: Phát Hiện Đối Tượng Theo Thời Gian Thực với Các Mô Hình YOLO
Ứng dụng Ultralytics iOS là một công cụ mạnh mẽ cho phép bạn chạy các mô hình YOLO trực tiếp trên iPhone hoặc iPad của mình để phát hiện đối tượng theo thời gian thực. Ứng dụng này sử dụng Apple Neural Engine và Core ML để tối ưu hóa và tăng tốc mô hình, cho phép phát hiện đối tượng nhanh chóng và hiệu quả.
Xem: Bắt đầu với Ứng dụng Ultralytics HUB (IOS & Android)
Lượng tử hóa và tăng tốc
Để đạt được hiệu suất thời gian thực trên thiết bị iOS của bạn, các mô hình YOLO được lượng tử hóa thành độ chính xác FP16 hoặc INT8. Lượng tử hóa là một quy trình làm giảm độ chính xác số học của trọng số và độ lệch của mô hình, do đó làm giảm kích thước của mô hình và lượng tính toán cần thiết. Điều này dẫn đến thời gian suy luận nhanh hơn mà không ảnh hưởng đáng kể đến độ chính xác của mô hình.
Lượng tử hóa FP16
Lượng tử hóa FP16 (hoặc bán chính xác) chuyển đổi các số dấu phẩy động 32-bit của mô hình thành số dấu phẩy động 16-bit. Điều này làm giảm một nửa kích thước của mô hình và tăng tốc quá trình suy luận, đồng thời duy trì sự cân bằng tốt giữa độ chính xác và hiệu suất.
Lượng tử hóa INT8
Lượng tử hóa INT8 (hoặc số nguyên 8-bit) giúp giảm thêm kích thước và yêu cầu tính toán của mô hình bằng cách chuyển đổi các số dấu phẩy động 32-bit của nó thành số nguyên 8-bit. Phương pháp lượng tử hóa này có thể mang lại khả năng tăng tốc đáng kể, nhưng nó có thể dẫn đến giảm nhẹ độ chính xác.
Apple Neural Engine
Apple Neural Engine (ANE) là một thành phần phần cứng chuyên dụng được tích hợp vào chip dòng A và dòng M của Apple. Nó được thiết kế để tăng tốc các tác vụ machine learning, đặc biệt là cho mạng neural, cho phép thực thi các mô hình YOLO của bạn nhanh hơn và hiệu quả hơn.
Bằng cách kết hợp các mô hình YOLO được lượng tử hóa với Apple Neural Engine, Ứng dụng Ultralytics iOS đạt được khả năng phát hiện đối tượng theo thời gian thực trên thiết bị iOS của bạn mà không ảnh hưởng đến độ chính xác hoặc hiệu suất.
Năm Phát Hành | Tên iPhone | Tên Chipset | Kích thước nút | ANE TOPs |
---|---|---|---|---|
2017 | iPhone X | A11 Bionic | 10 nm | 0.6 |
2018 | iPhone XS | A12 Bionic | 7 nm | 5 |
2019 | iPhone 11 | A13 Bionic | 7 nm | 6 |
2020 | iPhone 12 | A14 Bionic | 5 nm | 11 |
2021 | iPhone 13 | A15 Bionic | 5 nm | 15.8 |
2022 | iPhone 14 | A16 Bionic | 4 nm | 17.0 |
2023 | iPhone 15 | A17 Pro | 3 nm | 35.0 |
Xin lưu ý rằng danh sách này bao gồm các kiểu máy iPhone từ năm 2017 trở đi và giá trị ANE TOPs chỉ là gần đúng.
Tích hợp CoreML
Ứng dụng Ultralytics iOS tận dụng CoreML, nền tảng máy học cơ bản của Apple, để tối ưu hóa các mô hình YOLO cho các thiết bị iOS. CoreML cung cấp một số lợi thế:
- Xử lý trên thiết bị: Tất cả suy luận diễn ra cục bộ trên thiết bị của bạn, đảm bảo quyền riêng tư dữ liệu và loại bỏ nhu cầu kết nối internet.
- Tăng tốc phần cứng: Tự động sử dụng Apple Neural Engine, CPU và GPU để có hiệu suất tối ưu
- Tích hợp liền mạch: Hoạt động tự nhiên với camera iOS và các framework hệ thống
CoreML chuyển đổi các mô hình YOLO sang định dạng được tối ưu hóa cho các thiết bị của Apple, cho phép thực thi hiệu quả trong khi vẫn duy trì độ chính xác phát hiện.
Bắt đầu với Ứng dụng Ultralytics iOS
Để bắt đầu với Ứng dụng Ultralytics iOS, hãy làm theo các bước sau:
-
Tải xuống Ứng dụng Ultralytics từ App Store.
-
Khởi chạy ứng dụng trên thiết bị iOS của bạn và đăng nhập bằng tài khoản Ultralytics. Nếu bạn chưa có tài khoản, hãy tạo một tài khoản tại Ultralytics HUB.
-
Sau khi đăng nhập, bạn sẽ thấy danh sách các mô hình YOLO đã huấn luyện của mình. Chọn một mô hình để sử dụng cho phát hiện đối tượng.
-
Cấp cho ứng dụng quyền truy cập vào máy ảnh của thiết bị.
-
Hướng camera của thiết bị vào các đối tượng bạn muốn phát hiện. Ứng dụng sẽ hiển thị các hộp giới hạn và nhãn lớp theo thời gian thực khi nó phát hiện các đối tượng.
-
Khám phá cài đặt của ứng dụng để điều chỉnh ngưỡng phát hiện, bật hoặc tắt các lớp đối tượng cụ thể, v.v.
Với Ứng dụng Ultralytics iOS, giờ đây bạn có thể tận dụng sức mạnh của các mô hình YOLO để phát hiện đối tượng theo thời gian thực trên iPhone hoặc iPad của mình, được hỗ trợ bởi Apple Neural Engine và được tối ưu hóa bằng lượng tử hóa FP16 hoặc INT8.