YOLO26 모델에서 TFLite Edge TPU 형식으로 내보내는 방법 알아보기

모바일이나 임베디드 시스템과 같이 계산 능력이 제한된 장치에 컴퓨터 비전 모델을 배포하는 것은 까다로울 수 있습니다. 더 빠른 성능에 최적화된 모델 형식을 사용하면 이 과정이 간소화됩니다. TensorFlow Lite Edge TPU 또는 TFLite Edge TPU 모델 형식은 신경망에 대해 빠른 성능을 제공하면서 전력 소모를 최소화하도록 설계되었습니다.

TFLite Edge TPU 형식으로 내보내는 기능을 사용하면 Ultralytics YOLO26 모델을 고속 및 저전력 추론에 최적화할 수 있습니다. 이 가이드에서는 모델을 TFLite Edge TPU 형식으로 변환하여 다양한 모바일 및 임베디드 장치에서 더 쉽게 성능을 발휘하도록 하는 방법을 단계별로 안내합니다.

왜 TFLite Edge TPU로 내보내야 하나요?

모델을 TensorFlow Edge TPU로 내보내면 머신 러닝 작업이 빠르고 효율적으로 수행됩니다. 이 기술은 전력, 컴퓨팅 리소스, 연결성이 제한된 애플리케이션에 적합합니다. Edge TPU는 Google의 하드웨어 가속기입니다. 이 가속기는 에지 장치에서 TensorFlow Lite 모델의 속도를 높입니다. 아래 이미지는 이 과정의 예시를 보여줍니다.

TensorFlow Lite Edge TPU compilation workflow

Edge TPU는 양자화된 모델과 함께 작동합니다. 양자화는 정확도를 크게 잃지 않으면서 모델을 더 작고 빠르게 만듭니다. 이는 에지 컴퓨팅의 제한된 리소스에 이상적이며, 지연 시간을 줄이고 로컬에서 데이터를 빠르게 처리할 수 있게 하여 클라우드 의존성 없이 애플리케이션이 신속하게 응답할 수 있도록 합니다. 또한 로컬 처리는 사용자 데이터를 원격 서버로 보내지 않으므로 개인정보를 안전하게 보호합니다.

TFLite Edge TPU의 주요 기능

개발자가 TFLite Edge TPU를 훌륭한 모델 형식 선택지로 활용할 수 있는 주요 기능은 다음과 같습니다:

  • 에지 장치에서의 최적화된 성능: TFLite Edge TPU는 양자화, 모델 최적화, 하드웨어 가속 및 컴파일러 최적화를 통해 고속 신경망 성능을 달성합니다. 미니멀한 아키텍처는 더 작은 크기와 비용 효율성에 기여합니다.

  • 높은 계산 처리량: TFLite Edge TPU는 전문화된 하드웨어 가속과 효율적인 런타임 실행을 결합하여 높은 계산 처리량을 달성합니다. 이는 에지 장치에서 엄격한 성능 요구 사항이 있는 머신 러닝 모델을 배포하는 데 매우 적합합니다.

  • 효율적인 행렬 계산: TensorFlow Edge TPU는 신경망 계산에 필수적인 행렬 연산에 최적화되어 있습니다. 이러한 효율성은 머신 러닝 모델, 특히 수많은 복잡한 행렬 곱셈과 변환이 필요한 모델에서 핵심적인 역할을 합니다.

TFLite Edge TPU를 사용한 배포 옵션

YOLO26 모델을 TFLite Edge TPU 형식으로 내보내는 방법을 살펴보기 전에, 일반적으로 TFLite Edge TPU 모델이 어디에 사용되는지 알아보겠습니다.

TFLite Edge TPU는 머신 러닝 모델을 위해 다음과 같은 다양한 배포 옵션을 제공합니다:

  • 온디바이스 배포: TensorFlow Edge TPU 모델은 모바일 및 임베디드 장치에 직접 배포할 수 있습니다. 온디바이스 배포를 통해 모델을 애플리케이션 번들에 포함하거나 필요할 때 다운로드하여 하드웨어에서 직접 실행함으로써 클라우드 연결의 필요성을 제거합니다.

  • 클라우드 TensorFlow TPU를 활용한 에지 컴퓨팅: 에지 장치의 처리 능력이 제한된 시나리오에서는 TensorFlow Edge TPU가 TPU가 장착된 클라우드 서버로 추론 작업을 오프로드할 수 있습니다.

  • 하이브리드 배포: 하이브리드 접근 방식은 온디바이스 배포와 클라우드 배포를 결합하여 머신 러닝 모델 배포를 위한 다재다능하고 확장 가능한 솔루션을 제공합니다. 여기에는 빠른 응답을 위한 온디바이스 처리와 더 복잡한 계산을 위한 클라우드 컴퓨팅의 이점이 포함됩니다.

YOLO26 모델을 TFLite Edge TPU로 내보내기

YOLO26 모델을 TensorFlow Edge TPU로 변환하여 모델 호환성과 배포 유연성을 확장할 수 있습니다.

설치

필수 패키지를 설치하려면 다음을 실행하세요.

설치
# Install the required package for YOLO26
pip install ultralytics

설치 프로세스와 관련된 자세한 지침 및 모범 사례는 Ultralytics 설치 가이드를 확인하십시오. YOLO26을 위한 필수 패키지를 설치하는 동안 문제가 발생하면 일반적인 문제 해결 가이드에서 솔루션과 팁을 참조하십시오.

사용법

모든 Ultralytics YOLO26 모델은 별도의 설정 없이 바로 내보내기를 지원하도록 설계되어 있어, 선호하는 배포 워크플로우에 쉽게 통합할 수 있습니다. 지원되는 내보내기 형식 및 구성 옵션 전체 목록을 확인하여 애플리케이션에 가장 적합한 설정을 선택하십시오.

사용법
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite Edge TPU format
model.export(format="edgetpu")  # creates 'yolo26n_full_integer_quant_edgetpu.tflite'

# Load the exported TFLite Edge TPU model
edgetpu_model = YOLO("yolo26n_full_integer_quant_edgetpu.tflite")

# Run inference
results = edgetpu_model("https://ultralytics.com/images/bus.jpg")

내보내기 인수

인수(Argument)유형(Type)기본값(Default)설명
formatstr'edgetpu'내보낸 모델의 대상 형식으로, 다양한 배포 환경과의 호환성을 정의합니다.
imgszint 또는 tuple640모델 입력에 필요한 이미지 크기입니다. 정사각형 이미지의 경우 정수를, 특정 크기의 경우 (height, width) 튜플을 사용할 수 있습니다.
int8boolTrueINT8 양자화를 활성화하여 모델을 추가로 압축하고, 주로 엣지 기기에서 정확도 손실을 최소화하면서 추론 속도를 높입니다.
datastr'coco8.yaml'양자화에 필수적인 데이터셋 구성 파일(기본값: coco8.yaml)의 경로입니다.
fractionfloat1.0INT8 양자화 보정에 사용할 데이터셋의 비율을 지정합니다. 전체 데이터셋의 일부에서 보정할 수 있게 하여 실험용이나 자원이 제한적일 때 유용합니다. INT8이 활성화된 상태에서 지정하지 않으면 전체 데이터셋이 사용됩니다.
devicestrNone내보내기 위한 장치를 지정합니다: CPU (device=cpu).

EdgeTPU로 내보낼 때는 반드시 x86 Linux 머신을 사용하십시오.

내보내기 과정에 대한 자세한 내용은 Ultralytics 내보내기 설명서 페이지를 방문하세요.

내보낸 YOLO26 TFLite Edge TPU 모델 배포하기

Ultralytics YOLO26 모델을 TFLite Edge TPU 형식으로 성공적으로 내보낸 후, 이제 이를 배포할 수 있습니다. TFLite Edge TPU 모델을 실행하기 위한 기본적이고 권장되는 첫 번째 단계는 이전 사용 코드 스니펫에 설명된 대로 YOLO("model_edgetpu.tflite") 메서드를 사용하는 것입니다.

그러나 TFLite Edge TPU 모델 배포에 대한 자세한 지침은 다음 리소스를 확인하십시오:

요약

이 가이드에서는 Ultralytics YOLO26 모델을 TFLite Edge TPU 형식으로 내보내는 방법을 배웠습니다. 위에 언급된 단계를 따르면 컴퓨터 비전 애플리케이션의 속도와 성능을 높일 수 있습니다.

사용에 대한 자세한 내용은 Edge TPU 공식 웹사이트를 방문하십시오.

또한 다른 Ultralytics YOLO26 통합에 대한 자세한 내용은 통합 가이드 페이지를 방문하십시오. 그곳에서 유용한 리소스와 통찰력을 발견하실 수 있습니다.

FAQ

YOLO26 모델을 TFLite Edge TPU 형식으로 어떻게 내보내나요?

YOLO26 모델을 TFLite Edge TPU 형식으로 내보내려면 다음 단계를 따를 수 있습니다:

사용법
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite Edge TPU format
model.export(format="edgetpu")  # creates 'yolo26n_full_integer_quant_edgetpu.tflite'

# Load the exported TFLite Edge TPU model
edgetpu_model = YOLO("yolo26n_full_integer_quant_edgetpu.tflite")

# Run inference
results = edgetpu_model("https://ultralytics.com/images/bus.jpg")

모델을 다른 형식으로 내보내는 방법에 대한 자세한 내용은 내보내기 가이드를 참조하십시오.

YOLO26 모델을 TFLite Edge TPU로 내보내면 어떤 이점이 있나요?

YOLO26 모델을 TFLite Edge TPU로 내보내면 다음과 같은 여러 이점이 있습니다:

  • 최적화된 성능: 최소한의 전력 소비로 고속 신경망 성능을 달성합니다.
  • 지연 시간 감소: 클라우드 의존성 없이 로컬 데이터 처리가 빠릅니다.
  • 강화된 개인정보 보호: 로컬 처리로 사용자 데이터를 비공개로 안전하게 유지합니다.

이러한 이유로 전력 및 계산 리소스가 제한된 장치를 사용하는 에지 컴퓨팅 애플리케이션에 이상적입니다. 내보내야 하는 이유에 대해 자세히 알아보십시오.

TFLite Edge TPU 모델을 모바일 및 임베디드 장치에 배포할 수 있나요?

네, TensorFlow Lite Edge TPU 모델은 모바일 및 임베디드 장치에 직접 배포할 수 있습니다. 이러한 배포 방식을 통해 모델을 하드웨어에서 직접 실행할 수 있어 더 빠르고 효율적인 추론이 가능합니다. 통합 예제는 Raspberry Pi에 Coral Edge TPU를 배포하는 방법에 대한 가이드를 확인하십시오.

TFLite Edge TPU 모델의 일반적인 사용 사례는 무엇인가요?

TFLite Edge TPU 모델의 일반적인 사용 사례는 다음과 같습니다:

  • 스마트 카메라: 실시간 이미지 및 비디오 분석 강화.
  • IoT 장치: 스마트 홈 및 산업 자동화 지원.
  • 의료: 의료 영상 및 진단 가속화.
  • 소매: 재고 관리 및 고객 행동 분석 개선.

이러한 애플리케이션은 TFLite Edge TPU 모델의 높은 성능과 낮은 전력 소비의 이점을 누릴 수 있습니다. 사용 시나리오에 대해 더 알아보십시오.

TFLite Edge TPU 모델을 내보내거나 배포하는 동안 발생하는 문제를 어떻게 해결할 수 있나요?

TFLite Edge TPU 모델을 내보내거나 배포하는 중에 문제가 발생하면 일반 문제 가이드에서 문제 해결 팁을 참조하십시오. 이 가이드는 원활한 운영을 돕기 위한 일반적인 문제와 해결책을 다룹니다. 추가 지원이 필요하면 도움말 센터를 방문하십시오.

댓글