Link to this sectionAnálise Comparativa das Opções de Implementação do YOLO26#
Link to this sectionIntrodução#
Percorreste um longo caminho na tua jornada com o YOLO26. Coletaste dados diligentemente, anotaste-os meticulosamente e dedicaste horas a treinar e avaliar rigorosamente o teu modelo YOLO26 personalizado. Agora, é hora de colocar o teu modelo em funcionamento para a tua aplicação, caso de uso ou projeto específico. Mas existe uma decisão crítica diante de ti: como exportar e implementar o teu modelo de forma eficaz.
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
Este guia orienta-te através das opções de implementação do YOLO26 e dos fatores essenciais a considerar para escolheres a opção certa para o teu projeto.
Link to this sectionComo Selecionar a Opção de Implementação Certa para o teu Modelo YOLO26#
Quando chega a hora de implementar o teu modelo YOLO26, selecionar um formato de exportação adequado é muito importante. Conforme descrito na documentação de Modos do Ultralytics YOLO26, a função model.export() permite-te converter o teu modelo treinado numa variedade de formatos adaptados a diversos ambientes e requisitos de desempenho.
O formato ideal depende do contexto operacional pretendido para o teu modelo, equilibrando velocidade, restrições de hardware e facilidade de integração. Para uma implementação gerida sem exportação manual, a Ultralytics Platform fornece endpoints de inferência prontos a usar com escalonamento automático em 43 regiões globais. Na secção seguinte, analisaremos mais de perto cada opção de exportação, compreendendo quando escolher cada uma.
Link to this sectionOpções de Implementação do YOLO26#
Vamos percorrer as diferentes opções de implementação do YOLO26. Para um passo a passo detalhado do processo de exportação, visita a página de documentação do Ultralytics sobre exportação.
Link to this sectionPyTorch#
PyTorch é uma biblioteca de machine learning de código aberto amplamente utilizada para aplicações em deep learning e inteligência artificial. Fornece um elevado nível de flexibilidade e velocidade, o que a tornou uma favorita entre investigadores e programadores.
- Benchmarks de Desempenho: O PyTorch é conhecido pela sua facilidade de uso e flexibilidade, o que pode resultar num ligeiro compromisso no desempenho bruto quando comparado com outros frameworks mais especializados e otimizados.
- Compatibilidade e Integração: Oferece excelente compatibilidade com várias bibliotecas de ciência de dados e machine learning em Python.
- Suporte da Comunidade e Ecossistema: Uma das comunidades mais vibrantes, com recursos extensivos para aprendizagem e resolução de problemas.
- Estudos de Caso: Comumente usado em protótipos de investigação, muitos artigos académicos referenciam modelos implementados em PyTorch.
- Manutenção e Atualizações: Atualizações regulares com desenvolvimento ativo e suporte para novas funcionalidades.
- Considerações de Segurança: patches regulares para problemas de segurança, mas a segurança depende largamente do ambiente geral em que é implementado.
- Aceleração de Hardware: Suporta CUDA para aceleração de GPU, essencial para acelerar o treino e a inferência do modelo.
Link to this sectionTorchScript#
O TorchScript estende as capacidades do PyTorch ao permitir a exportação de modelos para serem executados num ambiente de runtime C++. Isto torna-o adequado para ambientes de produção onde o Python não está disponível.
- Benchmarks de Desempenho: Pode oferecer desempenho melhorado em relação ao PyTorch nativo, especialmente em ambientes de produção.
- Compatibilidade e Integração: Desenhado para uma transição perfeita do PyTorch para ambientes de produção em C++, embora algumas funcionalidades avançadas possam não ser perfeitamente traduzidas.
- Suporte da Comunidade e Ecossistema: Beneficia da grande comunidade do PyTorch, mas tem um âmbito mais restrito de programadores especializados.
- Estudos de Caso: Amplamente utilizado em cenários industriais onde a sobrecarga de desempenho do Python é um estrangulamento.
- Manutenção e Atualizações: Mantido juntamente com o PyTorch com atualizações consistentes.
- Considerações de Segurança: Oferece segurança melhorada ao permitir a execução de modelos em ambientes sem instalações completas de Python.
- Aceleração de Hardware: Herda o suporte CUDA do PyTorch, garantindo uma utilização eficiente da GPU.
Link to this sectionONNX#
O Open Neural Network Exchange (ONNX) é um formato que permite a interoperabilidade de modelos entre diferentes frameworks, o que pode ser crítico ao implementar em várias plataformas.
- Benchmarks de Desempenho: Modelos ONNX podem experienciar um desempenho variável dependendo do runtime específico em que são implementados.
- Compatibilidade e Integração: Elevada interoperabilidade entre múltiplas plataformas e hardware devido à sua natureza agnóstica em relação ao framework.
- Suporte da Comunidade e Ecossistema: Suportado por muitas organizações, levando a um ecossistema amplo e a uma variedade de ferramentas para otimização.
- Estudos de Caso: Frequentemente usado para mover modelos entre diferentes frameworks de machine learning, demonstrando a sua flexibilidade.
- Manutenção e Atualizações: Como um padrão aberto, o ONNX é regularmente atualizado para suportar novas operações e modelos.
- Considerações de Segurança: Como acontece com qualquer ferramenta multiplataforma, é essencial garantir práticas seguras no pipeline de conversão e implementação.
- Aceleração de Hardware: Com o ONNX Runtime, os modelos podem tirar partido de várias otimizações de hardware.
Link to this sectionOpenVINO#
OpenVINO é um toolkit da Intel desenhado para facilitar a implementação de modelos de deep learning em hardware Intel, melhorando o desempenho e a velocidade.
- Benchmarks de Desempenho: Especificamente otimizado para CPUs, GPUs e VPUs da Intel, oferecendo ganhos significativos de desempenho em hardware compatível.
- Compatibilidade e Integração: Funciona melhor dentro do ecossistema Intel, mas também suporta uma gama de outras plataformas.
- Suporte da Comunidade e Ecossistema: Apoiado pela Intel, com uma base sólida de utilizadores, especialmente no domínio da visão computacional.
- Estudos de Caso: Frequentemente utilizado em cenários de IoT e edge computing onde o hardware Intel é prevalente.
- Manutenção e Atualizações: A Intel atualiza regularmente o OpenVINO para suportar os modelos de deep learning e hardware Intel mais recentes.
- Considerações de Segurança: Fornece funcionalidades de segurança robustas adequadas para implementação em aplicações sensíveis.
- Aceleração de Hardware: Adaptado para aceleração em hardware Intel, tirando partido de conjuntos de instruções dedicados e funcionalidades de hardware.
Para mais detalhes sobre a implementação usando OpenVINO, consulta a documentação de Integração do Ultralytics: Exportação Intel OpenVINO.
Link to this sectionTensorRT#
TensorRT é um otimizador e runtime de inferência de deep learning de alto desempenho da NVIDIA, ideal para aplicações que necessitam de velocidade e eficiência.
- Benchmarks de Desempenho: Entrega um desempenho de topo em GPUs NVIDIA com suporte para inferência de alta velocidade.
- Compatibilidade e Integração: Mais adequado para hardware NVIDIA, com suporte limitado fora deste ambiente.
- Suporte da Comunidade e Ecossistema: Rede de suporte forte através dos fóruns de programadores e documentação da NVIDIA.
- Estudos de Caso: Amplamente adotado em indústrias que requerem inferência em tempo real em dados de vídeo e imagem.
- Manutenção e Atualizações: A NVIDIA mantém o TensorRT com atualizações frequentes para melhorar o desempenho e suportar novas arquiteturas de GPU.
- Considerações de Segurança: Tal como muitos produtos NVIDIA, tem uma forte ênfase na segurança, mas os detalhes dependem do ambiente de implementação.
- Aceleração de Hardware: Desenhado exclusivamente para GPUs NVIDIA, fornecendo otimização e aceleração profundas.
Para mais informações sobre a implementação do TensorRT, consulta o guia de integração do TensorRT.
Link to this sectionCoreML#
CoreML é o framework de machine learning da Apple, otimizado para desempenho on-device no ecossistema Apple, incluindo iOS, macOS, watchOS e tvOS.
- Benchmarks de Desempenho: Otimizado para desempenho on-device em hardware Apple com consumo mínimo de bateria.
- Compatibilidade e Integração: Exclusivamente para o ecossistema da Apple, fornecendo um fluxo de trabalho simplificado para aplicações iOS e macOS.
- Suporte da Comunidade e Ecossistema: Suporte forte da Apple e de uma comunidade dedicada de programadores, com documentação e ferramentas extensivas.
- Estudos de Caso: Comumente usado em aplicações que requerem capacidades de machine learning on-device em produtos Apple.
- Manutenção e Atualizações: Regularmente atualizado pela Apple para suportar os últimos avanços em machine learning e hardware Apple.
- Considerações de Segurança: Beneficia do foco da Apple na privacidade do utilizador e segurança de dados.
- Aceleração de Hardware: Tira total partido do motor neural e da GPU da Apple para tarefas aceleradas de machine learning.
Link to this sectionTF SavedModel#
TF SavedModel é o formato do TensorFlow para guardar e servir modelos de machine learning, particularmente adequado para ambientes de servidor escaláveis.
- Benchmarks de Desempenho: Oferece desempenho escalável em ambientes de servidor, especialmente quando usado com TensorFlow Serving.
- Compatibilidade e Integração: Ampla compatibilidade em todo o ecossistema do TensorFlow, incluindo implementações em nuvem e servidores empresariais.
- Suporte da Comunidade e Ecossistema: Grande suporte da comunidade devido à popularidade do TensorFlow, com uma vasta gama de ferramentas para implementação e otimização.
- Estudos de Caso: Extensivamente usado em ambientes de produção para servir modelos de deep learning em escala.
- Manutenção e Atualizações: Suportado pela Google e pela comunidade TensorFlow, garantindo atualizações regulares e novas funcionalidades.
- Considerações de Segurança: A implementação usando TensorFlow Serving inclui funcionalidades de segurança robustas para aplicações de nível empresarial.
- Aceleração de Hardware: Suporta várias acelerações de hardware através dos backends do TensorFlow.
Link to this sectionTF GraphDef#
TF GraphDef é um formato do TensorFlow que representa o modelo como um grafo, o que é benéfico para ambientes onde é necessário um grafo de computação estático.
- Benchmarks de Desempenho: Fornece desempenho estável para grafos de computação estáticos, com foco na consistência e fiabilidade.
- Compatibilidade e Integração: Integra-se facilmente na infraestrutura do TensorFlow, mas é menos flexível comparado com o SavedModel.
- Suporte da Comunidade e Ecossistema: Bom suporte do ecossistema do TensorFlow, com muitos recursos disponíveis para otimizar grafos estáticos.
- Estudos de Caso: Útil em cenários onde um grafo estático é necessário, como em certos sistemas embebidos.
- Manutenção e Atualizações: Atualizações regulares juntamente com as atualizações centrais do TensorFlow.
- Considerações de Segurança: Garante uma implementação segura com as práticas de segurança estabelecidas do TensorFlow.
- Aceleração de Hardware: Pode utilizar as opções de aceleração de hardware do TensorFlow, embora não seja tão flexível como o SavedModel.
Aprende mais sobre TF GraphDef no nosso guia de integração TF GraphDef.
Link to this sectionTF Lite#
TF Lite é a solução do TensorFlow para machine learning em dispositivos móveis e embebidos, fornecendo uma biblioteca leve para inferência on-device.
- Benchmarks de Desempenho: Desenhado para velocidade e eficiência em dispositivos móveis e embebidos.
- Compatibilidade e Integração: Pode ser usado numa vasta gama de dispositivos devido à sua natureza leve.
- Suporte da Comunidade e Ecossistema: Apoiado pela Google, tem uma comunidade robusta e um número crescente de recursos para programadores.
- Estudos de Caso: Popular em aplicações móveis que requerem inferência on-device com pegada mínima.
- Manutenção e Atualizações: Regularmente atualizado para incluir as últimas funcionalidades e otimizações para dispositivos móveis.
- Considerações de Segurança: Fornece um ambiente seguro para executar modelos em dispositivos de utilizador final.
- Aceleração de Hardware: Suporta uma variedade de opções de aceleração de hardware, incluindo GPU e DSP.
Link to this sectionTF Edge TPU#
TF Edge TPU é desenhado para computação eficiente e de alta velocidade no hardware Edge TPU da Google, perfeito para dispositivos IoT que requerem processamento em tempo real.
- Benchmarks de Desempenho: Especificamente otimizado para computação eficiente e de alta velocidade no hardware Edge TPU da Google.
- Compatibilidade e Integração: Funciona exclusivamente com modelos TensorFlow Lite em dispositivos Edge TPU.
- Suporte da Comunidade e Ecossistema: Apoio crescente com recursos fornecidos pela Google e por programadores terceiros.
- Estudos de Caso: Usado em dispositivos IoT e aplicações que requerem processamento em tempo real com baixa latência.
- Manutenção e Atualizações: Continuamente melhorado para tirar partido das capacidades dos novos lançamentos de hardware Edge TPU.
- Considerações de Segurança: Integra-se com a segurança robusta da Google para dispositivos IoT e edge.
- Aceleração de Hardware: Feito à medida para tirar total partido dos dispositivos Google Coral.
Link to this sectionHailo HEF#
Hailo HEF é um formato executável compilado para aceleradores de IA da Hailo, incluindo dispositivos Hailo-8, Hailo-8L e Hailo-15. Os modelos de deteção Ultralytics YOLO são exportados primeiro para ONNX e, depois, compilados para HEF com o Hailo Dataflow Compiler externo. HEF não é um alvo de exportação direto do Ultralytics; para fluxos de trabalho de aceleração edge suportados, compara primeiro Axelera AI e DeepX.
- Benchmarks de Desempenho: Depende do hardware Hailo, da versão do Hailo SDK, do script do modelo, da configuração NMS e dos dados de calibração.
- Compatibilidade e Integração: Apenas para sistemas embebidos, gateways industriais e implementações do Raspberry Pi AI Kit alimentados por Hailo.
- Suporte da Comunidade e Ecossistema: Com suporte através do Hailo Developer Zone, HailoRT, TAPPAS e o Hailo Model Zoo.
- Estudos de Caso: Útil para detecção de objetos em tempo real em câmeras, robótica, controle de acesso, cidades inteligentes e dispositivos de inspeção industrial.
- Manutenção e Atualizações: Depende do Hailo SDK, firmware e atualizações do model-zoo para novos alvos de aceleradores.
- Considerações de Segurança: Suporta inferência local no próprio dispositivo, onde os dados permanecem na borda (edge).
- Aceleração de Hardware: Utiliza a execução da NPU da Hailo através de artefatos HEF compilados.
Para um fluxo de trabalho passo a passo, veja o guia de integração do Hailo.
Link to this sectionTF.js#
TensorFlow.js (TF.js) é uma biblioteca que traz recursos de aprendizado de máquina diretamente para o navegador, oferecendo um novo campo de possibilidades tanto para desenvolvedores web quanto para usuários. Ela permite a integração de modelos de aprendizado de máquina em aplicações web sem a necessidade de infraestrutura de back-end.
- Benchmarks de Desempenho: Habilita aprendizado de máquina diretamente no navegador com desempenho razoável, dependendo do dispositivo do cliente.
- Compatibilidade e Integração: Alta compatibilidade com tecnologias web, permitindo uma fácil integração em aplicações web.
- Suporte da Comunidade e Ecossistema: Suporte de uma comunidade de desenvolvedores web e Node.js, com uma variedade de ferramentas para implantar modelos de ML em navegadores.
- Estudos de Caso: Ideal para aplicações web interativas que se beneficiam do aprendizado de máquina no lado do cliente sem a necessidade de processamento no lado do servidor.
- Manutenção e Atualizações: Mantido pela equipe do TensorFlow com contribuições da comunidade de código aberto.
- Considerações de Segurança: Executa dentro do contexto seguro do navegador, utilizando o modelo de segurança da plataforma web.
- Aceleração de Hardware: O desempenho pode ser melhorado com APIs baseadas na web que acessam aceleração de hardware como WebGL.
Link to this sectionPaddlePaddle#
PaddlePaddle é uma estrutura de deep learning de código aberto desenvolvida pelo Baidu. Ela foi projetada para ser eficiente para pesquisadores e fácil de usar para desenvolvedores. É particularmente popular na China e oferece suporte especializado para processamento do idioma chinês.
- Benchmarks de Desempenho: Oferece desempenho competitivo com foco na facilidade de uso e escalabilidade.
- Compatibilidade e Integração: Bem integrado ao ecossistema do Baidu e suporta uma ampla gama de aplicações.
- Suporte da Comunidade e Ecossistema: Embora a comunidade seja menor globalmente, ela está crescendo rapidamente, especialmente na China.
- Estudos de Caso: Comumente usado em mercados chineses e por desenvolvedores que buscam alternativas a outras grandes estruturas.
- Manutenção e Atualizações: Atualizado regularmente com foco em atender aplicações e serviços de IA no idioma chinês.
- Considerações de Segurança: Enfatiza privacidade de dados e segurança, atendendo aos padrões de governança de dados chineses.
- Aceleração de Hardware: Suporta várias acelerações de hardware, incluindo os próprios chips Kunlun do Baidu.
Link to this sectionMNN#
MNN é uma estrutura de deep learning altamente eficiente e leve. Ela suporta inferência e treinamento de modelos de deep learning e possui desempenho líder na indústria para inferência e treinamento no próprio dispositivo. Além disso, o MNN também é usado em dispositivos embarcados, como IoT.
- Benchmarks de Desempenho: Alto desempenho para dispositivos móveis com excelente otimização para sistemas ARM.
- Compatibilidade e Integração: Funciona bem com sistemas móveis e embarcados ARM e arquiteturas de CPU X86-64.
- Suporte da Comunidade e Ecossistema: Suportado pela comunidade de aprendizado de máquina móvel e embarcada.
- Estudos de Caso: Ideal para aplicações que exigem desempenho eficiente em sistemas móveis.
- Manutenção e Atualizações: Mantido regularmente para garantir alto desempenho em dispositivos móveis.
- Considerações de Segurança: Fornece vantagens de segurança no próprio dispositivo ao manter os dados locais.
- Aceleração de Hardware: Otimizado para CPUs e GPUs ARM para máxima eficiência.
Link to this sectionNCNN#
NCNN é uma estrutura de inferência de rede neural de alto desempenho otimizada para a plataforma móvel. Destaca-se por sua natureza leve e eficiência, tornando-a particularmente bem adequada para dispositivos móveis e embarcados onde os recursos são limitados.
- Benchmarks de Desempenho: Altamente otimizado para plataformas móveis, oferecendo inferência eficiente em dispositivos baseados em ARM.
- Compatibilidade e Integração: Adequado para aplicações em telefones celulares e sistemas embarcados com arquitetura ARM.
- Suporte da Comunidade e Ecossistema: Suportado por uma comunidade pequena, porém ativa, focada em aplicações de ML móveis e embarcadas.
- Estudos de Caso: Preferido para aplicações móveis onde a eficiência e a velocidade são críticas no Android e outros sistemas baseados em ARM.
- Manutenção e Atualizações: Continuamente aprimorado para manter alto desempenho em uma variedade de dispositivos ARM.
- Considerações de Segurança: Foca na execução local no dispositivo, aproveitando a segurança inerente do processamento no dispositivo.
- Aceleração de Hardware: Adaptado para CPUs e GPUs ARM, com otimizações específicas para essas arquiteturas.
Link to this sectionAnálise Comparativa das Opções de Implementação do YOLO26#
A tabela a seguir fornece um panorama das várias opções de implantação disponíveis para modelos YOLO26, ajudando você a avaliar qual pode atender melhor às necessidades do seu projeto com base em vários critérios críticos. Para uma visão detalhada do formato de cada opção de implantação, consulte a página de documentação da Ultralytics sobre formatos de exportação.
| Opção de Implantação | Benchmarks de Desempenho | Compatibilidade e Integração | Suporte da Comunidade e Ecossistema | Estudos de Caso | Manutenção e Atualizações | Considerações de Segurança | Aceleração de Hardware |
|---|---|---|---|---|---|---|---|
| PyTorch | Boa flexibilidade; pode sacrificar o desempenho bruto | Excelente com bibliotecas Python | Recursos extensos e comunidade | Pesquisa e protótipos | Desenvolvimento regular e ativo | Dependente do ambiente de implantação | Suporte CUDA para aceleração de GPU |
| TorchScript | Melhor para produção do que o PyTorch | Transição suave do PyTorch para C++ | Especializado, mas mais restrito que o PyTorch | Indústria onde o Python é um gargalo | Atualizações consistentes com PyTorch | Segurança aprimorada sem o Python completo | Herda suporte CUDA do PyTorch |
| ONNX | Variável dependendo do runtime | Alta em diferentes estruturas | Ecossistema amplo, suportado por muitas organizações | Flexibilidade entre estruturas de ML | Atualizações regulares para novas operações | Garanta práticas seguras de conversão e implantação | Várias otimizações de hardware |
| OpenVINO | Otimizado para hardware Intel | Melhor dentro do ecossistema Intel | Sólido no domínio de visão computacional | IoT e borda com hardware Intel | Atualizações regulares para hardware Intel | Recursos robustos para aplicações sensíveis | Adaptado para hardware Intel |
| TensorRT | Nível superior em GPUs NVIDIA | Melhor para hardware NVIDIA | Rede forte através da NVIDIA | Inferência de vídeo e imagem em tempo real | Atualizações frequentes para novas GPUs | Ênfase na segurança | Projetado para GPUs NVIDIA |
| CoreML | Otimizado para hardware Apple no dispositivo | Exclusivo para o ecossistema Apple | Forte suporte da Apple e da comunidade de desenvolvedores | ML no dispositivo em produtos Apple | Atualizações regulares da Apple | Foco em privacidade e segurança | Apple neural engine e GPU |
| TF SavedModel | Escalável em ambientes de servidor | Ampla compatibilidade no ecossistema TensorFlow | Grande suporte devido à popularidade do TensorFlow | Servindo modelos em escala | Atualizações regulares pelo Google e pela comunidade | Recursos robustos para empresas | Várias acelerações de hardware |
| TF GraphDef | Estável para grafos de computação estáticos | Integra-se bem com a infraestrutura TensorFlow | Recursos para otimização de grafos estáticos | Cenários que requerem grafos estáticos | Atualizações junto com o núcleo do TensorFlow | Práticas de segurança estabelecidas do TensorFlow | Opções de aceleração do TensorFlow |
| TF Lite | Velocidade e eficiência em dispositivos móveis/embarcados | Ampla gama de suporte a dispositivos | Comunidade robusta, com o respaldo do Google | Aplicações móveis com footprint mínimo | Recursos mais recentes para dispositivos móveis | Ambiente seguro em dispositivos do usuário final | GPU e DSP, entre outros |
| TF Edge TPU | Otimizado para o hardware Edge TPU do Google | Exclusivo para dispositivos Edge TPU | Crescendo com recursos do Google e de terceiros | Dispositivos IoT que requerem processamento em tempo real | Melhorias para o novo hardware Edge TPU | Segurança de IoT robusta do Google | Projetado sob medida para o Google Coral |
| Hailo HEF | Específico de hardware e compilado externamente | Dispositivos Hailo e Raspberry Pi AI Kit | Hailo Developer Zone e Model Zoo | Implantações Hailo existentes | Atualizações de firmware e do Hailo SDK | Inferência no dispositivo mantém os dados locais | Hailo NPU via artefatos HEF |
| TF.js | Desempenho razoável no navegador | Alto com tecnologias web | Suporte para desenvolvedores Web e Node.js | Aplicações web interativas | Contribuições da equipe e da comunidade do TensorFlow | Modelo de segurança da plataforma web | Aprimorado com WebGL e outras APIs |
| PaddlePaddle | Competitivo, fácil de usar e escalável | Ecossistema Baidu, amplo suporte a aplicações | Crescimento rápido, especialmente na China | Mercado chinês e processamento de linguagem | Foco em aplicações de IA chinesas | Enfatiza a privacidade e segurança de dados | Incluindo chips Kunlun da Baidu |
| MNN | Alto desempenho para dispositivos móveis. | Sistemas ARM móveis e embarcados e CPU X86-64 | Comunidade de ML móvel/embarcada | Eficiência de sistemas móveis | Manutenção de alto desempenho em dispositivos móveis | Vantagens de segurança no dispositivo | Otimizações de CPUs e GPUs ARM |
| NCNN | Otimizado para dispositivos móveis baseados em ARM | Sistemas ARM móveis e embarcados | Comunidade de ML móvel/embarcada de nicho, porém ativa | Eficiência de sistemas Android e ARM | Manutenção de alto desempenho em ARM | Vantagens de segurança no dispositivo | Otimizações de CPUs e GPUs ARM |
Esta análise comparativa te dá uma visão geral de alto nível. Para a implantação, é essencial considerar os requisitos e restrições específicos do seu projeto e consultar a documentação detalhada e os recursos disponíveis para cada opção.
Link to this sectionComunidade e Suporte#
Ao começar com o YOLO26, ter uma comunidade prestativa e suporte pode fazer uma diferença significativa. Veja como se conectar com outros que compartilham seus interesses e obter a assistência que você precisa.
Link to this sectionEnvolva-se com a Comunidade mais ampla#
- GitHub Discussions: O repositório YOLO26 no GitHub possui uma seção de "Discussões" onde você pode fazer perguntas, relatar problemas e sugerir melhorias.
- Servidor Discord da Ultralytics: A Ultralytics tem um servidor Discord onde você pode interagir com outros usuários e desenvolvedores.
Link to this sectionDocumentação Oficial e Recursos#
- Documentação do Ultralytics YOLO26: A documentação oficial fornece uma visão geral abrangente do YOLO26, junto com guias sobre instalação, uso e solução de problemas.
Esses recursos ajudarão você a enfrentar desafios e se manter atualizado sobre as últimas tendências e melhores práticas na comunidade YOLO26.
Link to this sectionConclusão#
Neste guia, exploramos as diferentes opções de implantação para o YOLO26. Também discutimos os fatores importantes a serem considerados ao fazer sua escolha. Essas opções permitem que você personalize seu modelo para vários ambientes e requisitos de desempenho, tornando-o adequado para aplicações do mundo real.
Não se esqueça de que a comunidade Ultralytics do YOLO26 é uma fonte valiosa de ajuda. Conecte-se com outros desenvolvedores e especialistas para aprender dicas e soluções exclusivas que você talvez não encontre na documentação comum. Continue buscando conhecimento, explorando novas ideias e compartilhando suas experiências.
Link to this sectionFAQ#
Link to this sectionQuais são as opções de implantação disponíveis para o YOLO26 em diferentes plataformas de hardware?#
O Ultralytics YOLO26 suporta vários formatos de implantação, cada um projetado para ambientes e plataformas de hardware específicos. Os principais formatos incluem:
- PyTorch para pesquisa e prototipagem, com excelente integração com Python.
- TorchScript para ambientes de produção onde o Python não está disponível.
- ONNX para compatibilidade entre plataformas e aceleração de hardware.
- OpenVINO para desempenho otimizado em hardware Intel.
- TensorRT para inferência de alta velocidade em GPUs NVIDIA.
Cada formato tem vantagens únicas. Para um passo a passo detalhado, consulte nossa documentação do processo de exportação.
Link to this sectionComo posso melhorar a velocidade de inferência do meu modelo YOLO26 em uma CPU Intel?#
Para melhorar a velocidade de inferência em CPUs Intel, você pode implantar seu modelo YOLO26 usando o kit de ferramentas OpenVINO da Intel. O OpenVINO oferece aumentos significativos de desempenho ao otimizar modelos para aproveitar o hardware Intel de forma eficiente.
- Converta seu modelo YOLO26 para o formato OpenVINO usando a função
model.export(). - Siga o guia de configuração detalhado na documentação de exportação do Intel OpenVINO.
Para mais insights, confira nossa postagem no blog.
Link to this sectionPosso implantar modelos YOLO26 em dispositivos móveis?#
Sim, modelos YOLO26 podem ser implantados em dispositivos móveis usando TensorFlow Lite (TF Lite) para plataformas Android e iOS. O TF Lite é projetado para dispositivos móveis e embarcados, fornecendo inferência eficiente no dispositivo.
# Export command for TFLite format
model.export(format="tflite")Para mais detalhes sobre a implantação de modelos em dispositivos móveis, consulte nosso guia de integração TF Lite.
Link to this sectionQuais fatores devo considerar ao escolher um formato de implantação para meu modelo YOLO26?#
Ao escolher um formato de implantação para o YOLO26, considere os seguintes fatores:
- Desempenho: Alguns formatos como o TensorRT oferecem velocidades excepcionais em GPUs NVIDIA, enquanto o OpenVINO é otimizado para hardware Intel.
- Compatibilidade: O ONNX oferece ampla compatibilidade entre diferentes plataformas.
- Facilidade de Integração: Formatos como CoreML ou TF Lite são adaptados para ecossistemas específicos como iOS e Android, respectivamente.
- Suporte da Comunidade: Formatos como PyTorch e TensorFlow possuem recursos e suporte extensivos da comunidade.
Para uma análise comparativa, consulte nossa documentação de formatos de exportação.
Link to this sectionComo posso implantar modelos YOLO26 em uma aplicação web?#
Para implantar modelos YOLO26 em uma aplicação web, você pode usar o TensorFlow.js (TF.js), que permite executar modelos de machine learning diretamente no navegador. Essa abordagem elimina a necessidade de infraestrutura de backend e fornece desempenho em tempo real.
- Exporte o modelo YOLO26 para o formato TF.js.
- Integre o modelo exportado à sua aplicação web.
Para instruções passo a passo, consulte nosso guia sobre integração TensorFlow.js.