Perguntas Frequentes (FAQ) sobre Ultralytics YOLO

Esta seção de FAQ aborda perguntas e problemas comuns que os usuários podem encontrar ao trabalhar com repositórios Ultralytics YOLO.

FAQ

O que é a Ultralytics e o que ela oferece?

A Ultralytics é uma empresa de IA em visão computacional especializada em modelos de detecção de objetos e segmentação de imagem de última geração, com foco na família YOLO (You Only Look Once). Suas ofertas incluem:

Como instalo o pacote Ultralytics?

Instalar o pacote Ultralytics é simples usando o pip:

pip install ultralytics

Para a versão de desenvolvimento mais recente, instale diretamente a partir do repositório GitHub:

pip install git+https://github.com/ultralytics/ultralytics.git

Instruções detalhadas de instalação podem ser encontradas no guia de início rápido.

Quais são os requisitos de sistema para executar modelos Ultralytics?

Requisitos mínimos:

  • Python 3.8+
  • PyTorch 1.8+
  • GPU compatível com CUDA (para aceleração por GPU)

Configuração recomendada:

  • Python 3.8+
  • PyTorch 1.10+
  • GPU NVIDIA com CUDA 11.2+
  • 8 GB+ de RAM
  • 50 GB+ de espaço livre em disco (para armazenamento de conjuntos de dados e treinamento de modelos)

Para solução de problemas comuns, visite a página de Problemas Comuns do YOLO.

Como posso treinar um modelo YOLO personalizado no meu próprio conjunto de dados?

Para treinar um modelo YOLO personalizado:

  1. Prepare seu conjunto de dados no formato YOLO (imagens e arquivos txt de rótulos correspondentes).

  2. Crie um arquivo YAML descrevendo a estrutura e as classes do seu conjunto de dados (veja o exemplo de YAML de conjunto de dados).

  3. Use o seguinte código Python para iniciar o treinamento:

    from ultralytics import YOLO
    
    # Load a model
    model = YOLO("yolo26n.yaml")  # build a new model from scratch
    model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)
    
    # Train the model
    results = model.train(data="path/to/your/data.yaml", epochs=100, imgsz=640)

Para um guia mais aprofundado, incluindo preparação de dados e opções avançadas de treinamento, consulte o guia de treinamento abrangente.

Quais modelos pré-treinados estão disponíveis na Ultralytics?

A Ultralytics oferece uma gama diversificada de modelos pré-treinados para várias tarefas:

  • Detecção de Objetos: YOLO26n, YOLO26s, YOLO26m, YOLO26l, YOLO26x
  • Segmentação de Instância: YOLO26n-seg, YOLO26s-seg, YOLO26m-seg, YOLO26l-seg, YOLO26x-seg
  • Segmentação Semântica: YOLO26n-sem, YOLO26s-sem, YOLO26m-sem, YOLO26l-sem, YOLO26x-sem
  • Classificação: YOLO26n-cls, YOLO26s-cls, YOLO26m-cls, YOLO26l-cls, YOLO26x-cls
  • Estimativa de Pose: YOLO26n-pose, YOLO26s-pose, YOLO26m-pose, YOLO26l-pose, YOLO26x-pose
  • Detecção Orientada (OBB): YOLO26n-obb, YOLO26s-obb, YOLO26m-obb, YOLO26l-obb, YOLO26x-obb

Esses modelos variam em tamanho e complexidade, oferecendo diferentes equilíbrios entre velocidade e precisão. Explore a gama completa de modelos pré-treinados para encontrar o melhor para o seu projeto.

Como realizo inferência usando um modelo Ultralytics treinado?

Para realizar inferência com um modelo treinado:

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/your/model.pt")

# Perform inference
results = model("path/to/image.jpg")

# Process results
for r in results:
    print(r.boxes)  # print bbox predictions
    print(r.masks)  # print mask predictions
    print(r.probs)  # print class probabilities

Para opções avançadas de inferência, incluindo processamento em lote e inferência de vídeo, confira o guia de predição detalhado.

Os modelos Ultralytics podem ser implantados em dispositivos de borda (edge) ou ambientes de produção?

Com certeza! Os modelos Ultralytics são projetados para implantação versátil em várias plataformas:

  • Dispositivos de borda: Otimize a inferência em dispositivos como NVIDIA Jetson ou Intel Neural Compute Stick usando TensorRT, ONNX ou OpenVINO.
  • Dispositivos móveis: Implante em dispositivos Android ou iOS convertendo modelos para TFLite ou Core ML.
  • Nuvem: Aproveite frameworks como TensorFlow Serving ou PyTorch Serve para implantações em nuvem escaláveis.
  • Web: Implemente inferência no navegador usando ONNX.js ou TensorFlow.js.

A Ultralytics fornece funções de exportação para converter modelos em vários formatos para implantação. Explore a ampla gama de opções de implantação para encontrar a melhor solução para o seu caso de uso.

Qual é a diferença entre o YOLO11 e o YOLO26?

As principais distinções incluem:

  • Inferência End-to-End Sem NMS: O YOLO26 é nativamente end-to-end, produzindo predições diretamente sem non-maximum suppression (NMS), reduzindo a latência e simplificando a implantação.
  • Remoção do DFL: O YOLO26 remove o módulo Distribution Focal Loss, simplificando a exportação e melhorando a compatibilidade com dispositivos de borda e de baixo consumo de energia.
  • Otimizador MuSGD: Um híbrido de SGD e Muon (inspirado no Kimi K2 da Moonshot AI) para um treinamento mais estável e convergência mais rápida.
  • Desempenho em CPU: O YOLO26 oferece inferência em CPU até 43% mais rápida, tornando-o ideal para dispositivos sem GPUs.
  • Otimizações Específicas de Tarefa: Segmentação aprimorada com perda semântica e protos multiescala, RLE para estimativa de pose de precisão e decodificação OBB aprimorada com perda angular.
  • Tarefas: Ambos os modelos suportam detecção de objetos, segmentação de instância, classificação, estimativa de pose e detecção de objetos orientados (OBB) em um framework unificado. O YOLO26 também adiciona segmentação semântica para predição densa em nível de pixel.

Para uma comparação aprofundada de recursos e métricas de desempenho, visite a página de documentação do YOLO26.

Como posso contribuir para o projeto open-source da Ultralytics?

Contribuir para a Ultralytics é uma ótima maneira de melhorar o projeto e expandir suas habilidades. Veja como você pode participar:

  1. Faça um fork do repositório da Ultralytics no GitHub.
  2. Crie uma nova branch para sua funcionalidade ou correção de erro.
  3. Faça suas alterações e garanta que todos os testes passem.
  4. Envie um pull request com uma descrição clara de suas alterações.
  5. Participe do processo de revisão de código.

Você também pode contribuir relatando erros, sugerindo funcionalidades ou melhorando a documentação. Para diretrizes detalhadas e melhores práticas, consulte o guia de contribuição.

Como instalo o pacote Ultralytics em Python?

Instalar o pacote Ultralytics em Python é simples. Use o pip executando o seguinte comando no seu terminal ou prompt de comando:

pip install ultralytics

Para a versão de desenvolvimento de ponta, instale diretamente a partir do repositório GitHub:

pip install git+https://github.com/ultralytics/ultralytics.git

Para instruções de instalação específicas para ambientes e dicas de solução de problemas, consulte o guia de início rápido abrangente.

Quais são os principais recursos do Ultralytics YOLO?

O Ultralytics YOLO possui um rico conjunto de recursos para tarefas avançadas de visão computacional:

  • Detecção em Tempo Real: Detecte e classifique objetos com eficiência em cenários de tempo real.
  • Capacidades Multitarefa: Realize detecção de objetos, segmentação de instância, segmentação semântica, classificação, estimativa de pose e detecção de objetos orientados (OBB) com um framework unificado.
  • Modelos Pré-treinados: Acesse uma variedade de modelos pré-treinados que equilibram velocidade e precisão para diferentes casos de uso.
  • Treinamento Personalizado: Ajuste facilmente modelos em conjuntos de dados personalizados com o pipeline de treinamento flexível.
  • Amplas Opções de Implantação: Exporte modelos para vários formatos como TensorRT, ONNX e CoreML para implantação em diferentes plataformas.
  • Documentação Extensa: Beneficie-se de uma documentação abrangente e de uma comunidade prestativa para seus fluxos de trabalho de visão computacional.

Como posso melhorar o desempenho do meu modelo YOLO?

O aprimoramento do desempenho do seu modelo YOLO pode ser alcançado através de várias técnicas:

  1. Ajuste de Hiperparâmetros: Experimente diferentes hiperparâmetros usando o Guia de Ajuste de Hiperparâmetros para otimizar o desempenho do modelo.
  2. Aumento de Dados: Implemente técnicas como inverter, redimensionar, girar e ajustes de cor para melhorar seu conjunto de dados de treinamento e aprimorar a generalização do modelo.
  3. Aprendizado por Transferência: Aproveite modelos pré-treinados e ajuste-os ao seu conjunto de dados específico usando o Guia de Treinamento.
  4. Exportar para Formatos Eficientes: Converta seu modelo para formatos otimizados como TensorRT ou ONNX para uma inferência mais rápida usando o Guia de Exportação.
  5. Benchmarking: Utilize o Modo Benchmark para medir e melhorar a velocidade e a precisão da inferência de forma sistemática.

Posso implantar modelos Ultralytics YOLO em dispositivos móveis e de borda?

Sim, os modelos Ultralytics YOLO são projetados para implantação versátil, incluindo dispositivos móveis e de borda:

  • Móvel: Converta modelos para TFLite ou CoreML para integração perfeita em aplicativos Android ou iOS. Consulte o Guia de Integração TFLite e o Guia de Integração CoreML para instruções específicas da plataforma.
  • Dispositivos de Borda: Otimize a inferência em dispositivos como NVIDIA Jetson ou outro hardware de borda usando TensorRT ou ONNX. O Guia de Integração Edge TPU fornece etapas detalhadas para implantação na borda.

Para uma visão geral abrangente das estratégias de implantação em várias plataformas, consulte o guia de opções de implantação.

Como posso realizar inferência usando um modelo Ultralytics YOLO treinado?

Realizar inferência com um modelo Ultralytics YOLO treinado é simples:

  1. Carregar o Modelo:

    from ultralytics import YOLO
    
    model = YOLO("path/to/your/model.pt")
  2. Executar a Inferência:

    results = model("path/to/image.jpg")
    
    for r in results:
        print(r.boxes)  # print bounding box predictions
        print(r.masks)  # print mask predictions
        print(r.probs)  # print class probabilities

Para técnicas avançadas de inferência, incluindo processamento em lote, inferência de vídeo e pré-processamento personalizado, consulte o guia de predição detalhado.

Onde posso encontrar exemplos e tutoriais para usar a Ultralytics?

A Ultralytics fornece uma riqueza de recursos para te ajudar a começar e dominar suas ferramentas:

Estes recursos fornecem exemplos de código, casos de uso do mundo real e guias passo a passo para várias tarefas usando modelos Ultralytics.

Se precisares de mais assistência, consulta a documentação da Ultralytics ou contacta a comunidade através de GitHub Issues ou do fórum de discussão oficial.

Comentários