Ultralytics YOLO11

Visão geral

O YOLO11 foi lançado pela Ultralytics em 10 de setembro de 2024, oferecendo excelente precisão, velocidade e eficiência. Baseando-se nos avanços impressionantes das versões anteriores do YOLO, o YOLO11 introduz melhorias significativas na arquitetura e nos métodos de treinamento, tornando-o uma escolha versátil para uma ampla gama de tarefas de visão computacional. Para o modelo mais recente da Ultralytics com inferência de ponta a ponta sem NMS e implementação otimizada na borda, consulte YOLO26.

Gráficos de Comparação do Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM



Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Experimente na Plataforma Ultralytics

Explore e execute modelos YOLO11 diretamente na Plataforma Ultralytics.

Principais recursos

  • Extração de Recursos Aprimorada: O YOLO11 emprega uma arquitetura de backbone e neck melhorada, que aprimora as capacidades de extração de recursos para detecção de objetos mais precisa e desempenho em tarefas complexas.
  • Otimizado para Eficiência e Velocidade: O YOLO11 introduz designs arquitetônicos refinados e pipelines de treinamento otimizados, proporcionando velocidades de processamento mais rápidas e mantendo um equilíbrio ideal entre precisão e desempenho.
  • Maior Precisão com Menos Parâmetros: Com avanços no design do modelo, o YOLO11m atinge uma precisão média (mAP) mais alta no conjunto de dados COCO, utilizando 22% menos parâmetros do que o YOLOv8m, tornando-o computacionalmente eficiente sem comprometer a precisão.
  • Adaptabilidade em Diferentes Ambientes: O YOLO11 pode ser implementado perfeitamente em vários ambientes, incluindo dispositivos de borda, plataformas em nuvem e sistemas que suportam GPUs NVIDIA, garantindo máxima flexibilidade.
  • Ampla Gama de Tarefas Suportadas: Seja para detecção de objetos, segmentação de instâncias, classificação de imagens, estimativa de pose ou detecção de objetos orientados (OBB), o YOLO11 foi projetado para atender a um conjunto diversificado de desafios de visão computacional.

Tarefas e modos suportados

O YOLO11 baseia-se na versátil gama de modelos estabelecida pelos lançamentos anteriores do Ultralytics YOLO, oferecendo suporte aprimorado em várias tarefas de visão computacional:

ModeloNomes de arquivoTarefaInferência (Inference)ValidaçãoTreinamentoExport
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.ptDetecção
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptSegmentação de instância
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptPose/Pontos-chave
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.ptDetecção orientada
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.ptClassificação

Esta tabela fornece uma visão geral das variantes do modelo YOLO11, demonstrando sua aplicabilidade em tarefas específicas e compatibilidade com modos operacionais como Inferência, Validação, Treinamento e Exportação. Essa flexibilidade torna o YOLO11 adequado para uma ampla gama de aplicações em visão computacional, desde detecção em tempo real até tarefas complexas de segmentação.

Métricas de desempenho

Desempenho

Consulte os Documentos de detecção para exemplos de uso com esses modelos treinados no COCO, que incluem 80 classes pré-treinadas.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66,5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Exemplos de Uso

Esta seção fornece exemplos simples de treino e inferência com YOLO11. Para a documentação completa sobre estes e outros modos, consulte as páginas de documentação de Predict, Train, Val e Export.

Observe que o exemplo abaixo é para modelos YOLO11 Detect para detecção de objetos. Para outras tarefas suportadas, consulte a documentação de Segment, Classify, OBB e Pose.

Exemplo

Modelos PyTorch pré-treinados *.pt, bem como arquivos de configuração *.yaml, podem ser passados para a classe YOLO() para criar uma instância de modelo em Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Citações e Agradecimentos

Publicação Ultralytics YOLO11

A Ultralytics não publicou um artigo de pesquisa formal para YOLO11 devido à natureza em rápida evolução dos modelos. Focamo-nos em avançar a tecnologia e torná-la mais fácil de usar, em vez de produzir documentação estática. Para obter as informações mais atualizadas sobre a arquitetura, recursos e uso do YOLO, consulte o nosso repositório no GitHub e a nossa documentação.

Se utilizares YOLO11 ou qualquer outro software deste repositório no teu trabalho, por favor cita-o usando o seguinte formato:

Citação
@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Por favor, nota que o DOI está pendente e será adicionado à citação assim que estiver disponível. Os modelos YOLO11 são fornecidos sob licenças AGPL-3.0 e Enterprise.

FAQ

Quais são as principais melhorias no Ultralytics YOLO11 em comparação com o YOLOv8?

O Ultralytics YOLO11 introduz vários avanços significativos em relação ao YOLOv8. As principais melhorias incluem:

  • Extração de Características Aprimorada: O YOLO11 utiliza uma arquitetura de backbone e neck melhorada, melhorando as capacidades de extração de características para uma detecção de objetos mais precisa.
  • Eficiência e Velocidade Otimizadas: Designs de arquitetura refinados e pipelines de treino otimizados oferecem velocidades de processamento mais rápidas, mantendo um equilíbrio entre precisão e desempenho.
  • Maior Precisão com Menos Parâmetros: O YOLO11m alcança uma média de Precisão (mAP) superior no dataset COCO com 22% menos parâmetros do que o YOLOv8m, tornando-o computacionalmente eficiente sem comprometer a precisão.
  • Adaptabilidade em Diferentes Ambientes: O YOLO11 pode ser implantado em vários ambientes, incluindo dispositivos de borda (edge devices), plataformas na nuvem e sistemas que suportam GPUs NVIDIA.
  • Ampla Gama de Tarefas Suportadas: O YOLO11 suporta diversas tarefas de visão computacional, como detecção de objetos, segmentação de instâncias, classificação de imagens, estimativa de pose e detecção de objetos orientados (OBB).

Como treino um modelo YOLO11 para detecção de objetos?

O treino de um modelo YOLO11 para detecção de objetos pode ser feito usando Python ou comandos CLI. Abaixo estão exemplos para ambos os métodos:

Exemplo
from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Para instruções mais detalhadas, consulte a documentação de Train.

Que tarefas podem os modelos YOLO11 realizar?

Os modelos YOLO11 são versáteis e suportam uma ampla gama de tarefas de visão computacional, incluindo:

  • Detecção de Objetos: Identificar e localizar objetos dentro de uma imagem.
  • Segmentação de Instâncias: Detectar objetos e delimitar os seus contornos.
  • Classificação de Imagens: Categorizar imagens em classes predefinidas.
  • Estimativa de Pose: Detectar e rastrear pontos-chave em corpos humanos.
  • Detecção de Objetos Orientados (OBB): Detectar objetos com rotação para maior precisão.

Para mais informações sobre cada tarefa, consulte a documentação de Detection, Instance Segmentation, Classification, Pose Estimation e Oriented Detection.

Como é que o YOLO11 alcança maior precisão com menos parâmetros?

O YOLO11 alcança maior precisão com menos parâmetros através de avanços no design do modelo e técnicas de otimização. A arquitetura melhorada permite uma extração e processamento de características eficientes, resultando numa maior média de Precisão (mAP) em datasets como o COCO, utilizando 22% menos parâmetros do que o YOLOv8m. Isso torna o YOLO11 computacionalmente eficiente sem comprometer a precisão, tornando-o adequado para implantação em dispositivos com recursos limitados.

O YOLO11 pode ser implantado em dispositivos de borda (edge devices)?

Sim, o YOLO11 foi concebido para ser adaptável em vários ambientes, incluindo dispositivos de borda. A sua arquitetura otimizada e capacidades de processamento eficiente tornam-no adequado para implantação em dispositivos de borda, plataformas na nuvem e sistemas que suportam GPUs NVIDIA. Essa flexibilidade garante que o YOLO11 possa ser utilizado em diversas aplicações, desde detecção em tempo real em dispositivos móveis até tarefas complexas de segmentação em ambientes de nuvem. Para mais detalhes sobre opções de implantação, consulte a documentação de Export.

Comentários