Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLO11#

Ao escolher a arquitetura de visão computacional certa para um novo projeto, entender a evolução dos modelos de ponta é crucial. A progressão de arquiteturas anteriores para estruturas unificadas modernas destaca saltos significativos tanto na eficiência algorítmica quanto na experiência do desenvolvedor. Este guia fornece uma comparação técnica detalhada entre dois modelos históricos desenvolvidos pela Ultralytics: o pioneiro YOLOv5 e o altamente refinado YOLO11.

Link to this sectionIntrodução aos Modelos#

Ambas as arquiteturas representam marcos significativos no campo da detecção de objetos em tempo real, oferecendo vantagens distintas dependendo do teu ambiente de implantação e requisitos legados.

Link to this sectionYOLOv5: O cavalo de batalha da indústria#

Lançado no verão de 2020, o YOLOv5 tornou-se rapidamente um padrão da indústria devido à sua implementação nativa em PyTorch, que reduziu drasticamente a barreira de entrada para treinamento e implantação. Ele abandonou as complexas estruturas C do Darknet de seus predecessores, oferecendo uma abordagem Pythonica para a criação de modelos.

O YOLOv5 estabeleceu uma base sólida para a facilidade de uso e introduziu metodologias de treinamento poderosas, incluindo aumento de dados por mosaico avançado e auto-ancoragem. Ele permanece incrivelmente popular entre pesquisadores que constroem sobre uma base de código bem documentada e amplamente testada.

Saiba mais sobre o YOLOv5

Link to this sectionYOLO11: A Estrutura de Visão Unificada#

Com base em anos de feedback e pesquisa arquitetônica, o YOLO11 foi introduzido como parte de uma estrutura unificada capaz de lidar com múltiplas tarefas de visão nativamente. Indo além de apenas caixas delimitadoras, foi projetado desde o início para máxima versatilidade e eficiência.

O YOLO11 oferece uma experiência de usuário simplificada por meio do pacote Python ultralytics, ostentando uma API simples que unifica detecção de objetos, segmentação de instâncias, classificação, estimativa de pose e caixas delimitadoras orientadas (OBB). Ele alcança um equilíbrio altamente favorável entre velocidade e precisão, tornando-o ideal para diversos cenários de implantação no mundo real.

Sabe mais sobre o YOLO11

Plataforma Integrada

Ambos os modelos beneficiam da ecossistema bem mantido fornecido pela Ultralytics Platform. Este ambiente integrado simplifica a anotação de conjuntos de dados, o treinamento na nuvem e a exportação de modelos para vários destinos de hardware.

Link to this sectionComparação de desempenho e métricas#

Uma comparação direta desses modelos revela como os refinamentos arquitetônicos se traduzem em ganhos tangíveis de desempenho. A tabela abaixo ilustra a precisão média média (mAP) avaliada no conjunto de dados COCO, juntamente com as velocidades de inferência em CPU e GPU e contagens de parâmetros.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Link to this sectionAnalisando os resultados#

As métricas destacam um salto claro no equilíbrio de desempenho alcançado pelo YOLO11. Por exemplo, o modelo YOLO11n (nano) alcança 39,5% de mAP em comparação com os 28,0% do YOLOv5n, reduzindo simultaneamente o tempo de inferência da CPU quando exportado via ONNX. Além disso, o YOLO11 mantém requisitos de memória notavelmente menores durante o treinamento em comparação com modelos pesados baseados em Transformer, tornando-o altamente acessível para implantação em hardware de consumo e dispositivos de borda.

Link to this sectionDiferenças Arquiteturais#

As melhorias de desempenho no YOLO11 decorrem de várias evoluções arquitetônicas fundamentais. Enquanto o YOLOv5 utilizava uma espinha dorsal CSPNet padrão com módulos C3, o YOLO11 introduziu blocos de extração de características mais eficientes, como C2f e posteriormente C3k2, que otimizam o fluxo de gradiente e reduzem a sobrecarga computacional.

O YOLO11 também apresenta uma cabeça fortemente refinada. Afastando-se do design baseado em âncoras de modelos mais antigos, as arquiteturas mais recentes da Ultralytics adotam uma abordagem sem âncoras. Isso reduz o número de previsões de caixas, simplificando o pipeline de pós-processamento e melhorando a capacidade do modelo de generalizar entre diferentes escalas e proporções. Além disso, esses modelos possuem uma eficiência de treinamento superior e pesos pré-treinados prontamente disponíveis que aceleram a convergência de conjuntos de dados ajustados.

Link to this sectionImplementação e Exemplos de Código#

Uma das características de destaque do ecossistema Ultralytics é a sua simplicidade. Enquanto o YOLOv5 popularizou o uso de torch.hub para inferência rápida, o YOLO11 dá um passo além com o pacote Python unificado ultralytics.

Link to this sectionTreinando com YOLO11#

Carregar, treinar e validar um modelo requer um código boilerplate mínimo. A API lida com o ajuste de hiperparâmetros e o gerenciamento de modelos de forma contínua.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")

# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")

Link to this sectionInferência Legada com YOLOv5#

Se estás a manter um pipeline mais antigo, o YOLOv5 integra-se diretamente ao mecanismo de carregamento nativo do PyTorch, tornando trivial a sua inserção em scripts de inferência existentes.

import torch

# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")

# Print prediction details to the console
results.print()
Flexibilidade de implantação

Ambos os modelos suportam extensos formatos de exportação. Quer estejas a visar um NVIDIA Jetson usando TensorRT ou uma aplicação iOS usando CoreML, o processo de implantação é minuciosamente documentado e suportado pela comunidade.

Link to this sectionCasos de uso ideais#

A escolha entre esses modelos depende amplamente do estágio do ciclo de vida do teu projeto e dos requisitos específicos.

Link to this sectionQuando escolher o YOLOv5#

  • Manutenção de Bases de Código Legadas: Se o teu ambiente de produção é fortemente personalizado em torno da estrutura do repositório YOLOv5 ou de técnicas específicas de evolução de hiperparâmetros.
  • Bases Acadêmicas: Ao publicar pesquisas que exigem benchmarking direto contra padrões estabelecidos de visão computacional de 2020-2022.

Link to this sectionQuando escolher o YOLO11#

  • Projetos Multitarefa: Quando a tua aplicação requer uma mistura de tarefas como estimativa de pose e segmentação de instâncias usando uma única API unificada.
  • Implantações de Borda (Edge): Para cenários de computação de borda onde extrair o máximo mAP para um determinado orçamento computacional (FLOPs) é crítico.
  • Soluções de IA Comercial: Ideal para aplicações empresariais em varejo e segurança, aproveitando o suporte robusto da Ultralytics Platform.

Link to this sectionA Próxima Geração: Ultralytics YOLO26#

Embora o YOLO11 represente um equilíbrio fantástico de velocidade e precisão, o campo da inteligência artificial evolui rapidamente. Para desenvolvedores que iniciam novos projetos hoje, recomendamos fortemente explorar o padrão mais recente em IA de visão: Ultralytics YOLO26.

Lançado em janeiro de 2026, o YOLO26 introduz avanços que mudam o paradigma, projetados especificamente para as necessidades modernas de implantação:

  • Design de Ponta a Ponta Sem NMS: Construindo sobre conceitos pioneiros no YOLOv10, o YOLO26 é nativamente de ponta a ponta. Ele elimina a necessidade de pós-processamento de Supressão Não-Máxima (NMS), simplificando significativamente os pipelines de implantação e reduzindo a latência.
  • Otimizador MuSGD: Inspirado em inovações de treinamento de LLM de modelos como o Kimi K2 da Moonshot AI, este híbrido de SGD e Muon garante um treinamento incrivelmente estável e uma convergência dramaticamente mais rápida.
  • Velocidade de CPU Sem Precedentes: Ao remover a Distribuição de Perda Focal (DFL), o YOLO26 alcança até 43% mais rapidez na inferência de CPU, tornando-o a escolha absoluta para dispositivos de borda e ambientes sem GPUs dedicadas.
  • Funções de Perda Avançadas: A integração de ProgLoss e STAL produz melhorias notáveis no reconhecimento de objetos pequenos, o que é crítico para análise de drones, IoT e robótica.
  • Melhorias Específicas de Tarefa: Introduz otimizações especializadas, como Estimativa de Log-Verossimilhança Residual (RLE) para Pose e perda de ângulo especializada para caixas delimitadoras orientadas, garantindo desempenho superior em todas as tarefas de visão computacional.

Saiba mais sobre o YOLO26

Para usuários interessados em arquiteturas especializadas além da detecção de objetos padrão, também podes explorar modelos como RT-DETR para detecção baseada em Transformer, ou YOLO-World para rastreamento e detecção de vocabulário aberto. Adotar essas ferramentas bem mantidas e altamente otimizadas garante que os teus pipelines de visão computacional permaneçam eficientes, escaláveis e à frente das tendências.

Comentários