Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ vs YOLOv9#

O panorama da visão computacional em tempo real está em constante mudança, com pesquisadores e desenvolvedores superando continuamente os limites da precisão e da velocidade de inferência. Ao comparar o PP-YOLOE+ e o YOLOv9, estamos analisando duas filosofias distintas na arquitetura de modelos e no design de ecossistema.

Esta comparação técnica abrangente analisa suas inovações arquitetônicas, métricas de desempenho, metodologias de treinamento e casos de uso ideais para te ajudar a escolher o modelo de detecção de objetos certo para a sua próxima implantação.

Link to this sectionLinhagem do Modelo e Fundamentos Técnicos#

Compreender as origens e as escolhas arquitetônicas desses modelos é crucial para determinar sua adequação aos seus projetos de visão computacional.

Link to this sectionVisão geral do PP-YOLOE+#

Desenvolvido pelos autores do PaddlePaddle na Baidu, o PP-YOLOE+ foi introduzido em 2 de abril de 2022. Ele se baseia em iterações anteriores dentro do framework PaddleDetection para oferecer detecção de objetos de alto desempenho.

O PP-YOLOE+ introduz uma arquitetura robusta sem âncoras (anchor-free), altamente otimizada para implantação dentro do ecossistema PaddlePaddle. Ele utiliza um backbone CSPRepResNet modificado e um ET-head para melhorar a extração de características e a regressão de BBox. Embora alcance uma alta mean Average Precision (mAP), sua dependência do framework PaddlePaddle pode, às vezes, causar atrito de integração para desenvolvedores acostumados ao PyTorch ou TensorFlow.

Saiba mais sobre o PP-YOLOE+

Link to this sectionVisão Geral do YOLOv9#

Introduzido por Chien-Yao Wang e Hong-Yuan Mark Liao do Institute of Information Science, Academia Sinica, Taiwan, o YOLOv9 marca um salto significativo no tratamento eficiente de gargalos de informação em deep learning.

  • Autores: Chien-Yao Wang e Hong-Yuan Mark Liao
  • Organização: Institute of Information Science, Academia Sinica, Taiwan
  • Data: 21-02-2024
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

O grande avanço do YOLOv9 é a Programmable Gradient Information (PGI), que evita a perda de dados à medida que as características passam por redes neurais profundas. Combinado com a Generalized Efficient Layer Aggregation Network (GELAN), o YOLOv9 maximiza a eficiência de parâmetros e o fluxo computacional. Além disso, ele é integrado nativamente ao ecossistema Ultralytics, tornando-o altamente acessível tanto para pesquisa quanto para aplicações comerciais.

Saiba mais sobre o YOLOv9

Outros Modelos Ultralytics

Se você está explorando opções de ponta, também pode se interessar pelo YOLO11 e pelo RT-DETR, que oferecem equilíbrios variados entre precisão baseada em Transformer e desempenho de ponta (edge) em tempo real.

Link to this sectionComparação de desempenho e métricas#

Ao analisar o desempenho bruto, o YOLOv9 demonstra uma eficiência de parâmetros excepcional. Ele alcança uma precisão comparável ou superior exigindo menos parâmetros e FLOPs, o que se traduz em requisitos de VRAM menores durante o treinamento do modelo.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Como visto na tabela, o YOLOv9c alcança um forte mAP de 53,0 com significativamente menos parâmetros (25,3M) do que o PP-YOLOE+l (52,2M) comparável. Esse menor uso de memória torna o YOLOv9 uma escolha superior para desenvolvedores que trabalham com recursos de GPU limitados.

Link to this sectionEcossistema, Versatilidade e Facilidade de Uso#

A vantagem definitiva do YOLOv9 reside em sua integração perfeita com o ecossistema Ultralytics, que é bem mantido. Enquanto o PP-YOLOE+ requer a navegação por arquivos de configuração complexos do PaddlePaddle, o YOLOv9 se beneficia de uma API Python simplificada.

A Ultralytics Python API permite que os desenvolvedores carreguem pesos pré-treinados, gerenciem data augmentation e iniciem o treinamento com o mínimo de código boilerplate.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

Além disso, o ecossistema Ultralytics oferece uma versatilidade inigualável. Além da detecção de BBox, o framework suporta nativamente Instance Segmentation, Pose Estimation e detecção de Oriented Bounding Box (OBB). Isso torna a adaptação do seu modelo a pipelines complexos do mundo real incrivelmente eficiente.

Opções de Exportação

Modelos treinados usando o framework Ultralytics podem ser exportados para vários formatos, incluindo TensorRT e OpenVINO, garantindo uma inferência altamente otimizada em diversos hardwares.

Link to this sectionCasos de uso e recomendações#

A escolha entre PP-YOLOE+ e YOLOv9 depende dos requisitos específicos do seu projeto, das restrições de implantação e das preferências de ecossistema.

Link to this sectionQuando escolher o PP-YOLOE+#

O PP-YOLOE+ é uma escolha forte para:

  • Integração com o ecossistema PaddlePaddle: Organizações com infraestrutura existente construída no framework e nas ferramentas do PaddlePaddle da Baidu.
  • Implementação Edge com Paddle Lite: Implementação em hardware com kernels de inferência altamente otimizados especificamente para o motor de inferência Paddle Lite ou Paddle.
  • Detecção de Alta Precisão no Servidor: Cenários que priorizam a precisão máxima de detecção em servidores GPU potentes, onde a dependência de framework não é uma preocupação.

Link to this sectionQuando escolher o YOLOv9#

O YOLOv9 é recomendado para:

  • Pesquisa sobre o Gargalo de Informação: Projetos acadêmicos que estudam as arquiteturas Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Estudos de Otimização de Fluxo de Gradiente: Pesquisas focadas em entender e mitigar a perda de informação em camadas de rede profundas durante o treino.
  • Benchmarking de Detecção de Alta Precisão: Cenários onde o forte desempenho do YOLOv9 no benchmark COCO é necessário como ponto de referência para comparações arquiteturais.

Link to this sectionQuando escolher a Ultralytics (YOLO26)#

Para a maioria dos novos projetos, o Ultralytics YOLO26 oferece a melhor combinação de desempenho e experiência para o desenvolvedor:

  • Implantação de borda sem NMS: Aplicações que requerem inferência consistente e de baixa latência sem a complexidade do pós-processamento de Supressão de Não-Máximos.
  • Ambientes apenas com CPU: Dispositivos sem aceleração de GPU dedicada, onde a inferência em CPU até 43% mais rápida do YOLO26 oferece uma vantagem decisiva.
  • Detecção de objetos pequenos: Cenários desafiadores como imagens de drone aéreo ou análise de sensores IoT onde ProgLoss e STAL aumentam significativamente a precisão em objetos minúsculos.

Link to this sectionOlhando para o Futuro: A Vantagem do YOLO26#

Embora o PP-YOLOE+ e o YOLOv9 sejam poderosos, o recém-lançado YOLO26 representa o próximo passo definitivo para ambientes de produção. Lançado em janeiro de 2026, o YOLO26 estabelece um novo padrão para computação de borda (edge) e implantações em nuvem. Recomendamos fortemente o YOLO26 para todos os novos projetos de visão computacional devido às suas inovações pioneiras:

  • Design end-to-end sem NMS: O YOLO26 é nativamente end-to-end, eliminando completamente a necessidade de pós-processamento por Non-Maximum Suppression (NMS). Isso simplifica significativamente os pipelines de implantação e reduz a latência.
  • Inferência em CPU até 43% mais rápida: Ao otimizar especificamente a arquitetura para computação de borda, o YOLO26 é significativamente mais rápido em hardware que carece de GPUs dedicadas.
  • Remoção de DFL: O Distribution Focal Loss foi removido, tornando as exportações mais simples e melhorando drasticamente a compatibilidade com dispositivos de borda de baixo consumo.
  • Otimizador MuSGD: Inspirado em técnicas de treinamento de grandes modelos de linguagem (como o Kimi K2 da Moonshot AI), este híbrido de SGD e Muon garante dinâmicas de treinamento altamente estáveis e rápida convergência.
  • ProgLoss + STAL: Essas funções de perda avançadas produzem melhorias notáveis no reconhecimento de objetos pequenos, uma atualização essencial para imagens aéreas e robótica.
  • Melhorias Específicas por Tarefa: O YOLO26 inclui arquiteturas personalizadas para tarefas específicas, como multi-scale proto para segmentação e Residual Log-Likelihood Estimation (RLE) para pose estimation.

Você pode treinar e implantar facilmente modelos YOLO26 através da Ultralytics Platform, uma solução tudo-em-um para anotação de datasets, treinamento em nuvem e monitoramento de modelos.

Link to this sectionAplicações do Mundo Real#

A escolha entre essas arquiteturas geralmente se resume ao seu ambiente de implantação alvo.

PP-YOLOE+ é frequentemente implantado em centros de manufatura industrial, particularmente em regiões onde a integração com PaddlePaddle e a pilha de hardware da Baidu estão profundamente incorporadas à infraestrutura empresarial. Ele se destaca na análise de imagens estáticas onde a precisão absoluta é priorizada em relação a restrições rígidas de tempo real.

YOLOv9 se destaca em ambientes dinâmicos que exigem inferência em tempo real rápida. Sua eficiência de parâmetros superior o torna ideal para navegação autônoma de drones e sistemas de segurança baseados em edge. Além disso, seu menor consumo de VRAM reduz a barreira de entrada para pesquisadores que treinam em GPUs de nível consumidor.

Para o melhor desempenho absoluto em gerenciamento de tráfego de cidades inteligentes e robótica de alta velocidade, o YOLO26 mais recente é inigualável, oferecendo eficiência end-to-end sem a sobrecarga dos gargalos de NMS.

Contribuidores

Comentários