Ir para o conteúdo

YOLOv9 .YOLO: avanços na deteção de objetos em tempo real

A evolução da deteção de objetos em tempo real tem sido marcada por uma busca constante pelo equilíbrio ideal entre precisão e latência. Nesta comparação detalhada, exploramos duas arquiteturas significativas: YOLOv9, conhecida pela sua Informação de Gradiente Programável (PGI) e Rede de Agregação de Camadas Eficiente Generalizada (GELAN), e YOLO, uma família de modelos otimizada através da Pesquisa de Arquitetura Neural (NAS) e técnicas de rep-parametrização.

Apresentamos também a última geração, YOLO26, que amplia ainda mais esses limites com um design completo NMS e otimização para dispositivos de ponta.

Métricas comparativas de desempenho

A tabela a seguir apresenta uma comparação direta das principais métricas de desempenho no conjunto de dados COCO . YOLOv9 eficiência superior em termos de parâmetros e, muitas vezes, maior precisão para tamanhos de modelo comparáveis.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv9: Informação de Gradiente Programável

YOLOv9 representa um salto significativo no design da arquitetura de aprendizagem profunda, abordando o problema do gargalo de informação inerente às redes profundas.

Principais Inovações Arquitetônicas

  1. Informação de gradiente programável (PGI): À medida que as redes se tornam mais profundas, informações críticas sobre características são frequentemente perdidas durante o processo de feed-forward. A PGI introduz um ramo reversível auxiliar que fornece informações de gradiente confiáveis ao ramo principal durante o treinamento. Isso garante que a rede retenha características essenciais para uma detecção precisa, resolvendo efetivamente o problema do "gargalo de informação" sem adicionar custo de inferência.
  2. GELAN Backbone: A Rede Generalizada de Agregação de Camadas Eficientes (GELAN) combina os melhores aspetos da CSPNet e da ELAN. Permite escolhas flexíveis de blocos computacionais (como ResBlocks ou blocos CSP), maximizando a utilização de parâmetros. Isso resulta em modelos leves, mas incrivelmente poderosos.

Essas inovações tornam YOLOv9 eficaz para a deteção de objetos de uso geral e particularmente hábil em reter detalhes minuciosos em cenas complexas.

Saiba mais sobre o YOLOv9

YOLO: Otimização da pesquisa de arquitetura neural

YOLO concentra-se em descobrir arquiteturas eficientes automaticamente e empregar técnicas de destilação para aumentar o desempenho.

Destaques da Arquitetura

YOLO uma tecnologia chamada Neural Architecture Search (NAS) para construir a sua espinha dorsal, MAE-NAS. Esta abordagem visa encontrar a estrutura de rede ideal dentro de restrições de latência específicas. Além disso, emprega uma Efficient RepGFPN (Re-parameterized Generalized Feature Pyramid Network) para fundir características em diferentes escalas. O modelo também depende fortemente do "ZeroHead" e do aprimoramento da destilação, em que um modelo professor maior orienta o treinamento do modelo aluno menor para melhorar sua precisão.

Embora inovadora, a dependência de NAS e pipelines de destilação complexos pode tornar a reprodução de resultados ou a modificação da arquitetura para tarefas personalizadas mais desafiadora em comparação com o design modular do YOLOv9.

Ultralytics da Ultralytics : ecossistema e facilidade de uso

Embora ambas as arquiteturas ofereçam fortes contribuições teóricas, a experiência prática para os programadores difere significativamente. Ultralytics , incluindo YOLOv9 YOLO26, proporcionam uma experiência perfeita e sem atritos.

Fluxo de Trabalho Otimizado

O treinamento deYOLO geralmente envolve ficheiros de configuração complexos e configurações de ambiente específicas (como PaddlePaddle CUDA específicas CUDA ). Em contrapartida, aPython Ultralytics padroniza o fluxo de trabalho. Você pode carregar, treinar e implementar modelos de última geração em questão de minutos.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Versatilidade e Suporte a Tarefas

Ultralytics não se limitam a caixas delimitadoras. A estrutura suporta nativamente a segmentação de instâncias, a estimativa de poses e a deteção de caixas delimitadoras orientadas (OBB). Essa versatilidade permite que as equipas alternem entre tarefas sem precisar aprender novas bibliotecas. Por outro lado,YOLO principalmente na deteção padrão, com menos suporte integrado para essas tarefas complexas a jusante.

Eficiência e Memória no Treinamento

YOLO Ultralytics são projetados para serem eficientes. Normalmente, eles exigem menos GPU durante o treinamento em comparação com arquiteturas pesadas de transformadores ou modelos gerados por NAS, que podem ter padrões irregulares de acesso à memória. Isso permite que os investigadores treinem modelos robustos em hardware de nível consumidor, democratizando o acesso à visão computacional de ponta.

Aplicações no Mundo Real

A escolha do modelo certo depende das suas restrições de implementação e objetivos de desempenho.

Casos de Uso Ideais para YOLOv9

  • Análise de retalho: A elevada precisão do YOLOv9c torna-o excelente para a deteção de produtos em prateleiras cheias, onde a oclusão é comum.
  • Imagiologia médica: A arquitetura PGI ajuda a reter informações críticas, que são vitais para a deteção de pequenas anomalias em exames médicos ou para a identificação de fraturas.
  • Vigilância de uso geral: Para feeds de segurança padrão, onde é necessário um equilíbrio entre mAP elevado mAP FPS razoável.

Casos de uso ideais paraYOLO

  • Pesquisa de hardware restrita: Se estiver a realizar uma pesquisa sobre NAS para encontrar uma estrutura de rede especificamente adaptada a uma restrição de hardware muito específica, na qual as estruturas de rede padrão falham.
  • Benchmarking académico: Para investigadores que comparam a eficácia das técnicas de destilação com a reparametrização estrutural.

Por que o YOLO26 é o futuro

Para os programadores que iniciam novos projetos em 2026, o YOLO26 oferece o conjunto de funcionalidades mais atraente. Ele se baseia nos pontos fortes do YOLOv9 introduz um design completo NMS, eliminando a necessidade de pós-processamento de supressão não máxima. Isso simplifica significativamente a implementação e reduz a latência, especialmente em dispositivos de ponta.

Saiba mais sobre YOLO26

As principais inovações do YOLO26 incluem:

  • MuSGD Optimizer: Um híbrido de SGD Muon que estabiliza o treinamento e acelera a convergência, trazendo a estabilidade do treinamento do Large Language Model (LLM) para a visão.
  • Remoção de DFL: A remoção da perda focal de distribuição simplifica o gráfico do modelo, facilitando a exportação para formatos como ONNX e TensorRT mais suave.
  • Detecção aprimorada de pequenos objetos: por meio do ProgLoss e do STAL, o YOLO26 se destaca em imagens aéreas e aplicações com drones.

Prepare a sua implementação para o futuro

A migração para o YOLO26 garante que a sua aplicação beneficie dos mais recentes avanços em otimização de ponta. O design nativo de ponta a ponta significa uma inferência mais rápida em CPUs e NPUs, crucial para dispositivos IoT alimentados por bateria.

Conclusão

EnquantoYOLO conceitos interessantes sobre pesquisa de arquitetura neural e destilação, YOLOv9 e o mais recente YOLO26 oferecem uma solução mais prática, poderosa e fácil de usar para a grande maioria das aplicações de visão computacional. O Ultralytics garante que os programadores tenham acesso às melhores ferramentas para treinar, rastrear e implementar modelos, com o apoio de uma extensa documentação e suporte da comunidade.

Para explorar mais a fundo as arquiteturas dos modelos, considere rever as nossas comparações entre YOLOv10 YOLO ou YOLO11 YOLOv9.


Comentários