YOLOv6-3.0 vs. YOLO: Uma comparação técnica para a deteção de objectos
A escolha do modelo de deteção de objectos ideal é uma decisão crítica em projectos de visão computacional. Esta página oferece uma comparação técnica detalhada entre o YOLOv6-3.0 e o YOLO, dois modelos proeminentes reconhecidos pela sua eficiência e precisão em tarefas de deteção de objectos. Iremos explorar as suas nuances arquitectónicas, referências de desempenho e adequação a várias aplicações para orientar a sua seleção.
Descrição geral do YOLOv6-3.0
O YOLOv6-3.0 da Meituan centra-se em aplicações industriais, equilibrando elevada eficiência e precisão. A versão 3.0 do YOLOv6, detalhada num documento publicado em 2023-01-13(YOLOv6 v3.0: A Full-Scale Reloading), aperfeiçoa a sua arquitetura para melhorar o desempenho e a robustez. Foi concebido para ser sensível ao hardware, garantindo um funcionamento eficiente em diversas plataformas.
Arquitetura e principais caraterísticas
O YOLOv6-3.0, da autoria de Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu e Xiangxiang Chu da Meituan, enfatiza uma arquitetura simplificada para velocidade e eficiência. As principais caraterísticas incluem:
- Backbone de Reparametrização Eficiente: Permite uma inferência mais rápida.
- Bloco híbrido: Atinge um equilíbrio entre exatidão e eficiência computacional.
- Estratégia de treinamento otimizada: Melhora a convergência do modelo e o desempenho geral.
Desempenho e casos de utilização
O YOLOv6-3.0 é particularmente adequado para cenários industriais que requerem uma mistura de velocidade e precisão. O seu design optimizado torna-o eficaz para:
- Automatização industrial: Controlo de qualidade e monitorização de processos no fabrico.
- Retalho inteligente: Gestão de inventário e sistemas de checkout automatizados.
- Implementação na periferia: Aplicações em dispositivos com recursos limitados, como câmaras inteligentes.
Pontos fortes:
- Foco industrial: Adaptado para desafios de implantação industrial do mundo real.
- Desempenho equilibrado: Oferece um forte compromisso entre velocidade e precisão.
- Otimização de hardware: Desempenho eficiente em várias plataformas de hardware.
Pontos fracos:
- Compensação da precisão: Pode dar prioridade à velocidade e à eficiência em detrimento da obtenção da precisão máxima absoluta, em comparação com alguns modelos especializados.
- Tamanho da comunidade: Comunidade potencialmente mais pequena e menos recursos em comparação com modelos mais amplamente adoptados como YOLOv8.
YOLO Descrição geral
O YOLO, desenvolvido pelo Alibaba Group e detalhado num documento de 2022-11-23(YOLO: Rethinking Bounding Box Regression with Decoupled Evolution), foi concebido para um elevado desempenho com foco na eficiência e na escalabilidade. Criado por Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun, o YOLO emprega uma estrutura de cabeça desacoplada para separar as tarefas de classificação e regressão, aumentando sua velocidade.
Arquitetura e principais caraterísticas
A YOLO foi concebida para ser escalável e ter uma elevada precisão. Os seus principais aspectos arquitectónicos incluem:
- Estrutura de cabeça desacoplada: Separa a classificação e a regressão para aumentar a velocidade.
- Backbone baseado em NAS: Utiliza a Pesquisa de Arquitetura Neural para um desempenho optimizado.
- Atribuição de etiquetas AlignedOTA: Refina o processo de formação para uma melhor precisão.
Desempenho e casos de utilização
O YOLO é ideal para aplicações que exigem elevada precisão e adaptável a diferentes restrições de recursos devido às suas dimensões de modelo escaláveis. Ele se destaca em:
- Cenários de elevada precisão: Condução autónoma e sistemas de segurança avançados.
- Ambientes com recursos limitados: Implantável em dispositivos de ponta devido a variantes de modelos mais pequenos.
- Inspeção industrial: Controlo de qualidade onde a precisão é fundamental.
Pontos fortes:
- Elevada precisão: Obtém resultados impressionantes de mAP para uma deteção precisa.
- Escalabilidade: Oferece uma gama de tamanhos de modelos para se adequar a diferentes necessidades computacionais.
- Inferência eficiente: Optimizado para uma inferência rápida, adequado para tarefas em tempo real.
Pontos fracos:
- Complexidade: A cabeça dissociada e as técnicas avançadas podem tornar a arquitetura mais complexa.
- Documentação no âmbito do Ultralytics: Sendo um modelo Ultralytics Ultralytics, a documentação direta no ecossistema Ultralytics é limitada.
Tabela de comparação de modelos
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Nota: As referências de velocidade podem variar consoante o hardware, as configurações de software e as técnicas de otimização específicas utilizadas. A velocidadeONNX CPU não está disponível nesta tabela.
Conclusão
Tanto o YOLOv6-3.0 como o YOLO são modelos robustos de deteção de objectos, apresentando cada um deles vantagens únicas. O YOLOv6-3.0 destaca-se em aplicações industriais que exigem um equilíbrio entre velocidade e desempenho eficiente em diferentes hardwares. O YOLO foi concebido para cenários que dão prioridade a uma elevada precisão e escalabilidade, acomodando diversos recursos computacionais.
Para os utilizadores do ecossistema Ultralytics , modelos como Ultralytics YOLOv8 e o inovador YOLO11 oferecem desempenho de última geração com documentação abrangente e suporte da comunidade. Considere explorar o YOLO e o RT-DETR para abordagens de arquitetura alternativas à deteção de objectos, conforme detalhado nos nossos documentosUltralytics YOLO .