Comparação de modelos: YOLOX vs YOLOv8 para deteção de objectos
A escolha do modelo de deteção de objectos correto é fundamental para equilibrar a precisão, a velocidade e os recursos computacionais em aplicações de visão por computador. Esta página apresenta uma comparação técnica entre o YOLOX, desenvolvido pela Megvii, e o Ultralytics YOLOv8, ambos modelos de última geração reconhecidos pelas suas capacidades de deteção de objectos. Analisamos as suas escolhas arquitectónicas, referências de desempenho e adequação a diferentes casos de utilização para ajudar no seu processo de seleção de modelos.
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOX: Deteção sem âncora de alto desempenho
YOLOX, introduzido por Megvii em julho de 2021(arXiv), é um modelo de deteção de objetos sem âncora focado em simplificar o pipeline YOLO enquanto melhora o desempenho. É de autoria de Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun. O YOLOX tem como objetivo colmatar a lacuna entre a investigação e as aplicações industriais com o seu design eficiente e elevada precisão. A arquitetura incorpora avanços como uma cabeça desacoplada, atribuição de etiquetas SimOTA e fortes técnicas de aumento de dados, contribuindo para o seu desempenho robusto.
Pontos fortes:
- Simplicidade e Eficiência: O YOLOX simplifica a estrutura tradicional YOLO , removendo as âncoras, o que leva a um processo de formação mais direto e a uma complexidade reduzida.
- Elevada precisão e velocidade: Atinge o desempenho mais avançado entre os detectores de fase única, equilibrando uma elevada precisão com velocidades de inferência rápidas, conforme demonstrado no seu parâmetro de referência.
- Design de fácil utilização industrial: O YOLOX foi concebido para ser facilmente implementável e adaptável a aplicações industriais, com várias opções de implementação como ONNX, TensorRT e OpenVINO (documentação do YOLOX).
Pontos fracos:
- Embora eficientes, os tamanhos dos modelos, especialmente para variantes maiores como YOLOX-x, podem ser consideráveis, exigindo potencialmente mais recursos computacionais em comparação com modelos extremamente leves como YOLOv8n.
Casos de utilização ideais:
O YOLOX é adequado para aplicações que requerem um equilíbrio entre alta precisão e processamento em tempo real, incluindo:
- Deteção de objectos de elevado desempenho em investigação e desenvolvimento, onde se dá prioridade à precisão de ponta.
- Aplicações industriais que exigem uma deteção robusta e fiável, como o controlo de qualidade e a automatização do fabrico(IA no fabrico).
- Cenários de implementação de borda onde há hardware capaz disponível, aproveitando suas opções de implementação otimizadas.
YOLOv8: Deteção versátil e de fácil utilização
Ultralytics YOLOv8, lançado pela Ultralytics a 10 de janeiro de 2023, é a mais recente iteração da série YOLO , centrando-se em proporcionar uma experiência versátil e fácil de utilizar num vasto espetro de tarefas de IA de visão. Desenvolvido por Glenn Jocher, Ayush Chaurasia e Jing Qiu, baseia-se nas versões anteriores YOLO com melhorias arquitectónicas e uma forte ênfase na facilidade de utilização e flexibilidade. YOLOv8 suporta várias tarefas, incluindo deteção de objectos, segmentação de instâncias, classificação de imagens e estimativa de pose.
Pontos fortes:
- Desempenho de última geração: YOLOv8 oferece excelente mAP e inferência rápida, tornando-o competitivo com outros modelos de topo (ver benchmarksYOLOv8 ).
- Facilidade de uso: Ultralytics enfatiza a facilidade de utilização com documentação abrangente e uma interface simples, Python, facilitando a rápida criação de protótipos e a implementação.
- Versatilidade em todas as tarefas: YOLOv8 não se limita à deteção de objectos, mas estende-se à segmentação, classificação e estimativa de pose, fornecendo uma solução unificada para diversas necessidades de visão computacional.
- Ecossistema e Comunidade: Beneficia de uma grande e ativa comunidade de código aberto e integra-se perfeitamente com o HUB Ultralytics para gestão e implementação de modelos.
Pontos fracos:
- Para dispositivos com recursos extremamente limitados, os modelos mais pequenos e especializados, como o YOLOX-Nano, podem oferecer uma pegada mais pequena, embora YOLOv8n constitua uma alternativa muito leve.
Casos de utilização ideais:
A versatilidade e a facilidade de utilização do YOLOv8 tornam-no ideal para uma vasta gama de aplicações:
- Deteção de objectos em tempo real em aplicações como sistemas de segurança, robótica e veículos autónomos.
- Soluções versáteis de IA de visão em todos os sectores, incluindo agricultura, cuidados de saúde e cidades inteligentes.
- Prototipagem e implementação rápidas devido à sua interface de fácil utilização e aos modelos pré-treinados disponíveis no Ultralytics HUB.
Para os utilizadores interessados noutros modelos, Ultralytics também oferece uma gama de modelos YOLO , incluindo YOLOv5, YOLOv7 e o inovador YOLOv10, cada um com pontos fortes e optimizações únicas.