YOLOv8 vs YOLO: Comparação técnica pormenorizada
A escolha do modelo de deteção de objectos correto é fundamental para os projectos de visão por computador. Esta página oferece uma comparação técnica entre o Ultralytics YOLOv8 e o YOLO, dois modelos topo de gama, analisando as suas arquitecturas, desempenho e aplicações.
Ultralytics YOLOv8
Ultralytics YOLOv8 é a mais recente iteração da série YOLO , conhecida pelo seu equilíbrio entre velocidade e precisão na deteção de objectos e outras tarefas de visão, como a segmentação de instâncias e a estimativa de pose. Desenvolvido por Glenn Jocher, Ayush Chaurasia e Jing Qiu da Ultralytics e lançado em 2023-01-10, YOLOv8 baseia-se nas versões anteriores YOLO com melhorias arquitectónicas e um enfoque na facilidade de utilização. A sua documentação realça a facilidade de utilização e a versatilidade, tornando-o adequado para uma vasta gama de aplicações e utilizadores, desde principiantes a especialistas.
Pontos fortes:
- Desempenho: YOLOv8 alcança um mAP de última geração, mantendo velocidades de inferência impressionantes. Oferece vários tamanhos de modelos (n, s, m, l, x) para se adaptar a diferentes necessidades computacionais.
- Versatilidade: Para além da deteção de objectos, YOLOv8 suporta múltiplas tarefas de visão, incluindo segmentação, classificação e estimativa de pose, fornecendo uma solução unificada para diversas necessidades de visão computacional.
- Facilidade de uso: Ultralytics fornece documentação e ferramentas abrangentes, simplificando o treinamento, a implantação e a integração com plataformas como o Ultralytics HUB.
- Apoio da comunidade: Uma comunidade de código aberto grande e ativa garante uma melhoria contínua e um amplo apoio.
Pontos fracos:
- Intensivo em termos de recursos: Os modelos YOLOv8 de maiores dimensões requerem recursos computacionais significativos para treino e inferência.
- Necessidades de otimização: Para dispositivos com recursos extremamente limitados, pode ser necessária uma otimização adicional, como a redução de modelos.
Casos de utilização:
A versatilidade do YOLOv8 torna-o ideal para um vasto espetro de aplicações, desde a análise de vídeo em tempo real em sistemas de segurança e cidades inteligentes até tarefas complexas nos cuidados de saúde e fabrico. A sua facilidade de utilização também o torna excelente para prototipagem e desenvolvimento rápidos.
DAMO-YOLO
YOLO é um modelo de deteção de objetos desenvolvido pelo Alibaba Group e apresentado em um artigo publicado no ArXiv em 2022-11-23. De autoria de Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun, YOLO se concentra na criação de um detetor rápido e preciso, empregando técnicas inovadoras. Estas incluem backbones baseados em NAS, um RepGFPN eficiente e um ZeroHead, juntamente com estratégias de treinamento avançadas como AlignedOTA e aprimoramento de destilação. A documentação oficial e o repositório GitHub fornecem detalhes sobre sua arquitetura e implementação.
Pontos fortes:
- Elevada precisão: A YOLO foi concebida para uma elevada precisão, alcançando pontuações mAP competitivas, destacando-se particularmente em cenários que requerem uma deteção precisa de objectos.
- Design eficiente: Inovações arquitectónicas como o ZeroHead contribuem para um modelo simplificado, equilibrando a precisão com a eficiência computacional.
- Técnicas avançadas: Incorpora técnicas de ponta como a Pesquisa de Arquitetura Neural (NAS) para a conceção de backbone e AlignedOTA para formação optimizada.
Pontos fracos:
- Versatilidade de tarefas limitada: Focado principalmente na deteção de objectos, não possui as capacidades multitarefa do YOLOv8.
- Documentação e comunidade: Em comparação com o YOLOv8, o YOLO pode ter uma comunidade mais pequena e uma documentação menos extensa, o que pode colocar desafios aos novos utilizadores ou aos que procuram um apoio alargado.
- Velocidade de inferência: Embora eficientes, as comparações diretas de velocidade com o YOLOv8 em benchmarks padrão estão menos disponíveis e a velocidade pode variar com base em implementações e hardware específicos.
Casos de utilização:
O YOLO é adequado para aplicações em que é fundamental uma elevada precisão de deteção, como na condução autónoma, inspeção industrial de alta precisão e sistemas avançados de vigilância por vídeo. O seu foco na precisão e eficiência torna-o um forte concorrente para cenários em que a deteção detalhada e fiável de objectos é crucial.
Tabela de comparação de desempenho
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Conclusão
Tanto YOLOv8 como o YOLO são modelos poderosos de deteção de objectos. YOLOv8 destaca-se pela sua versatilidade, facilidade de utilização e forte comunidade, tornando-o adequado para uma vasta gama de tarefas e cenários de desenvolvimento. O YOLO distingue-se pela sua precisão e design eficiente, o que o torna uma boa escolha para aplicações que exigem uma deteção precisa de objectos. Os utilizadores interessados noutros modelos podem também considerar o YOLOv7, YOLOv9 ou YOLOX, dependendo das suas necessidades e prioridades específicas.