Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet vs YOLOv9#

Il panorama della computer vision è stato plasmato da continui progressi nella progettazione di reti neurali. Trovare il giusto equilibrio tra efficienza computazionale e accuratezza di rilevamento è fondamentale quando si seleziona un modello. EfficientDet di Google ha stabilito un solido punto di riferimento nel 2019 introducendo architetture scalabili, mentre YOLOv9, rilasciato nel 2024, ha spostato i confini del rilevamento oggetti utilizzando la Programmable Gradient Information (PGI).

Questa guida fornisce un confronto tecnico completo tra questi due modelli e introduce il moderno framework Ultralytics YOLO26, che offre una soluzione robusta end-to-end ottimizzata per ambienti di produzione.

Link to this sectionArchitetture dei modelli e innovazioni#

Comprendere i meccanismi alla base di EfficientDet e YOLOv9 è essenziale per determinare i loro casi d'uso ottimali.

Link to this sectionEfficientDet: Ridimensionamento composto e BiFPN#

Sviluppato da Google Research, EfficientDet si concentra sullo scaling sistematico e sulla fusione efficiente delle caratteristiche. Utilizza EfficientNet come backbone e introduce una nuova architettura di rete per le caratteristiche.

  • Autori: Mingxing Tan, Ruoming Pang e Quoc V. Le
  • Organizzazione: Google
  • Data: 20 novembre 2019
  • Link: Arxiv, GitHub

Caratteristiche architetturali chiave: EfficientDet si affida pesantemente a una Bi-directional Feature Pyramid Network (BiFPN), che consente una fusione multiscala delle caratteristiche facile e veloce. Accanto a questo, utilizza un metodo di compound scaling che scala uniformemente la risoluzione, la profondità e la larghezza della rete. Sebbene altamente accurato per l'epoca, EfficientDet è fortemente legato ai vecchi ambienti TensorFlow, rendendo complessi i moderni workflow di deployment.

Scopri di più su EfficientDet

Link to this sectionYOLOv9: Risolvere il collo di bottiglia dell'informazione#

Sviluppato dai ricercatori dell'Academia Sinica, YOLOv9 affronta il degrado delle informazioni man mano che i dati passano attraverso le reti neurali profonde.

  • Autori: Chien-Yao Wang e Hong-Yuan Mark Liao
  • Organizzazione: Institute of Information Science, Academia Sinica
  • Data: 21 febbraio 2024
  • Link: Arxiv, GitHub, Docs

Caratteristiche architetturali chiave: YOLOv9 introduce la Programmable Gradient Information (PGI) per fornire supervisione ausiliaria, assicurando che i dati cruciali vengano conservati per aggiornare i pesi della rete in modo affidabile. Presenta anche la Generalized Efficient Layer Aggregation Network (GELAN) per massimizzare l'efficienza dei parametri. Nonostante questi progressi, YOLOv9 richiede ancora la Non-Maximum Suppression (NMS) durante la post-elaborazione, il che aggiunge latenza.

Scopri di più su YOLOv9

Link to this sectionConfronto delle Prestazioni#

Quando valuti questi modelli, l'analisi dei dati empirici aiuta a determinare quale architettura fornisca il miglior compromesso per i tuoi specifici requisiti hardware.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionAnalisi critica#

YOLOv9 fornisce un salto generazionale in termini di velocità. Ad esempio, YOLOv9e raggiunge un 55.6% mAP con una latenza TensorRT di 16.77ms. Al contrario, EfficientDet-d7 offre un mAP inferiore del 53.7% ma soffre di una latenza massiccia (128.07ms), rendendolo estremamente difficile da distribuire per flussi video in tempo reale.

Esportazione dei modelli per la produzione

Esportare la tua architettura in formati ottimizzati come TensorRT o OpenVINO riduce drasticamente i tempi di inferenza rispetto all'esecuzione in PyTorch puro.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra EfficientDet e YOLOv9 dipende dai requisiti specifici del tuo progetto, dai vincoli di deployment e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere EfficientDet#

EfficientDet è una scelta solida per:

  • Pipeline Google Cloud e TPU: Sistemi profondamente integrati con le API di Google Cloud Vision o l'infrastruttura TPU, dove EfficientDet offre un'ottimizzazione nativa.
  • Ricerca sul Compound Scaling: Benchmarking accademico focalizzato sullo studio degli effetti della profondità della rete, della larghezza e del ridimensionamento della risoluzione.
  • Deployment mobile tramite TFLite: Progetti che richiedono specificamente l'esportazione verso TensorFlow Lite per dispositivi Android o Linux embedded.

Link to this sectionQuando scegliere YOLOv9#

YOLOv9 è consigliato per:

  • Ricerca sul collo di bottiglia dell'informazione: Progetti accademici che studiano le architetture Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Studi sull'ottimizzazione del flusso di gradienti: Ricerca focalizzata sulla comprensione e sulla mitigazione della perdita di informazioni negli strati profondi della rete durante l'addestramento.
  • Benchmarking del rilevamento ad alta precisione: Scenari in cui le forti prestazioni del benchmark COCO di YOLOv9 sono necessarie come punto di riferimento per i confronti architettonici.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl vantaggio Ultralytics: Scegliere YOLO26#

Sebbene YOLOv9 ed EfficientDet abbiano aperto la strada, gli sviluppatori alla ricerca di un framework veramente moderno e pronto per la produzione dovrebbero considerare i modelli YOLO di Ultralytics, in particolare il nuovo YOLO26.

La Piattaforma Ultralytics offre una facilità d'uso senza pari, combinando potenti script di addestramento locali con un'interfaccia basata su cloud. YOLO26 rappresenta una massiccia revisione nella progettazione dei modelli, rendendo obsolete le architetture più vecchie per molte applicazioni commerciali.

Link to this sectionPunti salienti tecnici di YOLO26#

  • Design end-to-end senza NMS: YOLO26 elimina completamente i colli di bottiglia della post-elaborazione. Rimuovendo la Non-Maximum Suppression, i grafi di distribuzione sono unificati e intrinsecamente più veloci sui chip AI edge.
  • Inferenza CPU fino al 43% più veloce: Altamente ottimizzato per dispositivi embedded, il che lo rende sostanzialmente più veloce sia di YOLOv9 che di EfficientDet quando le GPU non sono disponibili.
  • Ottimizzatore MuSGD: Integrando le innovazioni LLM nell'AI visiva, questo ottimizzatore ibrido stabilizza le sessioni di addestramento, consentendo ai modelli di convergere più velocemente con meno risorse.
  • Bassi requisiti di memoria: A differenza delle architetture basate su Transformer o CNN non ottimizzate, YOLO26 minimizza il consumo di memoria CUDA durante l'addestramento, consentendoti di utilizzare batch size maggiori su hardware di livello consumer.
  • ProgLoss + STAL: Il design superiore della funzione di perdita aumenta drasticamente l'accuratezza per il rilevamento di piccoli oggetti, rendendo YOLO26 ideale per immagini aeree e reti IoT.
  • Rimozione DFL: Il design strutturale semplificato consente una conversione senza attrito verso formati di distribuzione mobile.

Scopri di più su YOLO26

Altre opzioni robuste nell'ecosistema Ultralytics includono YOLO11 e YOLOv8, che forniscono anche versatilità multi-task come segmentazione di istanze e stima della posa.

Link to this sectionAddestramento semplificato con il Python SDK#

I modelli Ultralytics danno priorità all'esperienza dello sviluppatore. L'addestramento di un modello allo stato dell'arte è condensato in poche righe di Python.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Link to this sectionApplicazioni nel mondo reale#

La scelta tra queste architetture dipende fortemente dal tuo obiettivo di deployment.

  • Deployment Cloud Legacy: EfficientDet era popolare per l'elaborazione batch offline basata su cloud, dove era necessaria un'elevata accuratezza e non esistevano rigidi vincoli di tempo reale.
  • Ricerca accademica: YOLOv9 rimane una scelta interessante per i ricercatori che spingono i limiti teorici delle CNN e analizzano i flussi di gradiente attraverso gli strati della rete.
  • Edge Computing e IoT: YOLO26 domina le applicazioni del mondo reale. La sua pipeline senza NMS e le funzionalità Oriented Bounding Box (OBB) lo rendono l'opzione superiore per l'analisi del traffico nelle smart city, il monitoraggio dell'inventario al dettaglio e l'ispezione basata su droni, offrendo un equilibrio imbattibile tra elevata accuratezza e rapide velocità di inferenza.
Contributori

Commenti