Zum Inhalt springen

EfficientDet vs. YOLOv10: Die Entwicklung der Echtzeit-Objekterkennung

Die Landschaft der Computervision hat sich zwischen der Veröffentlichung von Google EfficientDet im Jahr 2019 und YOLOv10 der Tsinghua-Universität YOLOv10 2024 dramatisch verändert. Für Entwickler und Forscher ist es entscheidend, den Weg von komplexen zusammengesetzten Skalierungen zu optimierten End-to-End-Architekturen zu verstehen, um das richtige Werkzeug für die jeweilige Aufgabe auszuwählen. Diese Analyse vergleicht die bisherige Präzision von EfficientDet mit der Innovation von YOLOv10 mit geringer Latenz. YOLOv10und zeigt gleichzeitig auf, wie moderne Lösungen wie Ultralytics neue Standards für Produktionsumgebungen setzen.

EfficientDet: Das Vermächtnis der Compound-Skalierung

EfficientDet wurde vom Google -Team veröffentlicht und stellte einen wichtigen Meilenstein bei der Optimierung der Effizienz neuronaler Netze dar. Es führte das Konzept des Compound Scaling ein, bei dem die Auflösung, Tiefe und Breite des Netzwerk-Backbones einheitlich skaliert werden, anstatt nur eine Dimension anzupassen.

Technische Details zu EfficientDet:

Das Herzstück von EfficientDet ist das bidirektionale Feature-Pyramiden-Netzwerk (BiFPN). Im Gegensatz zu herkömmlichen FPNs, die Merkmale aus verschiedenen Skalen summieren, ermöglicht BiFPN eine komplexe, gewichtete Merkmalsfusion, wodurch das Modell die Bedeutung verschiedener Eingabemerkmale lernen kann. Diese Architektur erreichte zwar zum damaligen Zeitpunkt die höchste durchschnittliche Präzision (mAP) im COCO , jedoch führen die komplexen Verbindungen der BiFPN-Schichten zu einem erheblichen Rechenaufwand, wodurch die Inferenz – insbesondere auf Edge-Geräten – im Vergleich zu modernen Architekturen langsamer ist.

YOLOv10: Die End-to-End-Revolution

YOLOv10, entwickelt von Forschern der Tsinghua-Universität, behebt den Hauptengpass früherer YOLO : Non-Maximum Suppression (NMS). Durch den Einsatz einer konsistenten Dual-Assignment-Strategie während des Trainings YOLOv10 , für jedes Objekt eine einzige optimale Begrenzungsbox vorherzusagen, und wird so zu einem NMS End-to-End-Detektor.

YOLOv10 Details YOLOv10 :

Diese architektonische Veränderung ermöglicht eine deutlich geringere Inferenzlatenz. Das Modell führt außerdem ein ganzheitliches, auf Effizienz und Genauigkeit ausgerichtetes Design ein, das große Kernel-Faltungen und partielle Selbstaufmerksamkeit nutzt, um die Leistung zu verbessern, ohne dass es zu einer Überlastung der Parameter kommt, wie sie bei älteren Modellen zu beobachten ist.

Erfahren Sie mehr über YOLOv10

Leistungsvergleich: Geschwindigkeit vs. Genauigkeit

Der Leistungsunterschied zwischen diesen beiden Modellgenerationen ist eklatant, insbesondere hinsichtlich der Inferenzgeschwindigkeit. Während EfficientDet-d7 eine hohe Genauigkeit bietet, geht dies mit einer enormen Latenz (über 100 ms) einher, während YOLOv10 eine ähnliche oder sogar bessere Genauigkeit in einem einstelligen Millisekundenbereich erzielen.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Architekturanalyse

  1. Nachbearbeitung: EfficientDet stützt sich stark auf NMS überlappende Boxen zu filtern. In dichten Szenen wird dieser Nachbearbeitungsschritt zu einem CPU , der die Gesamtlatenz unabhängig von GPU erhöht. DasNMS Design YOLOv10 macht diesen Schritt vollständig überflüssig.
  2. Speicherverbrauch: EfficientDet, insbesondere höhere Skalierungen wie d7, verbrauchen aufgrund der BiFPN-Struktur viel VRAM. YOLOv10 für einen geringeren Speicherbedarf optimiert und eignet sich daher besser für Edge-KI-Anwendungen.
  3. Optimierung: EfficientDet basiert auf TensorFlow kann beim Export in Formate wie ONNX TensorRT komplex sein, verglichen mit der nativen PyTorch moderner YOLOs.

Der Vorteil des Ultralytics-Ökosystems

YOLOv10 zwar beeindruckende architektonische Fortschritte, doch durch die Nutzung innerhalb des Ultralytics wird seine Nützlichkeit noch verstärkt. Entwickler haben oft mit der Fragmentierung akademischer Repositorien zu kämpfen. Ultralytics dieses Problem, indem es Modelle unter einem einzigen, gut gepflegten Python vereint.

Warum sollten Sie sich für das Ultralytics entscheiden?

  • Benutzerfreundlichkeit: Wechseln Sie mit einer einzigen Codezeile zwischen YOLOv8, YOLOv10, YOLO11 und YOLO26.
  • Trainingseffizienz: Vorab abgestimmte Hyperparameter und automatische Stapelgrößenverarbeitung sorgen für eine optimale Ressourcennutzung.
  • Bereit für den Einsatz: Export mit einem Klick zu TFLite, CoreML, OpenVINO und ONNX.
  • Ultralytics : Verwalten Sie Datensätze nahtlos, trainieren Sie in der Cloud und stellen Sie Modelle über die Ultralytics bereit.

Code-Beispiel

Die Ausführung von Inferenz mit Ultralytics auf Python ausgelegt und unkompliziert. So können Sie ein YOLOv10 laden und eine Vorhersage ausführen:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image from the internet
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Produktionsempfehlung: Upgrade auf YOLO26

Während EfficientDet als wichtiger historischer Maßstab dient und YOLOv10 das NMS Paradigma YOLOv10 , ist das Ultralytics Modell den Höhepunkt dieser Entwicklung für den produktiven Einsatz dar.

YOLO26 wurde im Januar 2026 veröffentlicht und baut auf dem NMS Durchbruch von YOLOv10 auf, verfeinert diesen YOLOv10 im Hinblick auf die Robustheit in der Praxis. Es verfügt über eine Entfernung der Distribution Focal Loss (DFL), wodurch das Modelldiagramm vereinfacht wird, um den Export zu erleichtern und eine bessere Kompatibilität mit Edge-Geräten mit geringem Stromverbrauch zu erreichen.

Darüber hinaus verfügt YOLO26 über den MuSGD-Optimierer, eine Mischung aus SGD Muon (inspiriert von LLM-Trainingsinnovationen), der eine schnellere Konvergenz und ein stabiles Training gewährleistet. Mit Optimierungen wie ProgLoss und STAL (Shape-aware Task Alignment Loss) bietet YOLO26 eine überlegene Erkennung kleiner Objekte und ist bei CPU bis zu 43 % schneller als frühere Generationen.

Erfahren Sie mehr über YOLO26

Anwendungsfälle in der Praxis

Die Wahl des richtigen Modells hängt von Ihren spezifischen Einschränkungen ab:

  • EfficientDet: Am besten geeignet für akademische Forschung, bei der die Untersuchung von Compound-Skalierung oder BiFPN-Architekturen erforderlich ist. Es findet sich auch in Altsystemen, bei denen die Kosten für die Migration die Leistungsvorteile neuerer Modelle überwiegen.
  • YOLOv10 YOLO26: Die ideale Wahl für Echtzeitanwendungen.
    • Robotik: Das NMS Design reduziert Latenzschwankungen, was für die Navigation und die Hindernisvermeidung von entscheidender Bedeutung ist.
    • Verkehrsüberwachung: Der hohe Durchsatz ermöglicht die Verarbeitung mehrerer Videostreams auf einer einzigen GPU Objektverfolgung.
    • Mobile Apps: Dank geringerer Parameteranzahl und geringerem Speicherverbrauch eignen sich diese Modelle ideal für den Einsatz auf iOS Android .

Für Entwickler, die das beste Gleichgewicht zwischen Geschwindigkeit, Genauigkeit und einfacher Bereitstellung suchen, ist der Umstieg auf Ultralytics oder YOLO11 empfohlen.


Kommentare