Poz Tahmini
Poz tahmini, genellikle anahtar noktalar olarak adlandırılan, bir görüntüdeki belirli noktaların konumunun belirlenmesini içeren bir görevdir. Anahtar noktalar, eklemler, yer işaretleri veya diğer ayırt edici özellikler gibi nesnenin çeşitli kısımlarını temsil edebilir. Anahtar noktaların konumları genellikle bir dizi 2D [x, y]
veya 3D [x, y, visible]
Koordinatlar.
Bir poz tahmin modelinin çıktısı, genellikle her nokta için güven puanlarıyla birlikte görüntüdeki bir nesne üzerindeki kilit noktaları temsil eden bir dizi noktadır. Poz tahmini, bir sahnedeki bir nesnenin belirli parçalarını ve bunların birbirlerine göre konumlarını belirlemeniz gerektiğinde iyi bir seçimdir.
İzle: Ultralytics YOLO11 Poz Tahmini Eğitimi | Gerçek Zamanlı Nesne Takibi ve İnsan Pozu Tespiti
İpucu
YOLO11 poz modellerinde -pose
son ek, yani yolo11n-pose.pt
. Bu modeller aşağıdakiler üzerinde eğitilir COCO kilit noktaları veri kümesi ve çeşitli poz tahmin görevleri için uygundur.
Varsayılan YOLO11 poz modelinde, her biri insan vücudunun farklı bir bölümünü temsil eden 17 anahtar nokta vardır. Her bir indeksin ilgili vücut eklemine eşlenmesi aşağıda verilmiştir:
- Burun
- Sol Göz
- Sağ Göz
- Sol Kulak
- Sağ Kulak
- Sol Omuz
- Sağ Omuz
- Sol Dirsek
- Sağ Dirsek
- Sol Bilek
- Sağ Bilek
- Sol Kalça
- Sağ Kalça
- Sol Diz
- Sağ Diz
- Sol Ayak Bileği
- Sağ Ayak Bileği
Modeller
Ultralytics YOLO11 ön eğitimli Poz modelleri burada gösterilmektedir. Detect, Segment ve Pose modelleri COCO veri kümesi üzerinde, Classify modelleri ise ImageNet veri kümesi üzerinde ön eğitime tabi tutulmuştur.
Modeller ilk kullanımda en son Ultralytics sürümünden otomatik olarak indirilir.
Model | boyut (piksel) |
mAPpose 50-95 |
mAPpose 50 |
Hız CPU ONNX (ms) |
Hız T4TensorRT10 (ms) |
params (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|---|
YOLO11n-pozu | 640 | 50.0 | 81.0 | 52.4 ± 0.5 | 1.7 ± 0.0 | 2.9 | 7.6 |
YOLO11s-pose | 640 | 58.9 | 86.3 | 90.5 ± 0.6 | 2.6 ± 0.0 | 9.9 | 23.2 |
YOLO11m-pose | 640 | 64.9 | 89.4 | 187.3 ± 0.8 | 4.9 ± 0.1 | 20.9 | 71.7 |
YOLO11l-poz | 640 | 66.1 | 89.9 | 247.7 ± 1.1 | 6.4 ± 0.1 | 26.2 | 90.7 |
YOLO11x-pose | 640 | 69.5 | 91.1 | 488.0 ± 13.9 | 12.1 ± 0.2 | 58.8 | 203.3 |
- mAPval değerleri tek model tek ölçek içindir. COCO Kilit Noktalar val2017 veri kümesi.
Tarafından çoğaltınyolo val pose data=coco-pose.yaml device=0
- Hız kullanılarak COCO val görüntüleri üzerinde ortalaması alınmıştır. Amazon EC2 P4d örnek.
Tarafından çoğaltınyolo val pose data=coco-pose.yaml batch=1 device=0|cpu
Tren
YOLO11 veri kümesi üzerinde bir YOLO11 modeli eğitin. COCO8-pose veri kümesi, poz tahmin modellerinizi test etmek ve hata ayıklamak için mükemmel olan küçük bir örnek veri kümesidir.
Örnek
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.yaml") # build a new model from YAML
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n-pose.yaml").load("yolo11n-pose.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Build a new model from YAML and start training from scratch
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.yaml epochs=100 imgsz=640
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
# Build a new model from YAML, transfer pretrained weights to it and start training
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.yaml pretrained=yolo11n-pose.pt epochs=100 imgsz=640
Veri kümesi formatı
YOLO poz veri kümesi formatı, Veri Kümesi Kılavuzunda ayrıntılı olarak bulunabilir. Mevcut veri setinizi diğer formatlardan ( COCO vb.) YOLO formatına dönüştürmek için lütfen Ultralytics'in JSON2YOLO aracını kullanın.
Özel poz tahmini görevleri için, hayvan pozu tahmini için Tiger-Pose, el takibi için Hand Keypoints veya köpek pozu analizi için Dog-Pose gibi özel veri kümelerini de keşfedebilirsiniz.
Val
Eğitilmiş YOLO11n-poz modelini doğrulayın doğruluk COCO8-pose veri kümesi üzerinde. Hiçbir argüman gerekmez çünkü model
eğitimini sürdürür data
ve model öznitelikleri olarak argümanlar.
Örnek
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
metrics.box.map # map50-95
metrics.box.map50 # map50
metrics.box.map75 # map75
metrics.box.maps # a list contains map50-95 of each category
Tahmin Et
Görüntüler üzerinde tahminler yürütmek için eğitilmiş bir YOLO11n-pose modeli kullanın. Tahmin modu görüntüler, videolar veya gerçek zamanlı akışlar üzerinde çıkarım yapmanıza olanak tanır.
Örnek
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg") # predict on an image
# Access the results
for result in results:
xy = result.keypoints.xy # x and y coordinates
xyn = result.keypoints.xyn # normalized
kpts = result.keypoints.data # x, y, visibility (if available)
Tamamı görün predict
modunun ayrıntıları Tahmin Et Sayfa.
İhracat
Bir YOLO11n Pose modelini ONNX, CoreML vb. gibi farklı bir formata aktarın. Bu, modelinizi gerçek zamanlı çıkarım için çeşitli platformlara ve cihazlara dağıtmanıza olanak tanır.
Örnek
Mevcut YOLO11-pose dışa aktarma formatları aşağıdaki tabloda yer almaktadır. kullanarak herhangi bir formata dışa aktarabilirsiniz. format
argümanı, yani format='onnx'
veya format='engine'
. Doğrudan dışa aktarılan modeller üzerinde tahmin veya doğrulama yapabilirsiniz, örn. yolo predict model=yolo11n-pose.onnx
. Dışa aktarma tamamlandıktan sonra modeliniz için kullanım örnekleri gösterilir.
Biçim | format Tartışma |
Model | Metadata | Argümanlar |
---|---|---|---|---|
PyTorch | - | yolo11n-pose.pt |
✅ | - |
TorchScript | torchscript |
yolo11n-pose.torchscript |
✅ | imgsz , optimize , nms , batch |
ONNX | onnx |
yolo11n-pose.onnx |
✅ | imgsz , half , dynamic , simplify , opset , nms , batch |
OpenVINO | openvino |
yolo11n-pose_openvino_model/ |
✅ | imgsz , half , dynamic , int8 , nms , batch , data |
TensorRT | engine |
yolo11n-pose.engine |
✅ | imgsz , half , dynamic , simplify , workspace , int8 , nms , batch , data |
CoreML | coreml |
yolo11n-pose.mlpackage |
✅ | imgsz , half , int8 , nms , batch |
TF SavedModel | saved_model |
yolo11n-pose_saved_model/ |
✅ | imgsz , keras , int8 , nms , batch |
TF GraphDef | pb |
yolo11n-pose.pb |
❌ | imgsz , batch |
TF Lite | tflite |
yolo11n-pose.tflite |
✅ | imgsz , half , int8 , nms , batch , data |
TF Kenar TPU | edgetpu |
yolo11n-pose_edgetpu.tflite |
✅ | imgsz |
TF.js | tfjs |
yolo11n-pose_web_model/ |
✅ | imgsz , half , int8 , nms , batch |
PaddlePaddle | paddle |
yolo11n-pose_paddle_model/ |
✅ | imgsz , batch |
MNN | mnn |
yolo11n-pose.mnn |
✅ | imgsz , batch , int8 , half |
NCNN | ncnn |
yolo11n-pose_ncnn_model/ |
✅ | imgsz , half , batch |
IMX500 | imx |
yolo11n-pose_imx_model/ |
✅ | imgsz , int8 , data |
RKNN | rknn |
yolo11n-pose_rknn_model/ |
✅ | imgsz , batch , name |
Tamamı görün export
detaylar İhracat Sayfa.
SSS
Ultralytics YOLO11 ile Poz Tahmini nedir ve nasıl çalışır?
Ultralytics YOLO11 ile poz tahmini, bir görüntüde anahtar noktalar olarak bilinen belirli noktaların tanımlanmasını içerir. Bu anahtar noktalar tipik olarak eklemleri veya nesnenin diğer önemli özelliklerini temsil eder. Çıktı şunları içerir [x, y]
koordinatları ve her nokta için güven puanları. YOLO11-pose modelleri bu görev için özel olarak tasarlanmıştır ve -pose
son eki, örneğin yolo11n-pose.pt
. Bu modeller aşağıdaki gibi veri kümeleri üzerinde önceden eğitilmiştir COCO kilit noktaları ve çeşitli poz tahmini görevleri için kullanılabilir. Daha fazla bilgi için şu adresi ziyaret edin Poz Tahmini Sayfası.
Özel bir veri kümesi üzerinde YOLO11 amaçlı bir modeli nasıl eğitebilirim?
Özel bir veri kümesi üzerinde YOLO11 amaçlı bir modelin eğitilmesi, bir YAML dosyası tarafından tanımlanan yeni bir modelin veya önceden eğitilmiş bir modelin yüklenmesini içerir. Ardından, belirttiğiniz veri kümesini ve parametreleri kullanarak eğitim sürecini başlatabilirsiniz.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.yaml") # build a new model from YAML
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)
Eğitimle ilgili kapsamlı ayrıntılar için Eğitim Bölümüne bakın. Özel poz tahmin modellerini eğitmek için kodsuz bir yaklaşım için Ultralytics HUB 'ı da kullanabilirsiniz.
Eğitilmiş bir YOLO11-pose modelini nasıl doğrulayabilirim?
Bir YOLO11-pose modelinin doğrulanması, eğitim sırasında tutulan aynı veri seti parametrelerini kullanarak doğruluğunun değerlendirilmesini içerir. İşte bir örnek:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
Daha fazla bilgi için Val Bölümünü ziyaret edin.
Bir YOLO11-pose modelini diğer formatlara aktarabilir miyim ve nasıl?
Evet, bir YOLO11 modelini ONNX, CoreML, TensorRT ve daha fazlası gibi çeşitli formatlara aktarabilirsiniz. Bu işlem Python veya Komut Satırı Arayüzü (CLI) kullanılarak yapılabilir.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom trained model
# Export the model
model.export(format="onnx")
Daha fazla ayrıntı için Dışa Aktarma Bölümüne bakın. Dışa aktarılan modeller fitness takibi, spor analizi veya robotik gibi gerçek zamanlı uygulamalar için uç cihazlara yerleştirilebilir.
Mevcut Ultralytics YOLO11 -pose modelleri ve bunların performans ölçütleri nelerdir?
Ultralytics YOLO11 , diğerlerinin yanı sıra YOLO11n-pose, YOLO11s-pose, YOLO11m-pose gibi önceden eğitilmiş çeşitli poz modelleri sunar. Bu modeller boyut, doğruluk (mAP) ve hız açısından farklılık gösterir. Örneğin, YOLO11n-pose modeli 50,0'lık bir mAPpose50-95ve 81,0'lık bir mAPpose50elde eder. Tam liste ve performans ayrıntıları için Modeller Bölümünü ziyaret edin.