Link to this sectionمجموعة بيانات Argoverse#

Name: مجموعة بيانات اكتشاف Argoverse
Creator: Argo AI
License: https://creativecommons.org/licenses/by-nc-sa/4.0/
Keywords: مجموعة بيانات Argoverse, Argoverse-HD, اكتشاف الكائنات, اكتشاف ثنائي الأبعاد, القيادة الذاتية, مجموعة بيانات سيارة ذاتية القيادة, YOLO26, اكتشاف حركة المرور, Ultralytics

مجموعة بيانات Ultralytics Argoverse (Argoverse-HD) هي مجموعة بيانات لاكتشاف الكائنات ثنائية الأبعاد تتكون من 54,446 صورة مصنفة للقيادة الذاتية — 39,384 للتدريب و15,062 للتحقق من الصحة — موزعة على 8 فئات: شخص، دراجة، سيارة، دراجة نارية، حافلة، شاحنة، إشارة مرور، وعلامة توقف. يتم التقاط الصور من كاميرا المركبة المركزية الأمامية، وتأتي التعليقات التوضيحية من مشروع الإدراك المتدفق التابع لجامعة كارنيجي ميلون، والمبني على بيانات القيادة Argoverse 1.1 الخاصة بـ Argo AI. وهي معيار مرجعي ضخم وواقعي لتدريب نماذج رؤية الحاسوب لاكتشاف كائنات الطريق في سيناريوهات القيادة الذاتية.

يتطلب تنزيلاً يدوياً

تمت إزالة ملف *.zip الخاص بـ Argoverse-HD (~31.5 جيجابايت) اللازم للتدريب من Amazon S3 بعد إغلاق شركة Argo AI بواسطة Ford. وهو متاح للتنزيل اليدوي من Google Drive — التنزيل التلقائي لن يعمل، لذا قم بتنزيل الأرشيف قبل التدريب.

Link to this sectionالميزات الرئيسية#

8 فئات لاكتشاف الكائنات: شخص، دراجة، سيارة، دراجة نارية، حافلة، شاحنة، إشارة مرور، وعلامة توقف.
54,446 صورة مصنفة — 39,384 للتدريب و15,062 للتحقق من الصحة — بالإضافة إلى مجموعة اختبار غير مصنفة مخصصة لـ تحدي eval.ai.
~31.5 جيجابايت من إطارات الكاميرا المركزية الأمامية عالية الدقة الملتقطة في مشاهد القيادة الذاتية الحضرية.
يتم تحويل التعليقات التوضيحية إلى تنسيق YOLO تلقائياً عند الاستخدام لأول مرة، لذا فإن مجموعة البيانات تتدرب مباشرة باستخدام نماذج اكتشاف Ultralytics YOLO.

Link to this sectionهيكل مجموعة البيانات#

تم تقسيم مجموعة بيانات Argoverse-HD إلى ثلاث مجموعات فرعية محددة مسبقاً، محددة بواسطة ملف التكوين Argoverse.yaml:

التقسيم (Split)	الصور	التسميات
التدريب	39,384	نعم
التحقق	15,062	نعم
الاختبار (Test)	—	غير مصنف (تحدي eval.ai)

تشترك جميع الصور في نفس فئات الكائنات الثمانية (الفهارس 0–7): شخص، دراجة، سيارة، دراجة نارية، حافلة، شاحنة، إشارة مرور، وعلامة توقف.

التحويل التلقائي إلى YOLO

بعد التنزيل اليدوي، تقوم Ultralytics بتحويل تعليقات Argoverse-HD التوضيحية الأصلية إلى تسميات اكتشاف YOLO تلقائياً في أول مرة تقوم فيها بالتدريب، لذا لا يلزم إجراء معالجة مسبقة يدوية.

Link to this sectionالتطبيقات#

تدعم مجموعة بيانات Argoverse-HD مجموعة من تطبيقات اكتشاف الكائنات في القيادة الذاتية:

إدراك القيادة الذاتية — اكتشاف المركبات والمشاة وراكبي الدراجات من كاميرا أمامية لدعم الملاحة في المركبات ذاتية القيادة.
أنظمة مساعدة السائق المتقدمة (ADAS) — التعرف على إشارات المرور وعلامات التوقف لتنبيه السائق في الوقت الفعلي.
مراقبة حركة المرور — عد وتتبع مستخدمي الطريق في المشاهد الحضرية لتحليلات المدن الذكية.
البحث والنماذج الأولية — معيار مرجعي ضخم وواقعي لتعلم تدريب النموذج والتنبؤ على بيانات القيادة.

Link to this sectionYAML مجموعة البيانات#

يُحدد ملف YAML تكوين مجموعة البيانات، بما في ذلك المسارات والفئات والتفاصيل الأخرى ذات الصلة. بالنسبة لمجموعة بيانات Argoverse، يتم الاحتفاظ بملف Argoverse.yaml في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/Argoverse.yaml.

ultralytics/cfg/datasets/Argoverse.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Argoverse-HD dataset (ring-front-center camera) by Argo AI: https://www.cs.cmu.edu/~mengtial/proj/streaming/
# Documentation: https://docs.ultralytics.com/datasets/detect/argoverse
# Example usage: yolo train data=Argoverse.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── Argoverse ← downloads here (31.5 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: Argoverse # dataset root dir
train: Argoverse-1.1/images/train/ # train images (relative to 'path') 39384 images
val: Argoverse-1.1/images/val/ # val images (relative to 'path') 15062 images
test: Argoverse-1.1/images/test/ # test images (optional) https://eval.ai/web/challenges/challenge-page/800/overview

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: bus
  5: truck
  6: traffic_light
  7: stop_sign

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  import json
  from pathlib import Path

  from ultralytics.utils import TQDM
  from ultralytics.utils.downloads import download

  def argoverse2yolo(annotation_file):
      """Convert Argoverse dataset annotations to YOLO format for object detection tasks."""
      labels = {}
      with open(annotation_file, encoding="utf-8") as f:
          a = json.load(f)
      for annot in TQDM(a["annotations"], desc=f"Converting {annotation_file} to YOLO format..."):
          img_id = annot["image_id"]
          img_name = a["images"][img_id]["name"]
          img_label_name = f"{Path(img_name).stem}.txt"

          cls = annot["category_id"]  # instance class id
          x_center, y_center, width, height = annot["bbox"]
          x_center = (x_center + width / 2) / 1920.0  # offset and scale
          y_center = (y_center + height / 2) / 1200.0  # offset and scale
          width /= 1920.0  # scale
          height /= 1200.0  # scale

          img_dir = annotation_file.parents[2] / "Argoverse-1.1" / "labels" / a["seq_dirs"][a["images"][annot["image_id"]]["sid"]]
          if not img_dir.exists():
              img_dir.mkdir(parents=True, exist_ok=True)

          k = str(img_dir / img_label_name)
          if k not in labels:
              labels[k] = []
          labels[k].append(f"{cls} {x_center} {y_center} {width} {height}\n")

      for k in labels:
          with open(k, "w", encoding="utf-8") as f:
              f.writelines(labels[k])

  # Download 'https://argoverse-hd.s3.amazonaws.com/Argoverse-HD-Full.zip' (deprecated S3 link)
  dir = Path(yaml["path"])  # dataset root dir
  urls = ["https://drive.google.com/file/d/1st9qW3BeIwQsnR0t8mRpvbsSWIo16ACi/view?usp=drive_link"]
  print("\n\nWARNING: Argoverse dataset MUST be downloaded manually, autodownload will NOT work.")
  print(f"WARNING: Manually download Argoverse dataset '{urls[0]}' to '{dir}' and re-run your command.\n\n")
  # download(urls, dir=dir)

  # Convert
  annotations_dir = "Argoverse-HD/annotations/"
  (dir / "Argoverse-1.1" / "tracking").rename(dir / "Argoverse-1.1" / "images")  # rename 'tracking' to 'images'
  for d in "train.json", "val.json":
      argoverse2yolo(dir / annotations_dir / d)  # convert Argoverse annotations to YOLO labels

Link to this sectionالاستخدام#

لتدريب نموذج YOLO26n على مجموعة بيانات Argoverse لمدة 100 حقبة (epoch) بحجم صورة 640، استخدم نماذج التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="Argoverse.yaml", epochs=100, imgsz=640)

بمجرد التدريب، قم بتشغيل الاستدلال باستخدام النموذج المضبوط بدقة على صور أو فيديو قيادة جديد:

مثال على الاستدلال (Inference)

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load an Argoverse fine-tuned model

# Inference using the model
results = model.predict("path/to/driving-scene.jpg")

Link to this sectionعينة من البيانات والتعليقات#

تحتوي مجموعة بيانات Argoverse-HD على صور قيادة عالية الدقة ملتقطة من كاميرا مركزية أمامية، ومؤشرة بصناديق إحاطة ثنائية الأبعاد لفئات الكائنات الثمانية. فيما يلي صورة نموذجية من مجموعة البيانات مع التعليقات التوضيحية المقابلة لها:

مشهد قيادة ذاتية Argoverse-HD مع كائنات طريق مشروحة

مشهد قيادة مشروح: توضح هذه الصورة كائنات الطريق — مثل المركبات والمشاة — مصنفة بصناديق إحاطة ثنائية الأبعاد، وهو التنسيق الذي تتعلم نماذج YOLO التنبؤ به أثناء التدريب.

Link to this sectionالاقتباسات والشكر#

تأتي تعليقات اكتشاف Argoverse-HD ثنائية الأبعاد المستخدمة في مجموعة البيانات هذه من عمل الإدراك المتدفق لجامعة كارنيجي ميلون. إذا كنت تستخدم مجموعة البيانات في بحثك أو تطويرك، يرجى الاستشهاد بها:

اقتباس

@inproceedings{li2020towards,
  title={Towards Streaming Perception},
  author={Li, Mengtian and Wang, Yu-Xiong and Ramanan, Deva},
  booktitle={Proceedings of the European Conference on Computer Vision (ECCV)},
  pages={473--488},
  year={2020}
}

@inproceedings{chang2019argoverse,
  title={Argoverse: 3D Tracking and Forecasting with Rich Maps},
  author={Chang, Ming-Fang and Lambert, John and Sangkloy, Patsorn and Singh, Jagjeet and Bak, Slawomir and Hartnett, Andrew and Wang, Dequan and Carr, Peter and Lucey, Simon and Ramanan, Deva and others},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={8748--8757},
  year={2019}
}

نود أن نعرب عن تقديرنا لجامعة كارنيجي ميلون على تعليقات اكتشاف Argoverse-HD التوضيحية ولـ Argo AI لإنشاء مجموعة بيانات Argoverse الأصلية كمورد قيم لمجتمع أبحاث القيادة الذاتية.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعة بيانات Argoverse، وما الغرض منها؟#

مجموعة بيانات Ultralytics Argoverse (Argoverse-HD) هي مجموعة بيانات لاكتشاف الكائنات ثنائية الأبعاد تتكون من 54,446 صورة للقيادة الذاتية موزعة على 8 فئات — شخص، دراجة، سيارة، دراجة نارية، حافلة، شاحنة، إشارة مرور، وعلامة توقف. تُستخدم لتدريب وتقييم النماذج التي تكتشف كائنات الطريق من كاميرا مركبة أمامية، مما يدعم أبحاث إدراك القيادة الذاتية، وADAS، ومراقبة حركة المرور.

Link to this sectionكم عدد الفئات والصور الموجودة في مجموعة بيانات Argoverse؟#

تحتوي مجموعة بيانات Argoverse-HD على 8 فئات (شخص، دراجة، سيارة، دراجة نارية، حافلة، شاحنة، إشارة مرور، وعلامة توقف) و54,446 صورة مصنفة — 39,384 للتدريب و15,062 للتحقق من الصحة — بالإضافة إلى مجموعة اختبار غير مصنفة مخصصة لتحدي eval.ai.

Link to this sectionهل مجموعة بيانات Argoverse لاكتشاف ثنائي الأبعاد أم ثلاثي الأبعاد في Ultralytics؟#

في Ultralytics، هي مجموعة بيانات اكتشاف كائنات ثنائية الأبعاد (إطارات كاميرا Argoverse-HD مع صناديق إحاطة ثنائية الأبعاد)، وليست مجموعة أبحاث التتبع ثلاثي الأبعاد أو التنبؤ بالحركة أو LiDAR من برنامج Argoverse الأوسع. يمكنك تدريبها باستخدام نموذج اكتشاف قياسي مثل yolo26n.pt.

Link to this sectionكيف يمكنني تدريب نموذج YOLO26 باستخدام مجموعة بيانات Argoverse؟#

قم بتنزيل مجموعة البيانات يدوياً أولاً (انظر أدناه)، ثم تدرب باستخدام ملف التكوين Argoverse.yaml:

مثال

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="Argoverse.yaml", epochs=100, imgsz=640)

للحصول على شرح مفصل للوسيطات، راجع صفحة التدريب للنموذج.

Link to this sectionأين يمكنني تنزيل مجموعة بيانات Argoverse الآن بعد أن تمت إزالتها من Amazon S3؟#

ملف *.zip الخاص بـ Argoverse-HD (~31.5 جيجابايت)، الذي كان مستضافاً سابقاً على Amazon S3، يمكن الآن تنزيله يدوياً من Google Drive. التنزيل التلقائي لن يعمل، لذا احصل على الأرشيف قبل تشغيل أمر التدريب الخاص بك.

Link to this sectionهل يمكنني استخدام مجموعة بيانات Argoverse مع منصة Ultralytics؟#

نعم. تتيح لك منصة Ultralytics تحميل مجموعات البيانات الضخمة مثل Argoverse-HD وإصدارها، ثم تدريب ونشر نماذج اكتشاف الكائنات في السحابة دون إعداد محلي ثقيل. يمكنك أيضاً تصفح مجموعات البيانات ذات الصلة في نظرة عامة على مجموعات بيانات الاكتشاف.

المساهمون

GLglenn-jocher¹³ RAraimbekovm³ MAMatthewNoyce¹ RIRizwanMunawar¹

تم الإنشاء 12 نوفمبر 2023تم التحديث أول أمس