Ultralytics YOLO11
لمحة عامة
YOLO11 هو أحدث تكرار في Ultralytics YOLO سلسلة أجهزة الكشف عن الأجسام في الوقت الحقيقي، حيث يعيد تعريف ما هو ممكن بدقة وسرعة وكفاءة فائقة. بناءً على التطورات المذهلة للإصدارات السابقة من YOLO ، يقدم YOLO11 تحسينات كبيرة في البنية وأساليب التدريب، مما يجعله خيارًا متعدد الاستخدامات لمجموعة واسعة من مهام الرؤية الحاسوبية.
شاهد: كيفية استخدام Ultralytics YOLO11 لاكتشاف الأجسام وتتبعها | كيفية قياس الأداء | YOLO11 إصدار إصدار🚀
الميزات الرئيسية
- استخلاص الميزات المحسّن: YOLO11 يستخدم بنية محسّنة للعمود الفقري والرقبة مما يعزز قدرات استخلاص الميزات من أجل اكتشاف أكثر دقة للأجسام وأداء المهام المعقدة.
- مُحسَّن من أجل الكفاءة والسرعة: YOLO11 يقدم تصميمات معمارية مُحسَّنة وخطوط أنابيب تدريب مُحسَّنة، مما يوفر سرعات معالجة أسرع ويحافظ على التوازن الأمثل بين الدقة والأداء.
- دقة أكبر بمعلمات أقل: مع التقدم في تصميم النموذج، يحقق YOLO11m متوسط دقة أعلى على مجموعة بيانات COCO مع استخدام معلمات أقل بنسبة 22% من YOLOv8m ، مما يجعله فعالاً من الناحية الحسابية دون المساس بالدقة.
- القدرة على التكيّف عبر البيئات: يمكن نشر YOLO11 بسلاسة عبر بيئات مختلفة، بما في ذلك الأجهزة المتطورة والمنصات السحابية والأنظمة التي تدعم وحدات معالجة الرسومات NVIDIA ، مما يضمن أقصى قدر من المرونة.
- مجموعة واسعة من المهام المدعومة: سواء أكان الأمر يتعلق باكتشاف الأجسام، أو تجزئة المثيلات، أو تصنيف الصور، أو تقدير الوضع، أو اكتشاف الأجسام الموجهة (OBB)، تم تصميم YOLO11 لتلبية مجموعة متنوعة من تحديات الرؤية الحاسوبية.
المهام والأوضاع المدعومة
YOLO11 يعتمد على مجموعة الطرازات متعددة الاستخدامات التي تم تقديمها في YOLOv8 ، والتي تقدم دعمًا محسنًا لمختلف مهام الرؤية الحاسوبية:
الطراز | أسماء الملفات | المهمة | الاستدلال | التحقق من الصحة | التدريب | التصدير |
---|---|---|---|---|---|---|
YOLO11 | yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt |
الكشف | ✅ | ✅ | ✅ | ✅ |
YOLO11-سيج | yolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.pt |
تجزئة المثيل | ✅ | ✅ | ✅ | ✅ |
YOLO11-الغرض | yolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.pt |
الوضعية/النقاط الرئيسية | ✅ | ✅ | ✅ | ✅ |
YOLO11-أوب | yolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt |
الكشف الموجه | ✅ | ✅ | ✅ | ✅ |
YOLO11-Cls | yolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.pt |
التصنيف | ✅ | ✅ | ✅ | ✅ |
يقدم هذا الجدول لمحة عامة عن متغيرات نموذج YOLO11 ، ويعرض قابليتها للتطبيق في مهام محددة وتوافقها مع أوضاع التشغيل مثل الاستدلال والتحقق من الصحة والتدريب والتصدير. هذه المرونة تجعل YOLO11 مناسبًا لمجموعة واسعة من التطبيقات في مجال الرؤية الحاسوبية، بدءًا من الكشف في الوقت الحقيقي إلى مهام التجزئة المعقدة.
مقاييس الأداء
الأداء
راجع مستندات الكشف للاطلاع على أمثلة استخدام هذه النماذج المدرّبة على COCO، والتي تتضمن 80 فئة مدرّبة مسبقًا.
الطراز | الحجم (بكسل) |
مافال 50-95 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|
يولو 11 ن | 640 | 39.5 | 56.1 ± 0.8 | 1.5 ± 0.0 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 ± 1.2 | 2.5 ± 0.0 | 9.4 | 21.5 |
يولو 11 م | 640 | 51.5 | 183.2 ± 2.0 | 4.7 ± 0.1 | 20.1 | 68.0 |
يولو 11ل | 640 | 53.4 | 238.6 ± 1.4 | 6.2 ± 0.1 | 25.3 | 86.9 |
يولو11x | 640 | 54.7 | 462.8 ± 6.7 | 11.3 ± 0.2 | 56.9 | 194.9 |
راجع مستندات التجزئة للاطلاع على أمثلة استخدام هذه النماذج المدرّبة على COCO، والتي تتضمن 80 فئة مدرّبة مسبقًا.
الطراز | الحجم (بكسل) |
mAPbox 50-95 |
mAPmask 50-95 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|---|
YOLO11n-seg | 640 | 38.9 | 32.0 | 65.9 ± 1.1 | 1.8 ± 0.0 | 2.9 | 10.4 |
يولو 11-سيج | 640 | 46.6 | 37.8 | 117.6 ± 4.9 | 2.9 ± 0.0 | 10.1 | 35.5 |
YOLO11m-seg | 640 | 51.5 | 41.5 | 281.6 ± 1.2 | 6.3 ± 0.1 | 22.4 | 123.3 |
YOLO11l-seg | 640 | 53.4 | 42.9 | 344.2 ± 3.2 | 7.8 ± 0.2 | 27.6 | 142.2 |
YOLO11x-سيج | 640 | 54.7 | 43.8 | 664.5 ± 3.2 | 15.8 ± 0.7 | 62.1 | 319.0 |
راجع مستندات التصنيف للاطلاع على أمثلة استخدام هذه النماذج المدرّبة على ImageNet، والتي تتضمن 1000 فئة مدرّبة مسبقًا.
الطراز | الحجم (بكسل) |
اعتماد توب 1 |
أعلى 5 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) عند 640 (ب) في 640 |
---|---|---|---|---|---|---|---|
YOLO11n-cls | 224 | 70.0 | 89.4 | 5.0 ± 0.3 | 1.1 ± 0.0 | 1.6 | 3.3 |
YOLO11s-cls | 224 | 75.4 | 92.7 | 7.9 ± 0.2 | 1.3 ± 0.0 | 5.5 | 12.1 |
YOLO11m-cls | 224 | 77.3 | 93.9 | 17.2 ± 0.4 | 2.0 ± 0.0 | 10.4 | 39.3 |
YOLO11l-cls | 224 | 78.3 | 94.3 | 23.2 ± 0.3 | 2.8 ± 0.0 | 12.9 | 49.4 |
YOLO11x-cls | 224 | 79.5 | 94.9 | 41.4 ± 0.9 | 3.8 ± 0.0 | 28.4 | 110.4 |
راجع مستندات تقدير الوضعية للاطلاع على أمثلة استخدام هذه النماذج المدرّبة على COCO، والتي تتضمن فئة واحدة مدرّبة مسبقًا، "شخص".
الطراز | الحجم (بكسل) |
mAPpose 50-95 |
mAPpose 50 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|---|
YOLO11n-pose | 640 | 50.0 | 81.0 | 52.4 ± 0.5 | 1.7 ± 0.0 | 2.9 | 7.6 |
YOLO11s-pose | 640 | 58.9 | 86.3 | 90.5 ± 0.6 | 2.6 ± 0.0 | 9.9 | 23.2 |
YOLO11m-pose | 640 | 64.9 | 89.4 | 187.3 ± 0.8 | 4.9 ± 0.1 | 20.9 | 71.7 |
YOLO11l-pose | 640 | 66.1 | 89.9 | 247.7 ± 1.1 | 6.4 ± 0.1 | 26.2 | 90.7 |
YOLO11x-بوز | 640 | 69.5 | 91.1 | 488.0 ± 13.9 | 12.1 ± 0.2 | 58.8 | 203.3 |
راجع مستندات الكشف الموجّه للاطلاع على أمثلة الاستخدام مع هذه النماذج المدرّبة على DOTAv1، والتي تتضمن 15 فئة مدرّبة مسبقًا.
الطراز | الحجم (بكسل) |
اختبار mAPtest 50 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|
YOLO11n-obb | 1024 | 78.4 | 117.6 ± 0.8 | 4.4 ± 0.0 | 2.7 | 17.2 |
YOLO11s-obb | 1024 | 79.5 | 219.4 ± 4.0 | 5.1 ± 0.0 | 9.7 | 57.5 |
YOLO11m-obb | 1024 | 80.9 | 562.8 ± 2.9 | 10.1 ± 0.4 | 20.9 | 183.5 |
YOLO11l-obb | 1024 | 81.0 | 712.5 ± 5.0 | 13.5 ± 0.6 | 26.2 | 232.0 |
YOLO11x-obb | 1024 | 81.3 | 1408.6 ± 7.7 | 28.6 ± 1.0 | 58.8 | 520.2 |
أمثلة على الاستخدام
يوفر هذا القسم أمثلة بسيطة للتدريب والاستدلال YOLO11 . للحصول على وثائق كاملة حول هذه الأنماط وغيرها، راجع صفحات مستندات التنبؤ والتدريب والفال والتصدير.
لاحظ أن المثال أدناه مخصص لنماذج YOLO11 Detect لا كتشاف الكائنات. للاطلاع على المهام الإضافية المدعومة، راجع مستندات Segment و Classify و OBB و Pose.
مثال على ذلك
PyTorch ما قبل التدريب *.pt
النماذج وكذلك التكوين *.yaml
يمكن تمرير الملفات إلى YOLO()
لإنشاء مثيل للنموذج في Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
CLI الأوامر متاحة لتشغيل النماذج مباشرةً:
الاستشهادات والشكر والتقدير
Ultralytics YOLO11 المنشورات
Ultralytics لم تنشر ورقة بحثية رسمية عن YOLO11 بسبب الطبيعة السريعة التطور للنماذج. نحن نركز على تطوير التكنولوجيا وتسهيل استخدامها، بدلاً من إنتاج وثائق ثابتة. للحصول على أحدث المعلومات حول بنية YOLO وميزاته واستخدامه، يُرجى الرجوع إلى مستودع GitHub والوثائق الخاصة بنا.
إذا كنت تستخدم YOLO11 أو أي برنامج آخر من هذا المستودع في عملك، يرجى الاستشهاد به باستخدام التنسيق التالي:
يُرجى ملاحظة أن DOI معلق وسيتم إضافته إلى الاقتباس بمجرد توفره. YOLO11 يتم توفير نماذج بموجب AGPL-3.0 وتراخيص المؤسسات.
الأسئلة الشائعة
ما هي التحسينات الرئيسية في Ultralytics YOLO11 مقارنة بالإصدارات السابقة؟
Ultralytics YOLO11 العديد من التحسينات المهمة مقارنة بسابقاتها. تشمل التحسينات الرئيسية ما يلي:
- استخلاص الميزات المحسّن: YOLO11 يستخدم بنية محسّنة للعمود الفقري والرقبة مما يعزز قدرات استخلاص الميزات لاكتشاف الأجسام بدقة أكبر.
- كفاءة وسرعة محسّنة: توفر التصميمات المعمارية المحسّنة وخطوط أنابيب التدريب المحسّنة سرعات معالجة أسرع مع الحفاظ على التوازن بين الدقة والأداء.
- دقة أكبر بمعلمات أقل: تحقق YOLO11m متوسط دقة أعلى على مجموعة بيانات COCO بمعلمات أقل بنسبة 22% من YOLOv8m ، مما يجعلها فعالة حسابيًا دون المساس بالدقة.
- القدرة على التكيّف عبر البيئات: يمكن نشر YOLO11 عبر بيئات مختلفة، بما في ذلك الأجهزة المتطورة والمنصات السحابية والأنظمة التي تدعم وحدات معالجة الرسومات NVIDIA .
- مجموعة واسعة من المهام المدعومة: يدعم YOLO11 مهام الرؤية الحاسوبية المتنوعة مثل اكتشاف الأجسام، وتجزئة النماذج، وتصنيف الصور، وتقدير الوضعية، واكتشاف الأجسام الموجهة (OBB).
كيف يمكنني تدريب نموذج YOLO11 لاكتشاف الأجسام؟
يمكن تدريب نموذج YOLO11 للكشف عن الأجسام باستخدام الأوامر Python أو CLI . فيما يلي أمثلة لكلا الطريقتين:
مثال على ذلك
لمزيد من الإرشادات التفصيلية، راجع وثائق القطار.
ما المهام التي يمكن أن تؤديها نماذج YOLO11 ؟
YOLO11 النماذج متعددة الاستخدامات وتدعم مجموعة واسعة من مهام الرؤية الحاسوبية، بما في ذلك:
- اكتشاف الأجسام: تحديد الأجسام داخل الصورة وتحديد موقعها.
- تجزئة المثيل: اكتشاف الأجسام وتعيين حدودها.
- تصنيف الصور: تصنيف الصور إلى فئات محددة مسبقاً.
- تقدير الوضعية: اكتشاف وتتبع النقاط الرئيسية على الأجسام البشرية.
- الكشف عن الأجسام الموجهة (OBB): الكشف عن الأجسام مع الدوران للحصول على دقة أعلى.
لمزيد من المعلومات حول كل مهمة، راجع وثائق الكشف، وتقسيم المثيلات، والتصنيف، وتقدير الوضعية، والكشف الموجه.
كيف يحقق YOLO11 دقة أكبر مع عدد أقل من المعلمات؟
YOLO11 يحقق دقة أكبر باستخدام عدد أقل من المعلمات من خلال التطورات في تصميم النماذج وتقنيات التحسين. تسمح البنية المحسّنة باستخراج الميزات ومعالجتها بكفاءة، مما يؤدي إلى متوسط دقة أعلى على مجموعات البيانات مثل COCO مع استخدام معلمات أقل بنسبة 22% من YOLOv8m. وهذا يجعل YOLO11 فعالاً من الناحية الحسابية دون المساس بالدقة، مما يجعله مناسبًا للنشر على الأجهزة محدودة الموارد.
هل يمكن نشر YOLO11 على أجهزة الحافة؟
نعم، تم تصميم YOLO11 لقابلية التكيف عبر بيئات مختلفة، بما في ذلك الأجهزة المتطورة. تجعله بنيته المحسّنة وقدرات المعالجة الفعّالة مناسبًا للنشر على الأجهزة المتطورة والمنصات السحابية والأنظمة التي تدعم NVIDIA GPU. تضمن هذه المرونة إمكانية استخدام YOLO11 في تطبيقات متنوعة، بدءًا من الكشف في الوقت الفعلي على الأجهزة المحمولة إلى مهام التجزئة المعقدة في البيئات السحابية. لمزيد من التفاصيل حول خيارات النشر، راجع وثائق التصدير.