تخطي إلى المحتوى

YOLOv10 YOLOv7: تطور الكشف عن الكائنات في الوقت الفعلي

أدى التقدم السريع في مجال الرؤية الحاسوبية خلال السنوات القليلة الماضية إلى ظهور بنى أكثر كفاءة للتطبيقات في الوقت الفعلي. مقارنة YOLOv10 و YOLOv7 تسلط الضوء على فترة انتقالية حاسمة في هذا التطور. في حين YOLOv7 استراتيجيات تدريب عالية الفعالية وتوسيع نطاق البنية، YOLOv10 النشر من خلال القضاء على الاعتماد الطويل الأمد على Non-Maximum Suppression (NMS).

لقد دفع كلا النموذجين حدود اكتشاف الكائنات عند إصدارهما، إلا أن Ultralytics الحديث Ultralytics وإدخال نماذج الجيل التالي مثل YOLO26 يوفران سير عمل أفضل بكثير لممارسي الذكاء الاصطناعي اليوم.

ملفات تعريف النماذج وأصولها

إن فهم أصول هذه النماذج يوفر سياقًا قيمًا فيما يتعلق بخيارات التصميم المعماري والبحوث الأكاديمية التي تقف وراءها.

YOLOv10

تعرف على المزيد حول YOLOv10

YOLOv7

تعرف على المزيد حول YOLOv7

الابتكارات المعمارية

YOLOv7

صدر YOLOv7 في عام 2022، YOLOv7 بشكل كبير على تحسين مسارات التدرج. وقد أدخل شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، والتي سمحت للنموذج بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي. علاوة على ذلك، طبق المؤلفون منهجية "trainable bag-of-freebies" (حقيبة الهدايا القابلة للتدريب)، باستخدام تقنيات إعادة تحديد المعلمات أثناء التدريب والتي يمكن دمجها أثناء الاستدلال للحفاظ على سرعات التنفيذ السريعة. على الرغم من هذه التحسينات المثيرة للإعجاب، YOLOv7 يعتمد بشكل كبير على NMS مما يخلق زمن انتقال متغير أثناء تحليل المشاهد الكثيفة.

YOLOv10

YOLOv10 مشكلة NMS بشكل مباشر. من خلال إدخال تعيينات مزدوجة متسقة أثناء التدريب، تمكن فريق جامعة تسينغهوا من تحقيق الكشف الشامل NMS. يستخدم هذا النهج المزدوج فرعًا واحدًا مع تعيينات واحد إلى العديد للحصول على إشارات إشرافية غنية أثناء التدريب، وفرعًا آخر مع تعيينات واحد إلى واحد للاستدلال NMS. يضمن هذا التغيير في البنية زمن استدلال متسق ومنخفض للغاية مناسب لتحليلات الفيديو عالية السرعة. علاوة على ذلك، YOLOv10 تصميم نموذج شامل قائم على الكفاءة والدقة، مما يزيل التكرار الحسابي الموجود في الأجيال السابقة.

تأثير المعالجة اللاحقة

إن إزالة NMS لا تسرع عملية الاستدلال فحسب، بل تبسط بشكل كبير عملية النشر على أجهزة الذكاء الاصطناعي المتطورة، مثل مسرعات الذكاء الاصطناعي ووحدات المعالجة العصبية (NPU) حيث يصعب تجميع NMS المخصصة.

مقارنة الأداء

عند مقارنة المقاييس الأولية في COCO ، تظهر الفجوة بين الأجيال بوضوح. YOLOv10 توازنًا أفضل بكثير بين المعلمات والمتطلبات الحسابية والدقة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

كما هو موضح أعلاه، يقدم YOLOv10x معدل mAP أعلى mAP 54.4% مقارنة بـ 53.1% لـ YOLOv7x، مع استخدام معلمات أقل بنسبة 20% تقريبًا. علاوة على ذلك، توفر YOLOv10 خفيفة الوزن (Nano و Small) سرعات TensorRT استثنائية، مما يجعلها جذابة للغاية للنشر على الأجهزة المحمولة.

ميزة النظام البيئي لـ Ultralytics

في حين أن دراسة الأوراق المعمارية أمر مفيد، إلا أن تطوير الرؤية الحاسوبية الحديثة يعتمد على أطر عمل قوية ومحفوظة جيدًا. يوفر اختيار نموذج Ultralytics ميزة كبيرة للمطورين الذين يتطلعون إلى الانتقال من النموذج الأولي إلى الإنتاج بسرعة.

تطوير مبسط

YOLOv7 الوصول إلى كل YOLOv10 YOLOv7 عبرPython Ultralytics Python القياسية. وهذا يوفر سهولة استخدام لا مثيل لها، حيث يستبدل آلاف الأسطر من التعليمات البرمجية النمطية بواجهة برمجة تطبيقات بسيطة وبديهية. علاوة على ذلك، تتطلبYOLO Ultralytics YOLO CUDA أقل بكثير أثناء التدريب مقارنة بهياكل المحولات الثقيلة، مما يتيح استخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.

تنوع لا مثيل له

في حين أن المستودعات القديمة غالبًا ما تركز بشكل صارم على اكتشاف المربعات المحددة، فإن Ultralytics المتكامل يدعم بسلاسة مجموعة كبيرة ومتنوعة من المهام. سواء كنت تقوم بتجزئة الحالات أو تقدير الوضع أو اكتشاف المربعات المحددة الموجهة (OBB) ، فإن سير العمل يظل كما هو.

مثال على الكود: سير عمل التدريب المتسق

يوضح مقتطف الشفرة التالي عملية التدريب السلسة، التي تتعامل تلقائيًا مع زيادة البيانات وجدولة معدل التعلم:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

حالات الاستخدام والتوصيات

YOLOv7 الاختيار بين YOLOv10 YOLOv7 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOv10

YOLOv10 خيار قوي لـ:

  • الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
  • التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
  • تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار YOLOv7

YOLOv7 في الحالات التالية:

  • المقارنة الأكاديمية: إعادة إنتاج أحدث النتائج لعام 2022 أو دراسة آثار E-ELAN وتقنيات bag-of-freebies القابلة للتدريب.
  • أبحاث إعادة تحديد المعلمات: دراسة التلافيف المخطط لها المعاد تحديد معلماتها واستراتيجيات قياس النماذج المركبة.
  • خطوط الأنابيب المخصصة الحالية: مشاريع ذات خطوط أنابيب مخصصة بشكل كبير ومبنية حول بنية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

المعيار الجديد: تقديم YOLO26

في حين أن YOLOv10 قفزة هائلة إلى الأمام في عام 2024، إلا أن مجال الرؤية الحاسوبية يتطور بسرعة مذهلة. بالنسبة لجميع التطورات الجديدة، نوصي بشدة باستخدام أحدث جيل من النماذج: Ultralytics . تم إصداره في يناير 2026، وهو يمثل القمة المطلقة للذكاء الاصطناعي للرؤية في الوقت الفعلي، متفوقًا بشكل كبير على كل من YOLOv7 YOLOv10.

تعرف على المزيد حول YOLO26

يقدم YOLO26 ابتكارات غير مسبوقة مصممة خصيصًا لبيئات النشر الحديثة:

  • تصميم NMS من البداية إلى النهاية: بناءً على الأساس الذي وضعته YOLOv10، تقضي YOLO26 بشكل أساسي على NMS من أجل خطوط أنابيب نشر أبسط واستدلال عالي السرعة ومتسق.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : مُحسّن بشكل كبير للحوسبة الطرفية والأجهزة التي تفتقر إلى وحدات معالجة رسومات مخصصة، مما يوفر توفيرًا كبيرًا في تكاليف الأجهزة.
  • إزالة DFL: تمت إزالة فقدان بؤرة التوزيع (DFL) بالكامل، مما يبسط بشكل جذري منطق التصدير ويحسن بشكل كبير التوافق مع الأجهزة الطرفية منخفضة الطاقة والميكروكونترولرز.
  • MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، هذا المزيج من SGD Muon يجلب ابتكارات تدريب نموذج اللغة الكبيرة (LLM) مباشرة إلى الرؤية الحاسوبية، مما ينتج ديناميكيات تدريب مستقرة بشكل لا يصدق وتقارب أسرع.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو مجال يمثل تحديًا تاريخيًا ويعد بالغ الأهمية للطائرات بدون طيار والروبوتات ومراقبة المدن الذكية.
  • تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. فهو يشتمل على خسارة تقسيم دلالي متخصصة، وتقدير احتمالية السجل المتبقي (RLE) لتتبع الوضع بدقة فائقة، وخوارزميات خسارة زاوية متخصصة للقضاء على مشكلات حدود OBB.

إدارة مجموعات البيانات والتدريب

للحصول على أفضل تجربة على الإطلاق في إدارة مجموعات البيانات الخاصة بك، وتدريب YOLO26، ونشر النماذج على السحابة، استكشف Ultralytics . فهي توفر واجهة بدون كود تتكامل تمامًا مع Python .

حالات الاستخدام في العالم الحقيقي

يعتمد اختيار البنية المناسبة بشكل كبير على قيود الأجهزة والتطبيقات لديك.

متى تستخدم YOLOv7

YOLOv7 خيارًا موثوقًا به للحفاظ على خطوط الأنابيب القديمة التي تم دمجها بالفعل بشكل عميق مع tensor الخاصة بها أو عند تكرار المعايير الأكاديمية من عامي 2022 و 2023. وهو يعمل بشكل رائع على وحدات معالجة الرسومات (GPU) للخوادم المتطورة.

متى تستخدم YOLOv10

YOLOv10 في السيناريوهات التي تتطلب زمن انتقال صارم وثابت. ونظرًا لكونه NMS فهو ممتاز لحساب أعداد الحشود عالية الكثافة أو اكتشاف عيوب التصنيع حيث يتقلب عدد الكائنات بشكل كبير ولكن يجب أن يظل وقت المعالجة لكل إطار ثابتًا.

متى تستخدم YOLO26

YOLO26 هو الخيار الأمثل لأي مشروع جديد. من نشر أنظمة إنذار أمنية متطورة على جهاز Raspberry Pi أساسي إلى تشغيل تحليلات فيديو ضخمة قائمة على السحابة، فإن CPU الفائقة والكشف المتقدم عن الأجسام الصغيرة تجعله متفوقًا بشكل كبير على الأجيال القديمة.

بالنسبة للمطورين المهتمين باستكشاف هياكل حديثة بديلة، نقدم أيضًا دعمًا شاملاً لأجهزة الكشف القائمة على المحولات مثل RT-DETR والأجهزة الأساسية من الجيل السابق مثل Ultralytics YOLO11.


تعليقات