YOLOv10 YOLOv7: تطور الكشف عن الكائنات في الوقت الفعلي

أدى التقدم السريع في مجال الرؤية الحاسوبية خلال السنوات القليلة الماضية إلى ظهور بنى أكثر كفاءة للتطبيقات في الوقت الفعلي. مقارنة YOLOv10 و YOLOv7 تسلط الضوء على فترة انتقالية حاسمة في هذا التطور. في حين YOLOv7 استراتيجيات تدريب عالية الفعالية وتوسيع نطاق البنية، YOLOv10 النشر من خلال القضاء على الاعتماد الطويل الأمد على Non-Maximum Suppression (NMS).

دفع كلا النموذجين حدود اكتشاف الكائنات عند إصدارهما، ومع ذلك، فإن نظام Ultralytics البيئي الحديث وإدخال نماذج الجيل التالي مثل YOLO26 يوفران سير عمل متفوقًا بكثير لممارسي الذكاء الاصطناعي اليوم.

ملفات تعريف النماذج وأصولها

إن فهم أصول هذه النماذج يوفر سياقًا قيمًا فيما يتعلق بخيارات التصميم المعماري والبحوث الأكاديمية التي تقف وراءها.

YOLOv10

المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المنظمة: جامعة Tsinghua
التاريخ: 2024-05-23
أرشيف: YOLOv10: اكتشاف الكائنات الشامل في الوقت الفعلي
GitHub: THU-MIG/yolov10
المستندات: YOLOv10 Ultralytics YOLOv10

تعرف على المزيد حول YOLOv10

YOLOv7

المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
التاريخ: 2022-07-06
أرشيف: YOLOv7: مجموعة من التحسينات القابلة للتدريب تحدد أحدث ما توصلت إليه التقنيات
GitHub: WongKinYiu/yolov7
المستندات: YOLOv7 Ultralytics YOLOv7

تعرف على المزيد حول YOLOv7

الابتكارات المعمارية

YOLOv7

صدر YOLOv7 في عام 2022، YOLOv7 بشكل كبير على تحسين مسارات التدرج. وقد أدخل شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، والتي سمحت للنموذج بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي. علاوة على ذلك، طبق المؤلفون منهجية "trainable bag-of-freebies" (حقيبة الهدايا القابلة للتدريب)، باستخدام تقنيات إعادة تحديد المعلمات أثناء التدريب والتي يمكن دمجها أثناء الاستدلال للحفاظ على سرعات التنفيذ السريعة. على الرغم من هذه التحسينات المثيرة للإعجاب، YOLOv7 يعتمد بشكل كبير على NMS مما يخلق زمن انتقال متغير أثناء تحليل المشاهد الكثيفة.

YOLOv10

YOLOv10 مشكلة NMS بشكل مباشر. من خلال إدخال تعيينات مزدوجة متسقة أثناء التدريب، تمكن فريق جامعة تسينغهوا من تحقيق الكشف الشامل NMS. يستخدم هذا النهج المزدوج فرعًا واحدًا مع تعيينات واحد إلى العديد للحصول على إشارات إشرافية غنية أثناء التدريب، وفرعًا آخر مع تعيينات واحد إلى واحد للاستدلال NMS. يضمن هذا التغيير في البنية زمن استدلال متسق ومنخفض للغاية مناسب لتحليلات الفيديو عالية السرعة. علاوة على ذلك، YOLOv10 تصميم نموذج شامل قائم على الكفاءة والدقة، مما يزيل التكرار الحسابي الموجود في الأجيال السابقة.

تأثير المعالجة اللاحقة

إن إزالة NMS لا تسرع عملية الاستدلال فحسب، بل تبسط بشكل كبير عملية النشر على أجهزة الذكاء الاصطناعي المتطورة، مثل مسرعات الذكاء الاصطناعي ووحدات المعالجة العصبية (NPU) حيث يصعب تجميع NMS المخصصة.

مقارنة الأداء

عند مقارنة المقاييس الأولية في COCO ، تظهر الفجوة بين الأجيال بوضوح. YOLOv10 توازنًا أفضل بكثير بين المعلمات والمتطلبات الحسابية والدقة.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

كما هو موضح أعلاه، يقدم YOLOv10x قيمة mAP متفوقة تبلغ 54.4% مقارنة بـ 53.1% لـ YOLOv7x، مع استخدام عدد أقل من المعلمات بنسبة 20% تقريبًا. علاوة على ذلك، توفر نماذج YOLOv10 خفيفة الوزن (Nano و Small) سرعات نشر TensorRT استثنائية، مما يجعلها جذابة للغاية للنشر على الأجهزة المحمولة.

ميزة النظام البيئي لـ Ultralytics

في حين أن دراسة الأوراق المعمارية أمر مفيد، إلا أن تطوير الرؤية الحاسوبية الحديثة يعتمد على أطر عمل قوية ومحفوظة جيدًا. يوفر اختيار نموذج Ultralytics ميزة كبيرة للمطورين الذين يتطلعون إلى الانتقال من النموذج الأولي إلى الإنتاج بسرعة.

تطوير مبسط

يمكن الوصول إلى كل من YOLOv10 وYOLOv7 عبر حزمة Ultralytics Python القياسية. وهذا يوفر سهولة استخدام لا مثيل لها، حيث يستبدل آلاف الأسطر من التعليمات البرمجية المتكررة بواجهة برمجة تطبيقات بسيطة وبديهية. علاوة على ذلك، تتطلب نماذج Ultralytics YOLO ذاكرة CUDA أقل بكثير أثناء التدريب مقارنةً بمعماريات المحولات الثقيلة، مما يتيح استخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.

تنوع لا مثيل له

في حين أن المستودعات القديمة غالبًا ما تركز بشكل صارم على اكتشاف المربعات المحددة، فإن Ultralytics المتكامل يدعم بسلاسة مجموعة كبيرة ومتنوعة من المهام. سواء كنت تقوم بتجزئة الحالات أو تقدير الوضع أو اكتشاف المربعات المحددة الموجهة (OBB) ، فإن سير العمل يظل كما هو.

مثال برمجي: سير عمل تدريب متسق

يوضح مقتطف الشفرة التالي عملية التدريب السلسة، التي تتعامل تلقائيًا مع زيادة البيانات وجدولة معدل التعلم:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv10 و YOLOv7 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv10

YOLOv10 خيار قوي لـ:

detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار YOLOv7

YOLOv7 في الحالات التالية:

المقارنة المعيارية الأكاديمية: لإعادة إنتاج أحدث النتائج من حقبة 2022 أو دراسة تأثيرات E-ELAN وتقنيات "حقيبة المجانيات" القابلة للتدريب.
أبحاث إعادة التوسيط (Reparameterization): التحقيق في الالتفافات المعاد توسيطها المخطط لها واستراتيجيات قياس النماذج المركبة.
مسارات مخصصة موجودة: المشاريع ذات المسارات المخصصة بشكل كبير والمبنية حول بنية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

المعيار الجديد: تقديم YOLO26

في حين أن YOLOv10 قفزة هائلة إلى الأمام في عام 2024، إلا أن مجال الرؤية الحاسوبية يتطور بسرعة مذهلة. بالنسبة لجميع التطورات الجديدة، نوصي بشدة باستخدام أحدث جيل من النماذج: Ultralytics . تم إصداره في يناير 2026، وهو يمثل القمة المطلقة للذكاء الاصطناعي للرؤية في الوقت الفعلي، متفوقًا بشكل كبير على كل من YOLOv7 YOLOv10.

تعرف على المزيد حول YOLO26

يقدم YOLO26 ابتكارات غير مسبوقة مصممة خصيصًا لبيئات النشر الحديثة:

تصميم خالٍ من NMS وشامل: استنادًا إلى الأساس الذي وضعه YOLOv10، يلغي YOLO26 معالجة NMS اللاحقة بشكل طبيعي لمسارات نشر أبسط واستدلال عالي السرعة ومتسق.
سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: تم تحسينه بشكل كبير للحوسبة الطرفية والأجهزة التي تفتقر إلى وحدات GPU مخصصة، مما يوفر توفيرًا هائلاً في تكاليف الأجهزة.
إزالة DFL: تمت إزالة Distribution Focal Loss بالكامل، مما يبسط منطق التصدير بشكل جذري ويحسن بشكل كبير التوافق مع الأجهزة الطرفية منخفضة الطاقة ووحدات التحكم الدقيقة.
مُحسِّن MuSGD: مستوحى من Kimi K2 من Moonshot AI، يجلب هذا المزيج الهجين من SGD و Muon ابتكارات تدريب نماذج اللغة الكبيرة (LLM) مباشرة إلى الرؤية الحاسوبية، مما ينتج عنه ديناميكيات تدريب مستقرة بشكل لا يصدق وتقارب أسرع.
ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو مجال يمثل تحديًا تاريخيًا وبالغ الأهمية للطائرات بدون طيار والروبوتات ومراقبة المدن الذكية.
تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. يتضمن فقدان تجزئة دلالية متخصصًا، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ track الوضعية فائق الدقة، وخوارزميات فقدان زاوية متخصصة للقضاء على مشكلات حدود OBB.

إدارة مجموعات البيانات والتدريب

للحصول على أفضل تجربة على الإطلاق في إدارة مجموعات البيانات الخاصة بك، وتدريب YOLO26، ونشر النماذج على السحابة، استكشف Ultralytics . فهي توفر واجهة بدون كود تتكامل تمامًا مع Python .

حالات الاستخدام في العالم الحقيقي

يعتمد اختيار البنية المناسبة بشكل كبير على قيود الأجهزة والتطبيقات لديك.

متى تستخدم YOLOv7

YOLOv7 خيارًا موثوقًا به للحفاظ على خطوط الأنابيب القديمة التي تم دمجها بالفعل بشكل عميق مع tensor الخاصة بها أو عند تكرار المعايير الأكاديمية من عامي 2022 و 2023. وهو يعمل بشكل رائع على وحدات معالجة الرسومات (GPU) للخوادم المتطورة.

متى تستخدم YOLOv10

YOLOv10 في السيناريوهات التي تتطلب زمن انتقال صارم وثابت. ونظرًا لكونه NMS فهو ممتاز لحساب أعداد الحشود عالية الكثافة أو اكتشاف عيوب التصنيع حيث يتقلب عدد الكائنات بشكل كبير ولكن يجب أن يظل وقت المعالجة لكل إطار ثابتًا.

متى تستخدم YOLO26

YOLO26 هو الخيار الأمثل لأي مشروع جديد. من نشر أنظمة إنذار أمنية متطورة على جهاز Raspberry Pi أساسي إلى تشغيل تحليلات فيديو ضخمة قائمة على السحابة، فإن CPU الفائقة والكشف المتقدم عن الأجسام الصغيرة تجعله متفوقًا بشكل كبير على الأجيال القديمة.

بالنسبة للمطورين المهتمين باستكشاف هياكل حديثة بديلة، نقدم أيضًا دعمًا شاملاً لأجهزة الكشف القائمة على المحولات مثل RT-DETR والأجهزة الأساسية من الجيل السابق مثل Ultralytics YOLO11.

YOLOv10 YOLOv7: تطور الكشف عن الكائنات في الوقت الفعلي

ملفات تعريف النماذج وأصولها

YOLOv10

YOLOv7

الابتكارات المعمارية

YOLOv7

YOLOv10

مقارنة الأداء

ميزة النظام البيئي لـ Ultralytics

تطوير مبسط

تنوع لا مثيل له

مثال برمجي: سير عمل تدريب متسق

حالات الاستخدام والتوصيات

متى تختار YOLOv10

متى تختار YOLOv7

متى تختار Ultralytics YOLO26)

المعيار الجديد: تقديم YOLO26

حالات الاستخدام في العالم الحقيقي

متى تستخدم YOLOv7

متى تستخدم YOLOv10

متى تستخدم YOLO26

تعليقات