YOLOv7 YOLOv6.0: تحقيق التوازن بين الابتكار والسرعة في اكتشاف الكائنات

في ظل التطور السريع في مجال الكشف عن الأجسام في الوقت الفعلي، يعد اختيار البنية المناسبة أمراً بالغ الأهمية لتحسين الأداء والكفاءة. تستكشف هذه المقارنة التفصيلية YOLOv7 و YOLOv6.YOLOv6، وهما نموذجان محوريان أثروا بشكل كبير في هذا المجال. نحلل ابتكاراتهما المعمارية ومقاييسهما المعيارية ومدى ملاءمتهما لمختلف مهام الرؤية الحاسوبية. بالإضافة إلى ذلك، نقدم الجيل التالي YOLO26، الذي يبني على هذه الأسس ليقدم أداءً فائقًا وسهولة في الاستخدام.

نظرة عامة على النموذج

YOLOv7

YOLOv7 تم تصميمه ليتفوق على أجهزة الكشف الحديثة السابقة من حيث السرعة والدقة. وهو يقدم "حقيبة هدايا" قابلة للتدريب تعمل على تحسين التدريب دون زيادة تكلفة الاستدلال.

المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المؤسسة:معهد علوم المعلومات، أكاديميا سينيكا
التاريخ: 6 يوليو 2022
أركايف:YOLOv7: مجموعة التحسينات القابلة للتدريب تحدد أحدث ما توصلت إليه التقنيات لكاشفات الكائنات في الوقت الفعلي
GitHub:WongKinYiu/yolov7

تعرف على المزيد حول YOLOv7

YOLOv6-3.0

يركز YOLOv6.YOLOv6 (المعروف أيضًا باسم YOLOv6 .0) بشكل كبير على التطبيقات الصناعية، حيث يعمل على تحسين إنتاجية الأجهزة على وحدات معالجة الرسومات (GPU). وهو جزء من تحديث "إعادة التحميل" الذي أدى إلى تحسين كبير على YOLOv6 السابقة YOLOv6 .

المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
المؤسسة:Meituan
التاريخ: 13 يناير 2023
Arxiv:YOLOv6 v3.0: A Full-Scale Reloading
GitHub:meituan/YOLOv6

تعرف على المزيد حول YOLOv6

مقارنة فنية

يهدف كلا النموذجين إلى تحقيق أداء في الوقت الفعلي، ولكنهما يحققان ذلك من خلال فلسفات معمارية مختلفة.

البنية

YOLOv7 تستخدم شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تتحكم هذه البنية في أقصر وأطول مسارات التدرج، مما يسمح للشبكة بتعلم ميزات أكثر تنوعًا دون إتلاف تدفق التدرج. كما أنها تستخدم قياس النموذج الذي يربط الطبقات بدلاً من مجرد قياس العمق أو العرض، مما يحافظ على الهيكل الأمثل أثناء القياس.

يستخدم YOLOv6 وحدة تسلسل ثنائية الاتجاه (BiC) في عنقه وتصميم خالٍ تمامًا من المراسي. ويركز على الهياكل الملائمة للأجهزة، مما يؤدي إلى تحسين تكاليف الوصول إلى الذاكرة لوحدات معالجة الرسومات. وقد جدد التحديث الإصدار 3.0 على وجه التحديد استراتيجيات رأس الكشف وتعيين التسميات لتعزيز سرعة التقارب والدقة النهائية.

مقاييس الأداء

يُقارن الجدول التالي بين مقاييس الأداء الرئيسية في COCO .

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

نقاط القوة والضعف

نقاط قوة YOLOv7:

ثراء الميزات: تتميز بنية E-ELAN بقدرتها على التقاط التفاصيل الدقيقة، مما يفيد في اكتشاف الأجسام الصغيرة.
الرأس الإضافي: يستخدم تخصيص ملصقات موجهة "من الخشن إلى الناعم"، مما يوفر إشرافًا أقوى أثناء التدريب.

نقاط ضعف YOLOv7:

التعقيد: قد يكون من الصعب تعديل البنية أو تقليصها لتناسب أجهزة مدمجة معينة.
NMS : تتطلب معالجة لاحقة قياسية لـ Non-Maximum Suppression، مما يضيف تباينًا في زمن الاستجابة.

نقاط قوة YOLOv6-3.0:

الإنتاجية: مُحسّن خصيصًا لسيناريوهات الإنتاجية العالية على Tesla T4 ووحدات معالجة الرسومات المماثلة باستخدام TensorRT.
التكمية: مصمم مع مراعاة التدريب المدرك للتكمية (QAT)، مما يسهل نشره كـ INT8 على الأجهزة الطرفية.

نقاط ضعف YOLOv6-3.0:

CPU : على الرغم من تميزها في GPU، إلا أن خياراتها المعمارية أقل تحسينًا CPU البحتة مقارنةً بالمتغيرات الأحدث "Lite" أو المتغيرات الخاصة بالأجهزة المحمولة.

تطبيقات عملية في أرض الواقع

يعتمد الاختيار بين هذه النماذج إلى حد كبير على أجهزة النشر الخاصة بك وحالة الاستخدام المحددة.

التفتيش الصناعي باستخدام YOLOv6.0

في خطوط الإنتاج عالية السرعة، يعتبر الإنتاجية أمرًا بالغ الأهمية. غالبًا ما يكون YOLOv6.YOLOv6 هو الخيار المفضل للكشف عن العيوب على سيور النقل. TensorRT توافقه مع TensorRT معالجة مئات الإطارات في الثانية على وحدات معالجة الرسومات (GPU) المتطورة، مما يضمن عدم مرور أي منتج معيب.

المراقبة المعقدة باستخدام YOLOv7

بالنسبة للتطبيقات الأمنية التي تتضمن مشاهد مزدحمة أو مراقبة عن بعد، YOLOv7 فعالة للغاية. إن قدرتها على الاحتفاظ بتفاصيل الميزات تجعلها مناسبة لصيانة المدن الحضرية، مثل تحديد أضرار الطرق أو مراقبة تدفق حركة المرور حيث قد تكون الأجسام صغيرة أو محجوبة جزئيًا.

مرونة النشر

على الرغم من أن كلا النموذجين قويان، إلا أن طريقة نشرهما قد تختلف بشكل كبير. YOLOv6 البيئات التي يمكنك فيها الاستفادة من التكمية القوية (INT8)، بينما يحتفظ YOLOv7 بدقة عالية في أوضاع FP16.

ميزة Ultralytics

في حين أن YOLOv7 YOLOv6 بنى قوية، فإن استخدامهما ضمن Ultralytics يوفر مزايا واضحة للمطورين والباحثين.Python Ultralytics Python توحد هذه النماذج المتميزة تحت واجهة برمجة تطبيقات واحدة ومبسطة.

سهولة الاستخدام: يمكنك التبديل بين تدريب YOLOv7 وبنية أحدث بسطر واحد من التعليمات البرمجية.
نظام بيئي جيد الصيانة: Ultralytics تحديثات متكررة، مما يضمن التوافق مع أحدث إصدارات PyTorchCUDA .
تعدد الاستخدامات: بالإضافة إلى الكشف القياسي، يدعم النظام البيئي تقدير الوضع وتجزئة الحالات عبر عائلات النماذج المتوافقة.
كفاءة التدريب: تم تحسين مسارات Ultralytics من أجل كفاءة الذاكرة، مما يسمح في كثير من الأحيان بأحجام دفعات أكبر على أجهزة المستهلكين مقارنة بمستودعات الأبحاث الأصلية.

مثال على التعليمات البرمجية

إليك كيف يمكنك تجربة هذه النماذج بسهولة باستخدام Ultralytics:

from ultralytics import YOLO

# Load a YOLOv7 model (or swap to 'yolov6n.pt')
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

المستقبل: YOLO26

في حين أن YOLOv7 YOLOv6. YOLOv6 لا يزالان قادرين على أداء مهامهما، إلا أن هذا المجال قد تطور. تم إصدار YOLO26 في يناير 2026، وهو يمثل المعيار الجديد للكفاءة والأداء، حيث يعالج قيود سابقيه.

تم تصميم YOLO26 ليكون الحل الأمثل لكل من عمليات النشر على الحافة والسحابة، ويتميز بما يلي:

تصميم شامل NMS: على عكس YOLOv7 فإن YOLO26 شامل بطبيعته. فهو يلغي الحاجة إلى NMS مما يؤدي إلى زمن استدلال أسرع وحتمي، وهو أمر ضروري للروبوتات في الوقت الفعلي.
MuSGD Optimizer: مستوحى من الابتكارات في تدريب LLM (مثل Kimi K2 من Moonshot AI)، يجمع هذا المحسن الهجين SGD Muon، مما يؤدي إلى استقرار التدريب وتسريع التقارب.
CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة Distribution Focal Loss (DFL) وتحسين البنية، يحقق YOLO26 سرعات أعلى بكثير على وحدات المعالجة المركزية، مما يجعله متفوقًا على الأجهزة الطرفية مثل Raspberry Pi.
ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة على تحسين التعرف على الأجسام الصغيرة، وهو مجال بالغ الأهمية كانت النماذج القديمة تعاني فيه في كثير من الأحيان.

بالنسبة للمطورين الذين يبحثون عن أفضل توازن بين السرعة والدقة وسهولة النشر، يوصى بشدة بالانتقال إلى YOLO26.

تعرف على المزيد حول YOLO26

نماذج أخرى للاستكشاف

إذا كنت مهتمًا باستكشاف بنى أخرى ضمن Ultralytics ، ففكر في:

YOLO11: الجيل السابق المتطور، الذي يوفر توازنًا قويًا بين الميزات.
YOLOv10: رائد استراتيجيات التدريب NMS في YOLO .
RT-DETR: كاشف يعتمد على المحولات ويتميز بدقته ولكنه يتطلب GPU أكثر.

من خلال الاستفادة من Ultralytics يمكنك بسهولة مقارنة هذه النماذج بمجموعات البيانات الخاصة بك للعثور على النموذج الأنسب لتطبيقك.