تخطي إلى المحتوى

YOLOv6.0 مقابل YOLOv10: تطور الكشف عن الكائنات في الوقت الفعلي

يتميز مجال اكتشاف الأجسام بالابتكار السريع، حيث تعيد الاختراقات المعمارية تعريف حدود السرعة والدقة باستمرار. ومن المعالم الهامة في هذه الرحلة YOLOv6.YOLOv6، وهو نموذج مصمم للتطبيقات الصناعية، ونموذج YOLOv10، وهو اختراق أكاديمي يركز على الكفاءة الشاملة.

بينما ركز YOLOv6. YOLOv6 على الإنتاجية على الأجهزة المخصصة من خلال التكمية TensorRT YOLOv10 تحولًا جذريًا من خلال التخلص من تقنية Non-Maximum Suppression (NMS) لتقليل زمن الاستجابة. تستكشف هذه المقارنة البنى التقنية ومقاييس الأداء وحالات الاستخدام المثالية لكل منهما لمساعدة المطورين على اختيار الأداة المناسبة لمشاريع الرؤية الحاسوبية الخاصة بهم.

مقارنة مقاييس الأداء

يوضح الجدول التالي الفروق في الأداء بين البنيتين عبر نماذج مختلفة الحجم. في حين أن YOLOv6. YOLOv6 تقدم نتائج قوية، فإن التحسينات المعمارية الأحدث في YOLOv10 توفر YOLOv10 نسب دقة إلى معلمات أعلى.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv6.0: العمود الفقري للصناعة

تم تصميم YOLOv6.YOLOv6 بهدف واحد: تعظيم الإنتاجية في البيئات الصناعية. تم تطويره بواسطة Meituan، وهي منصة تجارة إلكترونية رائدة في الصين، ويمنح الأولوية للنشر على GPU مخصصة.

المؤلف: Chuyi Li، Lulu Li، Yifei Geng، وآخرون.
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: YOLOv6 .0: إعادة تحميل شاملة
GitHub: YOLOv6 Meituan YOLOv6

الهيكلة ونقاط القوة

YOLOv6 هيكل أساسي على غرار VGG يُعرف باسم EfficientRep، وهو ملائم للغاية لأنماط الوصول GPU . ويكمن ابتكاره الرئيسي في تكامله العميق مع التدريب المدرك للتكمية (QAT) والتقطير. وهذا يسمح للنموذج بالحفاظ على دقة عالية حتى عند التكمية إلى INT8، وهي ميزة مهمة للنشر على الأجهزة الطرفية المزودة بمسرعات الأجهزة مثل NVIDIA TensorRT.

أدخل التحديث "v3.0" الاندماج ثنائي الاتجاه (BiFusion) في الرقبة، مما عزز تكامل الميزات عبر المقاييس. وهذا يجعله فعالاً بشكل خاص في الكشف عن الأجسام ذات الأحجام المختلفة في المشاهد الصناعية المزدحمة، مثل تقسيم العبوات أو مراقبة الجودة الآلية.

التحسين الصناعي

YOLOv6 تحسين YOLOv6 بشكل كبير لنموذج "Rep" (إعادة المعلمات). أثناء التدريب، يستخدم النموذج كتل متعددة الفروع لتحسين تدفق التدرج، ولكن أثناء الاستدلال، يتم دمجها في تلافيف 3x3 أحادية الفرع. ينتج عن ذلك استدلال أسرع على وحدات معالجة الرسومات (GPU)، ولكنه قد يزيد من استخدام الذاكرة أثناء مرحلة التدريب.

نقاط الضعف: الاعتماد على الآليات القائمة على المراسي NMS التقليدية NMS يعني أن YOLOv6 غالبًا ما يكون لها زمن انتقال متغير اعتمادًا على عدد الكائنات المكتشفة. بالإضافة إلى ذلك، فإن CPU أقل تحسينًا بشكل عام مقارنة بالبنى الأحدث المصممة لوحدات المعالجة المركزية (CPU) المحمولة.

تعرف على المزيد حول YOLOv6

YOLOv10: الرائد الشامل

YOLOv10 شكلت نقطة تحول مهمة عن YOLO التقليدية من خلال معالجة مشكلة الاختناق في مرحلة ما بعد المعالجة. تم إنشاؤها من قبل باحثين في جامعة تسينغهوا، وقد أدخلت استراتيجية مزدوجة متسقة للتخلص من الحاجة إلى تقنية Non-Maximum Suppression (NMS).

المؤلف: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
المنظمة: جامعة تسينغهوا
التاريخ: 2024-05-23
Arxiv: YOLOv10: الكشف عن الكائنات في الوقت الفعلي من البداية إلى النهاية
GitHub: YOLOv10 Tsinghua YOLOv10

الهيكلة ونقاط القوة

الميزة المميزة YOLOv10 هي تصميمها NMS. تولد أجهزة الكشف التقليدية تنبؤات زائدة عن الحاجة يجب ترشيحها، مما يستهلك وقتًا ثمينًا من وقت الاستدلال. YOLOv10 تخصيصًا "واحد إلى كثير" للإشراف الغني أثناء التدريب، ولكنه يتحول إلى مطابقة "واحد إلى واحد" للاستدلال. وهذا يضمن أن النموذج ينتج صندوقًا واحدًا فقط لكل كائن، مما يقلل بشكل كبير من تباين زمن الاستجابة.

علاوة على ذلك، YOLOv10 تصميمًا شاملاً يعتمد على الكفاءة والدقة. فهو يستخدم رؤوس تصنيف خفيفة الوزن وتقنية تقليل الدقة المكانية المنفصلة لتقليل الحمل الحسابي (FLOPs) دون التضحية بمتوسط الدقة (mAP). وهذا يجعله متعدد الاستخدامات للغاية ومناسبًا لتطبيقات تتراوح من القيادة الذاتية إلى المراقبة في الوقت الفعلي.

نقاط الضعف: باعتباره مشروعًا بحثيًا أكاديميًا في المقام الأول، YOLOv10 يفتقر YOLOv10 إلى الأدوات القوية والمناسبة للمؤسسات التي توجد في الأطر المدعومة تجاريًا. على الرغم من أن البنية مبتكرة، فقد يواجه المستخدمون تحديات في الصيانة طويلة الأجل والتكامل في خطوط أنابيب CI/CD المعقدة مقارنة بالنماذج التي لديها فرق دعم مخصصة.

تعرف على المزيد حول YOLOv10

ميزة Ultralytics: لماذا تختار YOLO26؟

في حين YOLOv10 YOLOv6. YOLOv6 و YOLOv10 خطوات مهمة في تاريخ الرؤية الحاسوبية، فإن نموذج Ultralytics يعد الخيار الأفضل للمطورين الباحثين عن أعلى مستويات الأداء وسهولة الاستخدام ودعم النظام البيئي.

تم إصدار YOLO26 في يناير 2026، وهو يجمع بين أفضل ميزات الإصدارات السابقة ويقدم تحسينات رائدة للنشر الحديث.

المزايا الرئيسية لـ YOLO26

  1. تصميم شامل NMS: بناءً على إرث YOLOv10 فإن YOLO26 شامل بطبيعته. فهو يلغي تمامًا NMS مما يضمن زمن انتقال حتمي ومنطق نشر مبسط.
  2. تحسين الحافة أولاً: من خلال إزالة خسارة التركيز التوزيعي (DFL)، يبسط YOLO26 الرسم البياني للنموذج للتصدير. وينتج عن ذلك CPU أسرع بنسبة تصل إلى 43٪ CPU مما يجعله الملك بلا منازع للحوسبة الطرفية على أجهزة مثل Raspberry Pi أو الهواتف المحمولة.
  3. مُحسّن MuSGD: مستوحى من استقرار تدريب نموذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسّن MuSGD (مزيج من SGD Muon). وهذا يضمن تقاربًا أسرع وتدريبات أكثر استقرارًا، مما يقلل من الوقت وتكلفة الحوسبة اللازمة للوصول إلى الدقة المثلى.
  4. وظائف الخسارة المتقدمة: يوفر دمج ProgLoss و STAL تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهي قدرة مهمة للغاية بالنسبة لصور الطائرات بدون طيار والمراقبة عن بعد.

دعم لا مثيل له للنظام البيئي

اختيار Ultralytics أكثر من مجرد اختيار بنية نموذجية؛ إنه يعني الحصول على منصة تطوير شاملة.

  • سهولة الاستخدام: تعد واجهة برمجة Ultralytics معيارًا صناعيًا بفضل بساطتها. يتطلب التبديل بين النماذج أو المهام (مثل تقدير الوضع أو OBB) تغييرات بسيطة في الكود.
  • كفاءة التدريب: تشتهر Ultralytics بكفاءتها في استخدام الذاكرة. على عكس النماذج الثقيلة القائمة على المحولات التي تتطلب GPU ضخمة، تم تحسين YOLO26 لتعمل بفعالية على الأجهزة الاستهلاكية.
  • تعدد الاستخدامات: على عكس المنافسين الذين يركزون غالبًا على المربعات المحددة فقط، يدعم Ultralytics تقسيم الحالات والتصنيف والمربعات المحددة الموجهة بشكل فوري.

ضمان استمرارية مشاريعك في المستقبل

يضمن استخدام Ultralytics أن يظل مشروعك متوافقًا مع التطورات المستقبلية. عند إصدار بنية جديدة مثل YOLO26، يمكنك ترقية خط إنتاجك ببساطة عن طريق تغيير اسم النموذج في البرنامج النصي الخاص بك، دون إعادة كتابة حلقات التدريب أو أدوات تحميل البيانات.

مثال على الكود: تدريب سلس

توحدPython Ultralytics Python هذه النماذج تحت واجهة واحدة. سواء كنت تجرب إمكانات YOLOv10 NMS YOLOv10 السرعة الخام لـ YOLO26، يظل سير العمل متسقًا.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a dataset (e.g., COCO8) with efficient settings
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Use GPU 0
)

# Run inference with NMS-free speed
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

تعرف على المزيد حول YOLO26

الخلاصة

عند مقارنة YOLOv6.0 و YOLOv10، غالبًا ما يعتمد الاختيار على قيود الأجهزة المحددة. يظل YOLOv6. YOLOv6 منافسًا قويًا للأنظمة القديمة التي استثمرت بكثافة في TensorRT معالجة الرسومات المخصصة. YOLOv10 نهجًا معماريًا حديثًا يبسط المعالجة اللاحقة ويقلل عدد المعلمات للحصول على دقة مماثلة.

ومع ذلك، بالنسبة للمطورين الذين يطلبون أفضل ما في العالمين - بنية متطورة NMS مقترنة بنظام بيئي قوي ومدعوم - فإنUltralytics هو الحل الموصى به. إن CPU الفائق، ومحسن MuSGD المتقدم، والتكامل السلس مع Ultralytics يجعله الخيار الأكثر تنوعًا ومستقبليًا لتطبيقات الذكاء الاصطناعي في العالم الحقيقي.

للمستخدمين المهتمين باستكشاف نماذج أخرى عالية الكفاءة، نوصي أيضًا بالاطلاع على YOLO11 للمهام البصرية العامة أو YOLO للكشف عن المفردات المفتوحة.


تعليقات