Link to this sectionمقارنة بين YOLOv10 و YOLOv8#
شهد تطور الكشف عن الأجسام في الوقت الفعلي تعاقبًا سريعًا لبنى برمجية مبتكرة، يسعى كل منها إلى تجاوز حدود الدقة، وسرعة الاستدلال، والكفاءة الحسابية. في هذا الدليل الفني الشامل، نقارن بين محطتين رئيسيتين في مجال الرؤية الحاسوبية: YOLOv10 و Ultralytics YOLOv8. في حين رسّخ YOLOv8 معيارًا متعدد الاستخدامات وجاهزًا للإنتاج، قدم YOLOv10 تحولات معمارية تهدف تحديدًا إلى إزالة الاختناقات في مرحلة ما بعد المعالجة.
يُعد فهم المزايا الفريدة، والبنى، ومقاييس الأداء لهذه النماذج أمرًا بالغ الأهمية للمطورين والباحثين الذين يهدفون إلى نشر حلول ذكاء اصطناعي بصرية متطورة في سيناريوهات العالم الحقيقي.
Link to this sectionالمواصفات الفنية والتأليف#
لتقييم هذه النماذج بفعالية، يساعد فهم أصولها والتركيز الأساسي لفرق البحث الخاصة بها.
Link to this sectionYOLOv10: كفاءة شاملة من البداية إلى النهاية#
طوّر باحثون في جامعة تسينغهوا نموذج YOLOv10 لمعالجة العبء الحسابي الذي تفرضه خطوات ما بعد المعالجة في الأجيال السابقة.
- المؤلفون: Ao Wang و Hui Chen و Lihao Liu، وآخرون.
- المنظمة: Tsinghua University
- التاريخ: 2024-05-23
- Arxiv: 2405.14458
- GitHub: THU-MIG/yolov10
- التوثيق: توثيق YOLOv10
Link to this sectionUltralytics YOLOv8: المعيار متعدد الاستخدامات#
بمجرد إصداره في أوائل عام 2023، أصبح YOLOv8 ركيزة أساسية في الصناعة بفضل بنيته القوية وتكامله الفريد ضمن النظام البيئي الأوسع لتعلم الآلة.
- المؤلفون: Glenn Jocher، وAyush Chaurasia، وJing Qiu
- المنظمة: Ultralytics
- التاريخ: 2023-01-10
- GitHub: ultralytics/ultralytics
Link to this sectionالابتكارات المعمارية#
يجلب كلا النموذجين تحسينات كبيرة على بنية YOLO التقليدية، على الرغم من أنهما يستهدفان جوانب مختلفة قليلًا من خط الأنابيب.
Link to this sectionبنية YOLOv10#
الميزة البارزة في YOLOv10 هي استراتيجية التدريب الخالية من NMS. تقليديًا، تعتمد كواشف الأجسام على Non-Maximum Suppression (NMS) أثناء الاستدلال لتصفية مربعات الإحاطة المتداخلة. يمكن أن تسبب هذه الخطوة تأخيرًا وتجعل النشر من البداية إلى النهاية أكثر تعقيدًا. يستخدم YOLOv10 تعيينات مزدوجة متسقة أثناء التدريب، مما يسمح للنموذج بالتنبؤ بمربع إحاطة واحد دقيق لكل جسم بشكل أصلي. علاوة على ذلك، فإنه يستخدم تصميم نموذج كلي مدفوع بالكفاءة والدقة، مما يحسن المكونات المختلفة لتقليل عدد FLOPs ومعاملات النموذج بشكل كبير.
Link to this sectionهيكل YOLOv8#
قدم YOLOv8 رأس كشف خالٍ من المراسي (anchor-free detection head)، مبتعدًا عن المناهج المعتمدة على المراسي لأسلافه. هذا يقلل من عدد تنبؤات المربعات ويسرع NMS operations. بالإضافة إلى ذلك، يدمج YOLOv8 وحدة C2f (عنق الزجاجة الجزئي عبر المراحل مع عمليتين التفافيتين)، مما يحسن تدفق التدرج ويسمح للشبكة بتعلم تمثيلات ميزات أكثر ثراءً دون زيادة التكلفة الحسابية بشكل كبير. تفصل بنية الرأس المنفصلة مهام وجود الأجسام، والتصنيف، والانحدار، مما يؤدي إلى تقارب أسرع ودقة إجمالية أعلى.
Link to this sectionالأداء والمعايير القياسية#
عند نشر النماذج على أجهزة الحافة أو خوادم السحاب، تعد المقايضة بين السرعة والدقة أمرًا بالغ الأهمية. يوفر الجدول أدناه مقارنة مباشرة بين النموذجين عبر أحجام مختلفة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
ملاحظة: تشير الخلايا الفارغة إلى مقاييس لم يتم الإبلاغ عنها رسميًا في ظل ظروف اختبار متطابقة.
كما يظهر في البيانات، يظهر YOLOv10 كفاءة استثنائية في المعاملات، وغالبًا ما يطابق أو يتجاوز mAP نظائره من YOLOv8 مع استخدام عدد أقل من المعاملات و FLOPs. ومع ذلك، يظل YOLOv8 تنافسيًا بشكل لا يصدق، حيث يوفر TensorRT integration عالي التحسين يضمن الحد الأدنى من زمن استجابة الاستدلال على وحدات معالجة الرسومات الحديثة.
عند استهداف بيئات الإنتاج، يمكن أن يؤدي استخدام تنسيقات مثل ONNX أو TensorRT إلى تحسين سرعات الاستدلال بشكل كبير. يدعم كل من YOLOv8 و YOLOv10 التصدير السلس إلى تنسيقات الرسوم البيانية عالية التحسين هذه.
Link to this sectionالنظام البيئي، وكفاءة التدريب، وتعدد الاستخدامات#
اختيار النموذج يتجاوز المعايير النظرية؛ إذ تعد تجربة المطور والنظام البيئي المحيط أمرًا حيويًا بنفس القدر.
Link to this sectionميزة Ultralytics#
إحدى نقاط القوة الأساسية لـ YOLOv8 هي تكامله الوثيق في Ultralytics ecosystem. توفر هذه البيئة تجربة "من الصفر إلى الاحتراف"، والتي تتميز بواجهة Python API بديهية للغاية ووثائق شاملة. على عكس المستودعات التي تركز على الأبحاث والتي قد تتطلب إعدادات بيئة معقدة، تشتهر نماذج Ultralytics بسهولة استخدامها.
علاوة على ذلك، يتميز YOLOv8 بطبيعته متعددة الاستخدامات. بينما تم تحسين YOLOv10 بدقة للكشف عن الأجسام، يسمح إطار عمل Ultralytics للمطورين بالانتقال بسلاسة بين مهام object detection و instance segmentation و image classification و pose estimation و oriented bounding box (OBB) ضمن نفس المكتبة وهيكل API.
Link to this sectionمتطلبات الذاكرة والتدريب#
صُممت نماذج Ultralytics YOLO مع التركيز على كفاءة التدريب. فهي تظهر عمومًا استهلاكًا أقل للذاكرة أثناء التدريب والاستدلال مقارنة بـ transformer models المعقدة، مما يسمح للمطورين بتدريب نماذج متطورة على أجهزة المستهلك العادية أو مثيلات السحاب القياسية دون نفاد ذاكرة CUDA. يضمن التعامل التلقائي مع ضبط المعلمات الفائقة وتعزيز البيانات تقاربًا سريعًا.
إليك مثال عملي على مدى بساطة تدريب نموذج والتحقق منه باستخدام Ultralytics Python API:
from ultralytics import YOLO
# Load a pretrained model (YOLOv8 recommended for general tasks)
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset with automatic memory management
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on a test image
predictions = model("https://ultralytics.com/images/zidane.jpg")
predictions[0].show()Link to this sectionالجيل القادم: YOLO26#
في حين يمثل كل من YOLOv8 و YOLOv10 محطات استثنائية، فإن مجال تعلم الآلة يتقدم باستمرار. بالنسبة للمطورين الذين يبدأون مشاريع جديدة، نوصي بشدة بالاستفادة من YOLO26، أحدث طراز رائد من Ultralytics تم إصداره في يناير 2026.
يجمع YOLO26 أفضل التطورات المعمارية للسنوات الماضية في إطار عمل واحد عالي التحسين. وهو يرث تصميم End-to-End NMS-Free الذي ابتكرته نماذج مثل YOLOv10، مما يبسط خطوط أنابيب النشر ويقلل من تباين زمن الاستجابة. علاوة على ذلك، يقدم YOLO26 مُحسِّن MuSGD، وهو نموذج هجين مستوحى من استقرار تدريب LLM الذي يضمن تقاربًا أسرع وأكثر استقرارًا.
تشمل التحسينات الرئيسية في YOLO26 ما يلي:
- استدلال أسرع على CPU بنسبة تصل إلى 43%: تم تحسينه بشكل كبير لأجهزة الحافة من خلال إزالة Distribution Focal Loss (DFL).
- ProgLoss + STAL: وظائف فقدان متقدمة تعمل على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر بالغ الأهمية لصور الطائرات بدون طيار ومستشعرات IoT.
- تحسينات خاصة بالمهام: بنيات متخصصة للتقسيم، وتقدير الوضع، و OBB، مما يضمن أداءً من الطراز الأول عبر جميع مجالات الرؤية.
Link to this sectionحالات الاستخدام المثالية واستراتيجيات النشر#
عند اتخاذ قرار بشأن هذه البنى، ضع في اعتبارك الاحتياجات المحددة لبيئة النشر الخاصة بك:
- اختر YOLOv10 إذا: كنت تعمل على خط أنابيب كشف أجسام خالص حيث يعد ضغط كل جزء من كفاءة المعاملات أمرًا بالغ الأهمية، وترغب في تجربة التنفيذات المبكرة للبنى الخالية من NMS.
- اختر Ultralytics YOLOv8 إذا: كنت بحاجة إلى نموذج مستقر للغاية وجاهز للإنتاج ومدعوم من قبل Ultralytics Platform القوية. إنه الخيار الأمثل إذا كان مشروعك يتطلب مهامًا متعددة (مثل كشف الأجسام ثم تقسيمها) باستخدام قاعدة تعليمات برمجية موحدة وسهلة الصيانة.
- اختر YOLO26 (موصى به) إذا: كنت ترغب في تحقيق التوازن النهائي بين الدقة المتطورة، والكفاءة الأصلية الخالية من NMS من البداية إلى النهاية، وأسرع سرعات ممكنة على CPU وأجهزة الحافة.
إذا كنت تستكشف المشهد الأوسع، فقد تكون مهتمًا أيضًا بمقارنة هذه النماذج بـ YOLO11 أو التحقق من تكاملات نشر الحافة المحددة مثل Intel OpenVINO لتسريع تطبيقات ذكاء الرؤية الاصطناعي الخاصة بك بشكل أكبر. من خلال الاستفادة من الأدوات الموحدة التي توفرها Ultralytics، أصبح نشر حلول الرؤية الحاسوبية القوية أسهل من أي وقت مضى.