تخطي إلى المحتوى

YOLOv5 مقابل YOLO11: مقارنة فنية شاملة

عند اختيار بنية الرؤية الحاسوبية المناسبة لمشروع جديد، من الضروري فهم تطور النماذج الحديثة. يسلط التقدم من البنى السابقة إلى الأطر الموحدة الحديثة الضوء على قفزات كبيرة في كفاءة الخوارزميات وتجربة المطورين. يقدم هذا الدليل مقارنة تقنية متعمقة بين نموذجين بارزين طورتهما Ultralytics: النموذج الرائد YOLOv5 المتطور YOLO11.

مقدمة إلى النماذج

تمثل هاتان البنيتان معلمتين هامتين في مجال الكشف عن الكائنات في الوقت الفعلي، وتوفران مزايا مميزة اعتمادًا على بيئة النشر ومتطلبات التراث.

YOLOv5: العمود الفقري للصناعة

صدر YOLOv5 في صيف عام 2020، YOLOv5 أصبح معيارًا صناعيًا بفضل قدراته الأصلية PyTorch الأصلي، مما خفض بشكل كبير حاجز الدخول للتدريب والنشر. ابتعد عن أطر عمل Darknet C المعقدة لأسلافه، مقدمًا نهجًا Pythonic لبناء النماذج.

YOLOv5 أساسًا قويًا لسهولة الاستخدام وقدم منهجيات تدريب قوية، بما في ذلك زيادة البيانات الفسيفسائية المتقدمة والتثبيت التلقائي. ولا يزال يحظى بشعبية كبيرة بين الباحثين الذين يعتمدون على قاعدة بيانات موثقة جيدًا ومختبرة بشكل مكثف.

تعرف على المزيد حول YOLOv5

YOLO11: إطار الرؤية الموحد

بناءً على سنوات من التعليقات والأبحاث المعمارية، YOLO11 تقديم YOLO11 كجزء من إطار عمل موحد قادر على التعامل مع مهام رؤية متعددة بشكل أصلي. تجاوزت هذه التقنية مجرد الصناديق المحددة، فقد تم تصميمها من الألف إلى الياء لتحقيق أقصى قدر من التنوع والكفاءة.

YOLO11 تجربة مستخدم مبسطة من خلال ultralytics Python ، تتميز بواجهة برمجة تطبيقات بسيطة توحد اكتشاف الكائنات، وتقسيم المثيلات، والتصنيف، وتقدير الوضع، والمربعات المحددة الموجهة (OBB). وهو يحقق توازنًا مثاليًا بين السرعة والدقة، مما يجعله مثاليًا لمختلف سيناريوهات النشر في العالم الواقعي.

تعرف على المزيد حول YOLO11

منصة متكاملة

يستفيد كلا النموذجين من النظام البيئي الجيد الصيانة الذي توفره Ultralytics . تعمل هذه البيئة المتكاملة على تبسيط تعليق مجموعات البيانات والتدريب السحابي وتصدير النماذج عبر أجهزة مختلفة.

مقارنة الأداء والمقاييس

تكشف المقارنة المباشرة بين هذه النماذج كيف تؤدي التحسينات المعمارية إلى مكاسب ملموسة في الأداء. يوضح الجدول أدناه متوسط الدقة (mAP) الذي تم تقييمه على COCO إلى جانب سرعات GPU CPU GPU وعدد المعلمات.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

تحليل النتائج

تسلط المقاييس الضوء على قفزة واضحة في توازن الأداء الذي حققه YOLO11. على سبيل المثال، يحقق نموذج YOLO11n (نانو) معدل mAP بنسبة 39.5٪ mAP بـ 28.0٪ لنموذج YOLOv5n، مع تقليل وقت CPU عند التصدير عبر ONNX. علاوة على ذلك، YOLO11 متطلبات ذاكرة أقل بشكل ملحوظ أثناء التدريب مقارنة بالنماذج الثقيلة القائمة على المحولات، مما يجعله سهل الوصول إليه للانتشار على الأجهزة الاستهلاكية والأجهزة الطرفية.

الاختلافات المعمارية

YOLO11 تحسينات الأداء في YOLO11 من عدة تطورات معمارية رئيسية. في حين YOLOv5 شبكة CSPNet قياسية مع وحدات C3، YOLO11 كتل استخراج ميزات أكثر كفاءة مثل C2f ولاحقًا C3k2، والتي تعمل على تحسين تدفق التدرج وتقليل الأعباء الحسابية.

يتميز YOLO11 برأس مُحسّن بشكل كبير. بعيدًا عن التصميم القائم على المثبتات في الموديلات القديمة، تتبنى Ultralytics الأحدث نهجًا خاليًا من المثبتات. وهذا يقلل من عدد تنبؤات الصندوق، ويبسط خط أنابيب المعالجة اللاحقة، ويحسن قدرة النموذج على التعميم عبر نطاقات ونسب عرض إلى ارتفاع مختلفة. بالإضافة إلى ذلك، تتميز هذه النماذج بكفاءة تدريب فائقة وأوزان مسبقة التدريب متاحة بسهولة تعمل على تسريع تقارب مجموعات البيانات المضبوطة بدقة.

التنفيذ وأمثلة على الكود

إحدى الميزات البارزة Ultralytics هي بساطته. في حين أن YOLOv5 استخدام torch.hub للاستدلال السريع، YOLO11 خطوة إلى الأمام مع الموحد ultralytics Python .

التدريب مع YOLO11

يتطلب تحميل النموذج وتدريبه والتحقق من صحته الحد الأدنى من التعليمات البرمجية النمطية. تتولى واجهة برمجة التطبيقات ضبط المعلمات الفائقة وإدارة النموذج بسلاسة.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")

# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")

الاستدلال التراثي باستخدام YOLOv5

إذا كنت تقوم بصيانة خط أنابيب قديم، YOLOv5 مباشرة مع آلية التحميل الأصلية PyTorch مما يجعل من السهل إدراجه في نصوص الاستدلال الحالية.

import torch

# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")

# Print prediction details to the console
results.print()

مرونة النشر

يدعم كلا الطرازين تنسيقات تصدير واسعة النطاق. سواء كنت تستهدف NVIDIA باستخدام TensorRT أو iOS باستخدام CoreML فإن عملية النشر موثقة بدقة ومدعومة من قبل المجتمع.

حالات الاستخدام المثالية

يعتمد الاختيار بين هذه النماذج إلى حد كبير على مرحلة دورة حياة مشروعك ومتطلباته المحددة.

متى تختار YOLOv5

  • الحفاظ على قواعد البيانات القديمة: إذا كانت بيئة الإنتاج الخاصة بك مخصصة بشكل كبير حول بنية YOLOv5 أو تقنيات تطور معلمات فرعية محددة.
  • المعايير الأكاديمية: عند نشر أبحاث تتطلب مقارنة مباشرة مع معايير الرؤية الحاسوبية المعمول بها للفترة 2020-2022.

متى تختار YOLO11

  • مشاريع متعددة المهام: عندما يتطلب تطبيقك مزيجًا من المهام مثل تقدير الوضع وتجزئة الحالات باستخدام واجهة برمجة تطبيقات واحدة موحدة.
  • عمليات النشر على الحافة: لسيناريوهات الحوسبة على الحافة حيث يكون من الضروري تحقيق أقصى قدر mAP حسابية معينة (FLOPs).
  • حلول الذكاء الاصطناعي التجارية: مثالية لتطبيقات المؤسسات في مجالي البيع بالتجزئة والأمن، حيث تستفيد من الدعم القوي Ultralytics .

الجيل القادم: Ultralytics

بينما YOLO11 توازنًا رائعًا بين السرعة والدقة، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، نوصي بشدة باستكشاف أحدث المعايير في مجال الذكاء الاصطناعي البصري: Ultralytics .

صدر YOLO26 في يناير 2026، ويقدم تطورات تغير النموذج المصممة خصيصًا لتلبية احتياجات النشر الحديثة:

  • تصميم شامل NMS: بناءً على المفاهيم التي تم طرحها لأول مرة في YOLOv10 فإن YOLO26 شامل بطبيعته. فهو يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يبسط بشكل كبير عمليات النشر ويقلل من زمن الاستجابة.
  • MuSGD Optimizer: مستوحى من ابتكارات تدريب LLM من نماذج مثل Kimi K2 من Moonshot AI، يضمن هذا المزيج من SGD Muon تدريبًا مستقرًا للغاية وتقاربًا أسرع بشكل ملحوظ.
  • CPU غير مسبوقة: من خلال إزالة فقدان التركيز التوزيعي (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأفضل على الإطلاق للأجهزة والبيئات المتطورة التي لا تحتوي على وحدات معالجة رسومات مخصصة (GPU).
  • وظائف الخسارة المتقدمة: يؤدي دمج ProgLoss و STAL إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتحليلات الطائرات بدون طيار وإنترنت الأشياء والروبوتات.
  • تحسينات خاصة بالمهام: يقدم تحسينات متخصصة، مثل تقدير احتمالية السجل المتبقي (RLE) للوضع وفقدان الزاوية المتخصص للمربعات المحددة الموجهة، مما يضمن أداءً فائقًا في جميع مهام الرؤية الحاسوبية.

تعرف على المزيد حول YOLO26

بالنسبة للمستخدمين المهتمين بالبنى المتخصصة التي تتجاوز الكشف القياسي عن الكائنات، يمكنكم أيضًا استكشاف نماذج مثل RT-DETR للكشف القائم على المحولات، أو YOLO للتتبع والكشف باستخدام مفردات مفتوحة. إن استخدام هذه الأدوات التي تتم صيانتها جيدًا والمحسّنة للغاية يضمن بقاء خطوط إنتاج الرؤية الحاسوبية الخاصة بك فعالة وقابلة للتطوير ومتقدمة على منافسيها.


تعليقات