Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 مقابل YOLOv5#

شهد تطور اكتشاف الكائنات في الوقت الفعلي بنيات متعددة تم تحسينها لسيناريوهات نشر مختلفة. في هذا التحليل المتعمق، نقارن بين نموذجين بارزين: YOLOv6-3.0 الذي يركز على الصناعة، وUltralytics YOLOv5 الأساسي ومتعدد الاستخدامات للغاية. إن فهم الخيارات المعمارية ومقاييس الأداء ودعم النظام البيئي لكل منهما سيساعدك على اختيار إطار عمل الرؤية الحاسوبية الأمثل لتطبيقاتك الواقعية.

Link to this sectionYOLOv6-3.0: الإنتاجية الصناعية وتحسين العتاد#

تم تطوير YOLOv6-3.0 بواسطة قسم Vision AI في Meituan، وهو مصمم خصيصاً للبيئات الصناعية ذات الإنتاجية العالية. ويركز على زيادة معدلات الإطارات إلى أقصى حد على مسرعات الأجهزة مثل وحدات معالجة الرسومات NVIDIA المخصصة.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6
  • التوثيق: توثيق YOLOv6

Link to this sectionنقاط القوة المعمارية#

يقدم YOLOv6-3.0 العديد من التحسينات الهيكلية المصممة للسرعة. يستخدم النموذج هيكل EfficientRep الأساسي، والذي تم تصميمه خصيصاً ليكون متوافقاً مع الأجهزة أثناء استنتاج GPU. وهذا يجعل البنية قوية بشكل خاص لمهام المعالجة المجمعة دون اتصال بالإنترنت.

أثناء مرحلة التدريب، يدمج النموذج استراتيجية التدريب المعتمد على المرساة (AAT). يحاول هذا النهج الجمع بين استقرار التدريب القائم على المرساة وسرعة الاستنتاج الخالي من المرساة. بالإضافة إلى ذلك، تستخدم بنية العنق الخاصة به وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين دمج الميزات عبر مقاييس مختلفة. وعلى الرغم من تحسينه بدرجة عالية لخوادم GPU المتطورة باستخدام TensorRT، إلا أن هذا التخصص يمكن أن يؤدي أحياناً إلى زيادة زمن الوصول على وحدات المعالجة المركزية (CPU) فقط أو أجهزة الحافة منخفضة الطاقة.

اعرف المزيد حول YOLOv6

Link to this sectionUltralytics YOLOv5: رائد الذكاء الاصطناعي البصري القابل للوصول#

أطلقته Ultralytics، ووضع YOLOv5 معياراً جديداً لسهولة الاستخدام وكفاءة التدريب والنشر القوي. لقد جعل اكتشاف الكائنات عالي الأداء متاحاً للجميع من خلال التكامل العميق مع سير عمل التعلم العميق الحديث.

Link to this sectionالنظام البيئي وتعدد الاستخدامات#

السمة المميزة لـ YOLOv5 هي سهولة الاستخدام. تم بناء المستودع بشكل أصلي على إطار عمل PyTorch، ويوفر واجهة برمجة تطبيقات Python موحدة تبسط بشكل كبير دورة حياة التعلم الآلي. بدءاً من تكوين مجموعة البيانات وحتى النشر النهائي، يضمن النظام البيئي المتكامل أن يقضي المطورون وقتاً أقل في تصحيح أخطاء البيئات ووقتاً أطول في بناء التطبيقات.

لا يقتصر YOLOv5 على اكتشاف الكائنات فقط. فهو يتميز بتعدد استخدامات استثنائي، حيث يدعم أصلياً تصنيف الصور وتجزئة المثيلات. علاوة على ذلك، فهو يوفر كفاءة تدريب لا مثيل لها، ويتميز بالتخزين المؤقت الذكي، ومحملات البيانات الآلية، والدعم المدمج للتدريب الموزع متعدد وحدات معالجة الرسومات (multi-GPU).

كفاءة الذاكرة في نماذج Ultralytics

عند مقارنة بنيات النماذج، يعد استهلاك الذاكرة عاملاً حاسماً. تحافظ نماذج Ultralytics YOLO على متطلبات VRAM أقل بشكل ملحوظ أثناء التدريب والاستنتاج مقارنة بـ نماذج المحولات (transformer models) الثقيلة، مما يجعلها سهلة الوصول للغاية للمطورين الذين يستخدمون أجهزة المستهلك أو دفاتر ملاحظات سحابية مثل Google Colab.

اعرف المزيد عن YOLOv5

Link to this sectionمقارنة الأداء والبنية#

يوضح الجدول أدناه مقاييس الأداء لكلتا البنيتين عند تقييمهما على مجموعة بيانات COCO القياسية. لاحظ كيف توازن النماذج بين المقايضة بين متوسط دقة متوسط (mAP) وسرعة الاستنتاج عبر بيئات مختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionتحليل#

يحقق YOLOv6-3.0 نتائج mAP مبهرة ويتم تحسينه بشدة لخطوط أنابيب TensorRT على وحدات معالجة الرسومات T4. ومع ذلك، يرد YOLOv5 بـ نظام بيئي مُدار جيداً يدعم التصدير الفوري إلى تنسيقات متعددة، بما في ذلك ONNX وCoreML وTFLite. يضمن هذا توازن الأداء أن يعمل YOLOv5 بشكل موثوق ليس فقط على الخوادم المخصصة، ولكن أيضاً على الأجهزة المحمولة وبيئات الحوسبة الطرفية مثل Raspberry Pi.

Link to this sectionمثال على الكود: تدريب سلس مع Ultralytics#

إحدى أكبر مزايا نظام Ultralytics البيئي هي تجربة المستخدم المبسطة. يتطلب تدريب النموذج وتقييمه وتصديره بضعة أسطر فقط من كود Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format for flexible deployment
model.export(format="onnx")

Link to this sectionحالات الاستخدام المثالية وسيناريوهات النشر#

يعتمد الاختيار بين هذه البنيات غالباً على قيود البنية التحتية المحددة لديك:

  • متى يتم نشر YOLOv6-3.0: مثالي لخطوط التصنيع المؤتمتة وتحليلات الخادم عالية الإنتاجية حيث تتوفر وحدات معالجة رسومات NVIDIA مخصصة ويجب أن يكون زمن الوصول في حده الأدنى. تزدهر بنيته في البيئات التي يمكن فيها الاستفادة الكاملة من تحسينات TensorRT.
  • متى يتم نشر YOLOv5: الخيار الأمثل للنماذج الأولية السريعة والنشر عبر الأنظمة الأساسية والفرق التي تبحث عن خط أنابيب موحد. تجعل قدراته المتنوعة في التصدير منه مثالياً لتحليلات البيع بالتجزئة على أجهزة الحافة، ومراقبة الطائرات بدون طيار الزراعية، وتقدير الوضعية في تطبيقات اللياقة البدنية.

Link to this sectionمستقبل اكتشاف الكائنات: دخول YOLO26#

بينما يمثل YOLOv5 وYOLOv6 معالم بارزة، يتقدم مجال الرؤية الحاسوبية بسرعة. بالنسبة للمطورين الذين يبدأون مشاريع جديدة أو يسعون للحصول على أحدث ما توصلت إليه التقنية، نوصي بشدة بالترقية إلى Ultralytics YOLO26 (تم إصداره في يناير 2026).

يعيد YOLO26 تعريف الذكاء الاصطناعي البصري الموجه للحافة من خلال تقديم تصميم رائد من البداية إلى النهاية بدون NMS. ومن خلال القضاء على الحاجة إلى معالجة لاحقة لإخماد القيم غير القصوى (Non-Maximum Suppression)، فإنه يبسط منطق النشر ويقلل بشكل كبير من تباين زمن الوصول.

تشمل الابتكارات الرئيسية في YOLO26 ما يلي:

  • محسن MuSGD: مزيج من SGD وMuon، مما يوفر استقرار تدريب LLM المتقدم للرؤية الحاسوبية من أجل تقارب أسرع وأكثر موثوقية.
  • استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): تم تحسينه بشدة للبيئات التي لا تحتوي على مسرعات مخصصة.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط عملية التصدير وتعزيز التوافق مع أجهزة الحافة منخفضة الطاقة.
  • ProgLoss + STAL: وظائف خسارة متقدمة تعزز بشكل كبير التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية للصور الجوية ومستشعرات إنترنت الأشياء في المدن الذكية.

بالنسبة للمهام ذات الأغراض العامة، يظل YOLO11 أيضاً خياراً ممتازاً ومدعوماً بالكامل داخل عائلة Ultralytics.

تعرف على المزيد حول YOLO26

Link to this sectionالخلاصة#

لعب كل من YOLOv6-3.0 وYOLOv5 أدواراً محورية في دفع عجلة الاكتشاف في الوقت الفعلي. يوفر YOLOv6-3.0 بنية متخصصة للغاية للإنتاجية المسرعة بواسطة GPU، بينما يوفر YOLOv5 تجربة مطور لا مثيل لها من خلال وثائقه الشاملة وسهولة استخدامه وقدراته المتعددة المهام.

بالنسبة للتطبيقات الحديثة، يضمن الاستفادة من نظام Ultralytics البيئي المتكامل سير عمل جاهزاً للمستقبل. من خلال اعتماد أحدث البنيات مثل YOLO26، فإنك تضمن استفادة خطوط أنابيب النشر الخاصة بك من أحدث الاختراقات في السرعة والدقة والبساطة الخوارزمية.

التعليقات