YOLOv7 YOLO26: قفزة تكنولوجية في مجال اكتشاف الأجسام
يتغير مشهد الرؤية الحاسوبية بسرعة مذهلة. في عام 2022، YOLOv7 معيارًا جديدًا للسرعة والدقة، حيث أدخلت ابتكارات معمارية مثل E-ELAN. وبالانتقال سريعًا إلى يناير 2026، أعاد YOLO26 تعريف أحدث ما توصلت إليه التكنولوجيا من خلال تصميم شامل، CPU ، واستقرار في التدريب مستمد من نماذج اللغة الكبيرة (LLMs).
يقدم هذا الدليل مقارنة تقنية بين هذين المعلمين البارزين في تاريخ اكتشاف الأجسام، مما يساعد المطورين على اختيار الأداة المناسبة للنشر الحديث.
التطور المعماري
يمثل الانتقال من YOLOv7 YOLO26 تغييرًا جوهريًا في كيفية تصميم الشبكات العصبية من أجل الكفاءة وسهولة الاستخدام.
YOLOv7: إرث E-ELAN
YOLOv7، الذي تم إصداره في 6 يوليو 2022، من تأليف Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينيكا.
كان الابتكار الأساسي هو شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تسمح هذه البنية للشبكة بتعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسارات التدرج. كما أدخلت "حقيبة الهدايا المجانية"، بما في ذلك إعادة تحديد المعلمات المخطط لها، مما أدى إلى تحسين الدقة دون زيادة تكلفة الاستدلال. ومع ذلك، YOLOv7 على مربعات الربط وتتطلب معالجة لاحقة لـ Non-Maximum Suppression (NMS) ، مما يؤدي إلى تباين في زمن الاستجابة ويعقد عملية النشر على الأجهزة الطرفية.
YOLO26: الثورة الشاملة
YOLO26، الصادر عن Ultralytics في يناير 2026، تم تصميمه لعصر الحوسبة المتطورة وعمليات التعلم الآلي المبسطة.
الابتكار الرئيسي: NMS من البداية إلى النهاية
YOLO26 هو نظام شامل بطبيعته، مما يلغي الحاجة إلى NMS . هذا الاختراق، الذي تم ابتكاره لأول مرة في YOLOv10، يقلل بشكل كبير من زمن استنتاج الاستدلال ويبسط خط أنابيب النشر، مما يضمن أن ناتج النموذج جاهز للاستخدام على الفور.
يقدم YOLO26 العديد من التطورات الهامة:
- MuSGD Optimizer: مستوحى من تقنيات التدريب Kimi K2 و LLM من Moonshot AI، هذا المزيج من SGD و Muon يوفر استقرارًا غير مسبوق لتدريب الرؤية الحاسوبية، مما يؤدي إلى تقارب أسرع.
- إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، يبسط YOLO26 طبقة الإخراج. وهذا يجعل التصدير إلى تنسيقات مثل ONNX أو TensorRT أكثر سلاسة ويحسن التوافق مع الأجهزة الطرفية منخفضة الطاقة.
- ProgLoss + STAL: توفر وظائف الخسارة المحسّنة هذه مكاسب ملحوظة في التعرف على الأجسام الصغيرة، وهو مطلب أساسي لصور الطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء.
تحليل الأداء
عند مقارنة المقاييس الأولية، يُظهر YOLO26 مكاسب الكفاءة التي تحققت على مدار أربع سنوات من البحث. فهو يوفر دقة أعلى مع جزء بسيط من المعلمات وسرعات استدلال أسرع بشكل ملحوظ، لا سيما على وحدات المعالجة المركزية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
السرعة والكفاءة
تم تحسين YOLO26 خصيصًا للبيئات التي لا تحتوي على وحدات معالجة رسومات قوية. مع إزالة خطوات المعالجة اللاحقة الثقيلة والكتل المحسّنة، فإنه يوفر CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنةً بالأجيال السابقة. بالنسبة للمطورين الذين ينشرون على Raspberry Pi أو الهواتف المحمولة أو وحدات المعالجة المركزية العامة، فإن YOLO26 هو الفائز الواضح.
في المقابل، YOLOv7 تصميم YOLOv7 بشكل أساسي مع وضع GPU المتطورة في الاعتبار (على وجه التحديد V100 و A100). وعلى الرغم من أنه لا يزال سريعًا على CUDA إلا أنه يفتقر إلى التصميم المعماري المبسط المطلوب للذكاء الاصطناعي المتطور.
التدريب والنظام البيئي
الفرق في تجربة المستخدم بين النموذجين واضح للغاية. YOLOv7 على هياكل مستودعات قديمة تتطلب غالبًا إعدادات بيئة معقدة، وتنسيقًا يدويًا للبيانات، وحججًا مطولة لسطر الأوامر.
ميزة Ultralytics
YOLO26 مدمج بالكامل في Ultralytics مما يوفر تجربة مبسطة "من الصفر إلى القمة".
- سهولة الاستخدام: يمكنك تثبيت المكتبة عبر
pip install ultralyticsوبدء التدريب في ثوانٍ. واجهة برمجة التطبيقات متسقة وموثقة جيدًا ومتوافقة مع لغة Python. - Ultralytics : يمكن لمستخدمي YOLO26 الاستفادة من Ultralytics لإدارة مجموعات البيانات، والتعليق التلقائي، والتدريب السحابي بنقرة واحدة.
- تعدد الاستخدامات: بينما YOLOv7 بشكل أساسي على الكشف (مع بعض فروع الوضع/التجزئة)، يدعم YOLO26 بشكل أساسي الكشف عن الكائنات، وتجزئة الحالات، وتقدير الوضع، والتصنيف، والمربعات المحددة الاتجاه (OBB) ضمن نفس الإطار.
مثال على التعليمات البرمجية
بمقارنة تعقيد الاستخدام، يبسط Ultralytics سير العمل بشكل كبير.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version for speed)
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset
# No complex config files needed, just point to your data.yaml
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with NMS-free speed
# The results object contains easy-to-parse boxes and masks
results = model("path/to/image.jpg")
حالات الاستخدام المثالية
متى تختار YOLOv7
YOLOv7 نموذجًا محترمًا في الأوساط الأكاديمية وقد يكون مناسبًا لما يلي:
- الأنظمة القديمة: المشاريع المتكاملة بشكل عميق مع YOLOv7 المحددة والتي لا يمكن ترحيلها بسهولة.
- مقارنة الأبحاث: يقارن الباحثون البنى الجديدة بمعايير أحدث ما توصلت إليه التكنولوجيا في عام 2022.
- GPU محددة: سيناريوهات توفر فيها بنية E-ELAN المحددة ميزة متخصصة على الأجهزة القديمة، على الرغم من أن هذا أصبح نادرًا.
متى تختار YOLO26
يُعد YOLO26 الخيار الموصى به لجميع المشاريع التجارية والبحثية الجديدة تقريبًا نظرًا لتوازن أدائه وكفاءته في التدريب.
- الحوسبة الطرفية: مثالية للنشر على الأجهزة المحمولة (Android) أو الأجهزة المدمجة (Jetson، Raspberry Pi) نظرًا لحجمها الصغير CPU .
- التحليلات في الوقت الفعلي: يضمن التصميم NMS زمن انتقال ثابت، وهو أمر بالغ الأهمية للتطبيقات الحساسة من حيث السلامة مثل القيادة الذاتية أو الروبوتات.
- المهام المعقدة: عندما يتطلب مشروعك التبديل بين الكشف والتجزئة و OBB (على سبيل المثال، تحليل الصور الجوية)، فإن بنية الرأس المتعددة الاستخدامات لـ YOLO26 تكون متفوقة.
- بيئات ذات ذاكرة منخفضة: يتطلب YOLO26 CUDA أقل بكثير أثناء التدريب مقارنة بالنماذج الثقيلة أو البنى القديمة، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) الاستهلاكية.
الخلاصة
بينما YOLOv7 لحظة محورية في تاريخ اكتشاف الكائنات، يمثل YOLO26 المستقبل. من خلال الجمع بين استقرار المحسنات المستوحاة من LLM (MuSGD) والبنية المبسطة NMS، Ultralytics نموذجًا أسرع وأكثر دقة وأسهل في الاستخدام بشكل ملحوظ.
بالنسبة للمطورين الذين يسعون إلى بناء تطبيقات رؤية حاسوبية قوية ومستقبلية، فإن النظام البيئي المتكامل والوثائق الشاملة والأداء الفائق تجعل من YOLO26 الخيار الأمثل.
استكشف نماذج أخرى
إذا كنت مهتمًا باستكشاف خيارات أخرى ضمن Ultralytics ، ففكر في YOLO11 للمهام العامة أو RT-DETR للكشف القائم على المحولات حيث يتم إعطاء الأولوية للسياق العام على سرعة الاستدلال البحتة.