Link to this sectionYOLOv7 مقابل YOLOv6-3.0#
يتطور مجال الرؤية الحاسوبية باستمرار، حيث تدفع نماذج اكتشاف الأجسام الجديدة حدود السرعة والدقة بشكل متواصل. وتعد YOLOv7 وYOLOv6-3.0 من المحطات البارزة في هذه المسيرة. فقد قدم كلا النموذجين ابتكارات معمارية فريدة مصممة لزيادة الإنتاجية والدقة إلى أقصى حد للتطبيقات الواقعية. تقدم هذه الصفحة تحليلاً تقنيًا متعمقًا لكلا البنيتين، وتقارن أداءهما ومنهجيات التدريب وحالات الاستخدام المثالية لمساعدتك في اتخاذ قرار مستنير لمشروعك القادم في مجال الذكاء الاصطناعي.
Link to this sectionYOLOv7: الرائد في مفهوم حقيبة الهدايا#
أُطلقت YOLOv7 في منتصف عام 2022، وقدمت العديد من الاستراتيجيات المبتكرة لتحسين معمارية الشبكة دون زيادة تكلفة الاستدلال. وقد ركزت بشكل كبير على "مجموعة من الميزات المجانية" (bag-of-freebies) القابلة للتدريب لتحسين الدقة مع الحفاظ على الأداء في الوقت الفعلي.
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المؤسسة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
- التوثيق: توثيق Ultralytics YOLOv7
Link to this sectionأبرز ملامح المعمارية#
تتميز YOLOv7 بشبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تسمح هذه المعمارية للنموذج بتعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسار للتدرج. علاوة على ذلك، تستخدم YOLOv7 تقنيات إعادة التقييم الهيكلي أثناء الاستدلال لدمج طبقات الالتفاف، مما يقلل بشكل فعال من عدد المعلمات ووقت الحساب دون التضحية بالتمثيلات المتعلمة.
يتميز النموذج أيضًا باستراتيجية تدريب فريدة تعتمد على الرأس المساعد (auxiliary head). فمن خلال استخدام "رأس رئيسي" (lead head) للتنبؤات النهائية و"رأس مساعد" لتوجيه التدريب في الطبقات المتوسطة، تحقق YOLOv7 تقاربًا أفضل واستخراجًا أغنى للميزات، وهو أمر مفيد بشكل خاص عند التعامل مع مهام اكتشاف الأجسام الصعبة.
Link to this sectionYOLOv6-3.0: إنتاجية بمستوى صناعي#
تم تطوير YOLOv6-3.0 بواسطة قسم الرؤية الحاسوبية في شركة Meituan، وصُممت صراحةً لتكون "كاشف أجسام من الجيل التالي للتطبيقات الصناعية". أُطلقت في أوائل عام 2023، وتركز بشكل كبير على زيادة استخدام الأجهزة إلى أقصى حد، وخاصة وحدات معالجة الرسومات (GPU) من NVIDIA.
- المؤلفون: Chuyi Li، وLulu Li، وYifei Geng، وآخرون.
- المؤسسة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
- التوثيق: توثيق Ultralytics YOLOv6
Link to this sectionأبرز ملامح المعمارية#
تتبنى YOLOv6-3.0 هيكل EfficientRep، والذي تم تحسينه بشكل كبير للمعالجة المتوازية على وحدات معالجة الرسومات. وهذا يجعله فعالاً للغاية للمعالجة الجماعية واسعة النطاق. قدم الإصدار 3.0 وحدة ربط ثنائية الاتجاه (BiC) في الرقبة (neck) لتعزيز دمج الميزات عبر مقاييس مختلفة، مما يحسن قدرة النموذج على اكتشاف الأجسام بأحجام متفاوتة.
بالإضافة إلى ذلك، تستخدم YOLOv6-3.0 استراتيجية التدريب بمساعدة المرساة (AAT). يجمع هذا النهج المبتكر بين مزايا التدريب المعتمد على المرساة (anchor-based) والاستدلال الخالي من المرساة (anchor-free)، مما يسمح للنموذج بالاستمتاع باستقرار المراسي أثناء مرحلة التعلم مع الحفاظ على سرعة وبساطة التصميم الخالي من المراسي أثناء النشر.
Link to this sectionمقارنة الأداء#
عند تقييم النماذج للإنتاج، يعد تحقيق التوازن بين الدقة (mAP) وسرعة الاستدلال والنفقات الحسابية (FLOPs) أمرًا بالغ الأهمية. فيما يلي مقارنة مفصلة للمتغيرات القياسية لكلا النموذجين.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
تعد YOLOv6-3.0 مناسبة بشكل استثنائي لبيئات وحدات معالجة الرسومات عالية الإنتاجية (مثل TensorRT)، بينما توفر YOLOv7 توازناً قوياً للأنظمة التي يتم فيها إعطاء الأولوية القصوى للاحتفاظ بالميزات.
Link to this sectionميزة Ultralytics#
على الرغم من أن المستودعات المستقلة لـ YOLOv7 وYOLOv6-3.0 قوية، إلا أن الاستفادة منها داخل نظام Ultralytics البيئي تحول تجربة المطور. تقوم حزمة ultralytics بلغة Python بتوحيد هذه المعماريات المتنوعة ضمن إطار عمل واحد بديهي.
- سهولة الاستخدام: لقد ولت أيام برامج الإعداد المعقدة. تتيح لك واجهة برمجة تطبيقات Ultralytics تحميل وتدريب ونشر نماذج YOLOv7 أو YOLOv6 بأقل قدر من التعليمات البرمجية الجاهزة. يمكنك التبديل بسهولة بين المعماريات بمجرد تغيير ملف أوزان النموذج.
- نظام بيئي مُصان جيداً: توفر Ultralytics بيئة قوية مع تحديثات متكررة، مما يضمن التوافق الأصلي مع أحدث توزيعات PyTorch وإصدارات CUDA.
- كفاءة التدريب: تم تحسين مسارات التدريب بعمق لاستخدام موارد وحدة معالجة الرسومات بفعالية. علاوة على ذلك، تتطلب نماذج Ultralytics YOLO عموماً متطلبات ذاكرة أقل أثناء التدريب مقارنة بنماذج المحولات (transformer) الثقيلة (مثل RT-DETR)، مما يتيح أحجام دفعات أكبر على الأجهزة الاستهلاكية.
- تعدد الاستخدامات: بالإضافة إلى اكتشاف الصناديق المحيطة القياسية، يدعم إطار عمل Ultralytics بسلاسة مهام متقدمة مثل تقدير الوضعية وتقسيم المثيلات عبر عائلات النماذج المتوافقة، وهي ميزة غالباً ما تفتقر إليها مستودعات الأبحاث المعزولة.
Link to this sectionمثال برمجي: التدريب والاستدلال#
دمج هذه النماذج في مسار Python الخاص بك أمر مباشر. تأكد من تهيئة مجموعة بياناتك بشكل صحيح (على سبيل المثال، COCO القياسي) وقم بتشغيل ما يلي:
from ultralytics import YOLO
# Load a pretrained YOLOv7 model (or 'yolov6n.pt' for YOLOv6)
model = YOLO("yolov7.pt")
# Train the model with built-in hyperparameter management
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image URL or local path
predictions = model("https://ultralytics.com/images/bus.jpg")
# Visualize the detection results
predictions[0].show()Link to this sectionحالات الاستخدام المثالية#
Link to this sectionمتى تختار YOLOv7#
تتفوق YOLOv7 في السيناريوهات التي تتطلب دقة عالية واستخراج ميزات كثيف.
- المراقبة المعقدة: قدرتها على الاحتفاظ بالتفاصيل الدقيقة تجعلها مناسبة لمراقبة المشاهد المزدحمة أو اكتشاف الشذوذات الصغيرة في البنية التحتية للمدن الذكية.
- المقارنة المعيارية الأكاديمية: تُستخدم غالباً كخط أساس قوي في الأبحاث نظراً لفلسفة تصميمها الشاملة "مجموعة الميزات المجانية" (bag-of-freebies).
Link to this sectionمتى تختار YOLOv6-3.0#
تعد YOLOv6-3.0 هي العمود الفقري لمسارات العمل عالية الحجم والمُسرَّعة بواسطة وحدات معالجة الرسومات.
- الأتمتة الصناعية: مثالية لخطوط المصانع واكتشاف عيوب التصنيع حيث تقوم وحدات معالجة الرسومات من فئة الخوادم بمعالجة تدفقات فيديو متعددة في وقت واحد.
- التحليلات عالية الإنتاجية: ممتازة لمعالجة أرشيفات الفيديو غير المتصلة بالإنترنت حيث يكون الهدف الأساسي هو تعظيم عدد الإطارات في الثانية.
Link to this sectionالمستقبل: YOLO26#
بينما تتمتع YOLOv7 وYOLOv6-3.0 بقدرات عالية، فإن الوتيرة السريعة لابتكارات الذكاء الاصطناعي تتطلب كفاءة أكبر. أُطلقت في يناير 2026، وتمثل Ultralytics YOLO26 قفزة جيلية في الرؤية الحاسوبية، حيث تعالج بشكل منهجي قيود المعماريات القديمة.
إذا كنت تبدأ مشروعاً جديداً، فمن المستحسن بشدة استخدام YOLO26 بدلاً من الأجيال السابقة. إنها تقدم العديد من الميزات الرائدة:
- تصميم بدون NMS من البداية إلى النهاية: بالبناء على الأسس التي وضعها YOLOv10، تلغي YOLO26 محلياً قمع الحد الأقصى غير (NMS). وهذا يقلل من النفقات العامة للمعالجة اللاحقة، مما يبسط النشر على تطبيقات الأجهزة المحمولة ويضمن استدلالاً حتمياً ومنخفض الكمون للغاية.
- مُحسّن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة (LLM) المتقدمة (مثل تلك المستخدمة في Kimi K2 من Moonshot AI)، تستخدم YOLO26 مُحسّناً هجيناً يجمع بين SGD وMuon. وهذا يضمن ديناميكيات تدريب أكثر استقراراً وتقارباً أسرع بشكل كبير.
- أسرع بنسبة تصل إلى 43% في استدلال وحدة المعالجة المركزية (CPU): من خلال إزالة توزيع Focal Loss (DFL) بشكل استراتيجي، تحقق YOLO26 سرعات هائلة على وحدات المعالجة المركزية. وهذا يجعلها البطل بلا منازع لبيئات الحافة مثل Raspberry Pi وأجهزة استشعار إنترنت الأشياء (IoT) البعيدة.
- ProgLoss + STAL: دوال خسارة متقدمة صُممت خصيصاً لتحسين التعرف على الأجسام الصغيرة، وهو ضعف تاريخي في أجهزة الكشف أحادية المرحلة.
من خلال الجمع بين هذه الابتكارات ومنصة Ultralytics القوية، توفر YOLO26 أداءً لا مثيل له، وتعدداً في الاستخدامات، وسهولة في النشر لمهندس تعلم الآلة الحديث.