Link to this sectionYOLOv7 مقابل EfficientDet#
يعد اختيار بنية الشبكة العصبية المثلى أساس أي مشروع ناجح في مجال رؤية الحاسوب. يقدم هذا الدليل مقارنة تقنية مفصلة بين نموذجين محوريين في تاريخ بنيات اكتشاف الكائنات: YOLOv7 و EfficientDet. ومن خلال فحص ابتكاراتهما المعمارية، ومنهجيات التدريب، وسيناريوهات النشر المثالية، يمكن للمطورين اتخاذ قرارات مدروسة. وسنستكشف أيضًا كيف أعادت التطورات الحديثة، وخاصة نموذج Ultralytics YOLO26 الرائد، تعريف أحدث ما توصلت إليه التقنية حاليًا.
Link to this sectionأصول النماذج والتفاصيل التقنية#
تم تطوير كلا النموذجين من قبل فرق بحثية بارزة، وقد قدما تطورات كبيرة في مجال التعلم الآلي.
YOLOv7
المؤلفون: Chien-Yao Wang، و Alexey Bochkovskiy، و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: YOLOv7: مجموعة قابلة للتدريب من الحلول المجانية تضع معيارًا جديدًا لأجهزة اكتشاف الكائنات في الوقت الفعلي
GitHub: WongKinYiu/yolov7
التوثيق: توثيق Ultralytics YOLOv7
EfficientDet
المؤلفون: Mingxing Tan، و Ruoming Pang، و Quoc V. Le
المنظمة: Google Research
التاريخ: 2019-11-20
Arxiv: EfficientDet: اكتشاف كائنات قابل للتوسع وفعال
GitHub: Google AutoML EfficientDet
Link to this sectionالاختلافات المعمارية والتحليل المتوازن#
يعد فهم الاختلافات الهيكلية الأساسية بين هذه الشبكات أمرًا بالغ الأهمية من أجل نشر النموذج بفعالية.
Link to this sectionEfficientDet: القياس المركب وBiFPN#
تم تطوير EfficientDet ضمن نظام TensorFlow البيئي، وقدم نهجًا مبدئيًا لتحجيم النموذج. فبدلاً من توسيع الشبكة أو تعميقها بشكل عشوائي، استخدم باحثو Google طريقة تحجيم مركبة تقوم بتعديل الدقة والعمق والعرض بشكل موحد.
علاوة على ذلك، قدم EfficientDet شبكة هرمية ثنائية الاتجاه للميزات (BiFPN). تسمح هذه المكونات المعمارية بدمج الميزات متعددة المقاييس بسهولة وسرعة.
نقاط القوة: كفاءة عالية في المعاملات، وتحقيق متوسط دقة متوسط (mAP) قوي مع عدد أقل من FLOPs مقارنة بالعديد من النماذج المعاصرة. نقاط الضعف: يعتمد بشكل كبير على استراتيجيات بحث AutoML القديمة. يمكن أن يكون التكامل في سير عمل PyTorch الحديث والديناميكي مرهقًا، وغالبًا ما يكون وقت الاستجابة (latency) على أجهزة الحافة أعلى من المتوقع على الرغم من انخفاض عدد FLOPs.
Link to this sectionYOLOv7: مجموعة الحلول المجانية القابلة للتدريب#
أعطى YOLOv7 الأولوية لـ الاستدلال في الوقت الفعلي وتحسين التدريب. وقدم مفهوم شبكة تجميع الطبقات الفعالة والممتدة (E-ELAN)، والتي تسمح للنموذج بتعلم ميزات متنوعة بشكل مستمر دون تدمير مسار التدرج الأصلي. كما استخدم YOLOv7 تقنية تسمى "مجموعة الحلول المجانية القابلة للتدريب"، والتي تحسن دقة الاكتشاف بشكل كبير دون زيادة تكلفة الاستدلال.
Strengths: Exceptional processing speeds and favorable inference latency, making it ideal for high-FPS video streams. Weaknesses: While highly capable, it still relies on anchor boxes and requires Non-Maximum Suppression (NMS) during post-processing, which can create a latency bottleneck in highly crowded scenes.
عند تقييم النماذج، يعد النظام البيئي المحيط لا يقل أهمية عن البنية المعمارية. توفر منصة Ultralytics الموحدة واجهة برمجة تطبيقات (API) شاملة، وتوثيقًا واسع النطاق، ودعمًا مجتمعيًا نشطًا. تضمن هذه البيئة الموحدة استخدامًا أقل للذاكرة أثناء التدريب مقارنة بنماذج Transformer الثقيلة، مما يضمن سرعة النماذج الأولية و تتبع التجارب بسلاسة.
Link to this sectionمقاييس الأداء والمعايير#
يوضح الجدول أدناه مقارنة بين مقاييس الأداء الرئيسية التي تمكن المطورين من تقييم المفاضلات بين السرعة وعدد المعاملات والدقة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
كما هو موضح، بينما يحقق EfficientDet-d7 مستوى مرتفعًا من mAP، فإن سرعته في TensorRT تتأخر بشكل كبير عن متغيرات YOLOv7، مما يسلط الضوء على هيمنة الأخير في اكتشاف الكائنات في الوقت الفعلي المسرع بواسطة وحدة معالجة الرسومات (GPU).
Link to this sectionتطور اكتشاف الكائنات: YOLO26#
بينما وضع YOLOv7 و EfficientDet أساسًا حيويًا، يتطور مشهد رؤية الذكاء الاصطناعي بسرعة. بالنسبة للتطبيقات الحديثة التي تتطلب ذروة الكفاءة والدقة، نوصي بشدة بالترقية إلى YOLO26، الذي تم إصداره في يناير 2026.
يعالج YOLO26 القيود المتأصلة في الأجيال السابقة، ويوفر تنوعًا غير مسبوق في اكتشاف الكائنات، و تقسيم المثيلات، و تصنيف الصور، و تقدير الوضعية.
Link to this sectionابتكارات YOLO26 الرئيسية#
- تصميم شامل خالي من NMS: يلغي YOLO26 محليًا المعالجة اللاحقة لـ NMS. هذا التصميم، الذي تم تبنيه لأول مرة في YOLOv10، يبسط منطق النشر ويضمن تنفيذًا ثابتًا ومنخفض زمن الوصول بغض النظر عن كثافة الكائنات.
- DFL Removal: By removing the Distribution Focal Loss (DFL), the model architecture is vastly simplified, enhancing compatibility with highly constrained edge computing environments.
- استدلال أسرع على وحدة المعالجة المركزية (CPU) بنسبة تصل إلى 43%: تم تحسينه بشكل كبير للبيئات التي تفتقر إلى وحدات معالجة رسومات مخصصة، مما يجعله أسرع بشكل كبير من EfficientDet على الأجهزة خفيفة الوزن.
- محسن MuSGD: مستوحى من تقنيات النماذج اللغوية الكبيرة (مثل Kimi K2 من Moonshot AI)، هذا الهجين من SGD و Muon يوفر استقرارًا على مستوى النماذج اللغوية الكبيرة وتقاربًا سريعًا لـ تدريب رؤية الحاسوب.
- ProgLoss + STAL: تقدم هذه الدوال المتقدمة للخسارة تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهي ميزة حاسمة لـ الصور الجوية و تطبيقات الطائرات بدون طيار.
- تحسينات خاصة بالمهمة: تشمل خسارة التقسيم الدلالي (Semantic segmentation loss) ونموذج أولي متعدد المقاييس لمهام التقسيم، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية المعقدة، وخسارة زاوية متخصصة مصممة لإصلاح مشكلات حدود صندوق التثبيت الموجه (OBB).
بالنسبة للفرق التي تستخدم حاليًا أنظمة قديمة، فإن الانتقال إلى منصة Ultralytics يفتح سير عمل مبسطًا حيث يمكن تدريب هذه النماذج المتطورة ونشرها بسهولة. يمكن للمطورين أيضًا استكشاف الإصدارات القوية السابقة مثل YOLO11 و YOLOv8 اعتمادًا على متطلبات محددة للتوافق مع الإصدارات السابقة.
Link to this sectionتدريب مبسط وسهولة في الاستخدام#
أحد الخصائص المحددة لنماذج Ultralytics هو سهولة الاستخدام المطلقة. على عكس الإعداد المعقد ومتعدد التبعيات المطلوب لبيئات TensorFlow AutoML الخاصة بـ EfficientDet، توفر Ultralytics واجهة برمجة تطبيقات (API) بسيطة و Pythonic.
This environment minimizes CUDA memory usage during training, ensuring that even large datasets can be processed efficiently without Out-Of-Memory (OOM) errors commonly seen in bulky Transformer-based architectures.
Link to this sectionمثال برمجي: البدء مع Ultralytics#
يوضح المقتطف التالي كيف يمكن للمطورين الاستفادة من حزمة Ultralytics لتدريب نموذج YOLO26 متطور بسلاسة خارج الصندوق.
from ultralytics import YOLO
# Initialize the state-of-the-art YOLO26 model for object detection
model = YOLO("yolo26n.pt")
# Train the model effortlessly using the integrated Ultralytics ecosystem
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Auto-selects optimal device
batch=16,
)
# Validate the model's performance
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Export the model for edge deployment (e.g., OpenVINO for CPU optimization)
model.export(format="openvino")Link to this sectionحالات الاستخدام المثالية والتطبيقات الواقعية#
عند هندسة حل ما، يعد مواءمة نقاط قوة النموذج مع حالة الاستخدام المحددة أمرًا ضروريًا.
Link to this sectionمتى تستخدم EfficientDet#
لا يزال EfficientDet مرشحًا للبحوث الأكاديمية القديمة أو البيئات المقيدة تمامًا بنظام Google Cloud البيئي حيث يكون التركيز الأساسي على تجارب التحجيم المركب. متغيراته الأصغر (d0-d2) مفيدة عندما يكون حجم القرص محدودًا بشدة.
Link to this sectionمتى تستخدم YOLOv7#
يتفوق YOLOv7 في الإعدادات القديمة عالية الأداء، خاصة حيث يُفضل تكامل PyTorch على TensorFlow. لا يزال يُستخدم على نطاق واسع في:
- تحليلات الفيديو: معالجة بث الأمان عالي الإطارات حيث يتوفر تسريع GPU بوفرة.
- الفحص الصناعي: تحديد العيوب على خطوط تجميع التصنيع سريعة الحركة.
Link to this sectionمتى تختار YOLO26#
لجميع عمليات النشر الجديدة، YOLO26 هو التوصية التي لا جدال فيها. إن توازن الأداء الذي لا مثيل له و النظام البيئي القوي والمُدار جيدًا يجعله الخيار الأمثل لـ:
- المدن الذكية وإدارة المرور: يضمن تصميمه الخالي من NMS زمن وصول ثابت للاستدلال، وهو أمر حيوي لـ تنسيق المرور في الوقت الفعلي.
- الروبوتات والأنظمة ذاتية القيادة: يضمن التعزيز المثير للإعجاب بنسبة 43% في سرعة استدلال وحدة المعالجة المركزية (CPU) خوارزميات ملاحة سريعة الاستجابة للأجهزة المضمنة.
- المراقبة الزراعية والجوية: الاستفادة من ProgLoss و STAL لتحديد الكائنات الصغيرة بدقة مثل محاصيل معينة أو الحياة البرية من الصور عالية الارتفاع.
باختصار، في حين توفر EfficientDet و YOLOv7 سياقًا تاريخيًا قيمًا وفائدة متخصصة محددة، فإن مهندس رؤية الحاسوب الحديث يخدمه بشكل أفضل اعتماد بنية Ultralytics YOLO26، التي تحل ببراعة الاختناقات السابقة مع دفع حدود ما هو ممكن في الذكاء الاصطناعي.