مقارنة شاملة: YOLOv7 مقابل EfficientDet لاكتشاف الكائنات

يعد اختيار بنية الشبكة العصبية المثلى أساسًا لأي مشروع ناجح في مجال الرؤية الحاسوبية. يقدم هذا الدليل مقارنة تقنية مفصلة بين نموذجين محوريين في تاريخ بنى الكشف عن الكائنات: YOLOv7 و EfficientDet. من خلال دراسة ابتكاراتهما المعمارية ومنهجيات التدريب وسيناريوهات النشر المثالية، يمكن للمطورين اتخاذ قرارات مستنيرة. سنستكشف أيضًا كيف أعادت التطورات الحديثة، ولا سيما Ultralytics الرائدة، تعريف أحدث ما توصلت إليه التكنولوجيا حاليًا.

أصول النموذج والتفاصيل الفنية

تم تطوير كلا النموذجين بواسطة فرق بحثية بارزة وقد قدما إنجازات كبيرة في مجال التعلم الآلي.

YOLOv7
المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
أرشيف: YOLOv7: حقيبة الحيل القابلة للتدريب تحدد أحدث ما توصلت إليه التقنيات لكاشفات الكائنات في الوقت الفعلي
جيت هاب: WongKinYiu/yolov7
الوثائق: وثائق Ultralytics YOLOv7

تعرف على المزيد حول YOLOv7

EfficientDet
المؤلفون: Mingxing Tan, Ruoming Pang, and Quoc V. Le
المنظمة: Google Research
التاريخ: 2019-11-20
أرشيف: EfficientDet: كشف الكائنات القابل للتطوير والفعال
GitHub: Google AutoML EfficientDet

تعرف على المزيد حول EfficientDet

الاختلافات المعمارية والتحليل المتوازن

إن فهم الاختلافات الهيكلية الأساسية بين هذه الشبكات أمر بالغ الأهمية لنشر النموذج بشكل فعال.

EfficientDet: التحجيم المركب و BiFPN

تم تطويره ضمن TensorFlow ، قدم EfficientDet نهجًا مبدئيًا لتوسيع نطاق النموذج. بدلاً من توسيع أو تعميق الشبكة بشكل تعسفي، استخدم Google طريقة توسيع نطاق مركبة تعمل على توسيع نطاق الدقة والعمق والعرض بشكل موحد.

علاوة على ذلك، قدم EfficientDet شبكة هرمية ثنائية الاتجاه للميزات (BiFPN). يتيح هذا المكون المعماري دمج الميزات متعددة النطاقات بسهولة وسرعة.

نقاط القوة: كفاءة عالية في المعلمات، حيث يحقق دقة متوسطة قوية (mAP) بعدد عمليات FLOPs أقل من العديد من النماذج المعاصرة. نقاط الضعف: يعتمد بشكل كبير على استراتيجيات بحث AutoML القديمة. قد يكون الدمج في مسارات عمل PyTorch الحديثة والديناميكية مرهقًا، وغالبًا ما يكون زمن الاستجابة على الأجهزة الطرفية أعلى من المتوقع على الرغم من انخفاض عدد عمليات FLOPs.

YOLOv7: مجموعة الأدوات المجانية القابلة للتدريب

YOLOv7 للاستدلال في الوقت الفعلي وتحسين التدريب. وقد أدخلت مفهوم شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، التي تسمح للنموذج بتعلم ميزات أكثر تنوعًا بشكل مستمر دون تدمير مسار التدرج الأصلي. YOLOv7 استخدمت YOLOv7 تقنية تسمى "trainable bag-of-freebies"، والتي تعمل على تحسين دقة الكشف بشكل كبير دون زيادة تكلفة الاستدلال.

نقاط القوة: سرعات معالجة استثنائية وزمن استجابة استدلالي (inference latency) مناسب، مما يجعله مثاليًا لتدفقات الفيديو عالية الإطارات في الثانية (FPS). نقاط الضعف: على الرغم من قدرته العالية، فإنه لا يزال يعتمد على صناديق الارتساء (anchor boxes) ويتطلب قمع غير الأقصى (NMS) أثناء المعالجة اللاحقة، مما قد يخلق عنق زجاجة في زمن الاستجابة في المشاهد المزدحمة للغاية.

ميزة النظام البيئي لـ Ultralytics

عند تقييم النماذج، فإن النظام البيئي المحيط بها لا يقل أهمية عن البنية الهندسية. توفر Ultralytics المتكاملة واجهة برمجة تطبيقات موحدة ووثائق شاملة ودعمًا نشطًا من المجتمع. تضمن هذه البيئة الموحدة استخدامًا أقل للذاكرة أثناء التدريب مقارنةً بنماذج المحولات الثقيلة، مما يضمن إنشاء نماذج أولية سريعة وتتبعًا سلسًا للتجارب.

مقاييس ومعايير الأداء

يوضح الجدول أدناه مقارنة بين مقاييس الأداء الرئيسية التي تمكن المطورين من تقييم المفاضلة بين السرعة وعدد المعلمات والدقة.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

كما هو موضح، بينما يحقق EfficientDet-d7 قيمة mAP عالية، تتخلف سرعة TensorRT الخاصة به بشكل كبير عن متغيرات YOLOv7، مما يسلط الضوء على هيمنة الأخير في اكتشاف الكائنات في الوقت الفعلي المعجل بواسطة GPU.

تطور اكتشاف الأجسام: YOLO26

في حين أن YOLOv7 EfficientDet قد أرسيا أسسًا أساسية، فإن مجال الذكاء الاصطناعي البصري يتطور بسرعة. بالنسبة للتطبيقات الحديثة التي تتطلب أعلى مستويات الكفاءة والدقة، نوصي بشدة بالترقية إلى YOLO26، الذي تم إصداره في يناير 2026.

يعالج YOLO26 القيود المتأصلة في الأجيال السابقة، ويوفر تنوعًا غير مسبوق في اكتشاف الكائنات وتقسيم الحالات وتصنيف الصور وتقدير الوضع.

تعرف على المزيد حول YOLO26

ابتكارات YOLO26 الرئيسية

تصميم شامل بدون NMS: يلغي YOLO26 بطبيعته المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). كان هذا النهج، الذي كان رائداً في البداية في YOLOv10، يبسط منطق النشر ويضمن تنفيذًا ثابتًا ومنخفض زمن الاستجابة بغض النظر عن كثافة الكائنات.
إزالة DFL: من خلال إزالة خسارة التركيز التوزيعي (DFL)، يتم تبسيط بنية النموذج بشكل كبير، مما يعزز التوافق مع بيئات الحوسبة الطرفية شديدة التقييد.
استدلال أسرع على CPU بنسبة تصل إلى 43%: مُحسّن بشكل كبير للبيئات التي تفتقر إلى وحدات GPU مخصصة، مما يجعله أسرع بشكل كبير من EfficientDet على الأجهزة خفيفة الوزن.
مُحسِّن MuSGD: مستوحى من تقنيات نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يجلب هذا المزيج من SGD و Muon استقرارًا على مستوى نماذج اللغة الكبيرة (LLM) وتقاربًا سريعًا إلى تدريب الرؤية الحاسوبية.
ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات رائعة في التعرف على الكائنات الصغيرة، وهي ميزة حاسمة لـ الصور الجوية وتطبيقات الطائرات بدون طيار.
تحسينات خاصة بالمهام: تتضمن فقدان التجزئة الدلالية والنموذج الأولي متعدد المقاييس لمهام التجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية المعقد، وخسارة زاوية متخصصة مصممة لإصلاح مشكلات حدود الصندوق المحيط الموجه (OBB).

بالنسبة للفرق التي تستخدم حاليًا أنظمة قديمة، فإن الانتقال إلى Ultralytics يفتح الباب أمام سير عمل مبسط حيث يمكن تدريب هذه النماذج المتطورة ونشرها بسهولة. يمكن للمطورين أيضًا استكشاف الإصدارات القوية السابقة مثل YOLO11 و YOLOv8 وفقًا لمتطلبات التوافق مع الإصدارات السابقة.

تدريب مبسط وسهولة الاستخدام

إحدى السمات المميزة Ultralytics هي سهولة الاستخدام. على عكس الإعداد المعقد والمتعدد التبعيات المطلوب لبيئات TensorFlow من EfficientDet، Ultralytics واجهة برمجة تطبيقات بسيطة تعتمد على لغة Python.

تقلل هذه البيئة من استخدامCUDA أثناء التدريب، مما يضمن إمكانية معالجة مجموعات البيانات الكبيرة بكفاءة دون حدوث أخطاء نفاد الذاكرة (OOM) التي تظهر عادةً في البنى الضخمة القائمة على Transformer.

مثال على الكود: البدء في استخدام Ultralytics

يوضح المقتطف التالي كيف يمكن للمطورين الاستفادة من Ultralytics لتدريب نموذج YOLO26 المتطور بسلاسة فور إخراجه من العلبة.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model for object detection
model = YOLO("yolo26n.pt")

# Train the model effortlessly using the integrated Ultralytics ecosystem
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Auto-selects optimal device
    batch=16,
)

# Validate the model's performance
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Export the model for edge deployment (e.g., OpenVINO for CPU optimization)
model.export(format="openvino")

التصدير للإنتاج

يمكن تصدير النماذج التي تم تدريبها عبر واجهة Ultralytics على الفور إلى تنسيقات إنتاج مختلفة مثل OpenVINO أو ONNX، مما يضمن إنتاجية عالية بغض النظر عن الأجهزة المستهدفة.

حالات الاستخدام المثالية والتطبيقات الواقعية

عند تصميم حل ما، من الضروري مواءمة نقاط قوة النموذج مع حالة الاستخدام المحددة.

متى تستخدم EfficientDet

يظل EfficientDet مرشحًا للبحوث الأكاديمية القديمة أو البيئات المرتبطة بشكل صارم بنظام Google البيئي حيث تكون التجارب المركبة للتوسع هي المحور الرئيسي. وتكون متغيراته الأصغر (d0-d2) مفيدة عندما يكون حجم القرص المطلق مقيدًا بشدة.

متى تستخدم YOLOv7

YOLOv7 في الإعدادات القديمة عالية الأداء، خاصةً عندما يكون PyTorch مفضلًا على TensorFlow. ولا يزال يستخدم على نطاق واسع في:

تحليلات الفيديو: معالجة تدفقات الأمان عالية معدل الإطارات حيث يتوفر تسريع GPU بكثرة.
التفتيش الصناعي: تحديد العيوب في خطوط تجميع التصنيع سريعة الحركة.

متى تختار YOLO26

بالنسبة لجميع عمليات النشر الجديدة، فإن YOLO26 هو الخيار الموصى به بلا منازع. إن توازن أدائه الذي لا مثيل له ونظامه البيئي القوي والمحافظ عليه جيدًا يجعله الخيار الأمثل لـ:

المدن الذكية وإدارة حركة المرور: يضمن تصميمه الخالي من NMS زمن انتقال استدلال ثابتًا، وهو أمر حيوي لتنسيق حركة المرور في الوقت الفعلي.
الروبوتات والأنظمة الذاتية: تضمن الزيادة المذهلة بنسبة 43% في سرعة استدلال CPU خوارزميات ملاحة عالية الاستجابة للأجهزة المدمجة.
المراقبة الزراعية والجوية: استخدام ProgLoss و STAL لتحديد الأجسام الصغيرة بدقة مثل المحاصيل المحددة أو الحياة البرية من الصور عالية الارتفاع.

باختصار، في حين أن EfficientDet و YOLOv7 سياقًا تاريخيًا قيمًا وفائدة متخصصة محددة، فإن مهندس الرؤية الحاسوبية الحديث يستفيد بشكل أفضل من اعتماد بنية Ultralytics التي تحل بذكاء العقبات السابقة بينما توسع حدود ما هو ممكن في مجال الذكاء الاصطناعي.