YOLOv7: ट्रेनेबल बैग-ऑफ-फ्रीबीज

YOLOv7 एक अत्याधुनिक रीयल-टाइम ऑब्जेक्ट डिटेक्टर है जो 5 FPS से 160 FPS तक की सीमा में गति और सटीकता दोनों में सभी ज्ञात ऑब्जेक्ट डिटेक्टरों को पार करता है। 56.8 एफपीएस या उच्चतर के साथ सभी ज्ञात रीयल-टाइम ऑब्जेक्ट डिटेक्टरों के बीच इसकी उच्चतम सटीकता (30% एपी) है GPU वी100. इसके अलावा, YOLOv7 अन्य ऑब्जेक्ट डिटेक्टरों जैसे YOLOR, YOLOX, Scaled-YOLOv4, YOLOv5, और गति और सटीकता में कई अन्य। मॉडल को किसी अन्य डेटासेट या पूर्व-प्रशिक्षित वजन का उपयोग किए बिना खरोंच से एमएस सीओसीओ डेटासेट पर प्रशिक्षित किया जाता है। YOLOv7 के लिए स्रोत कोड GitHub पर उपलब्ध है।

SOTA ऑब्जेक्ट डिटेक्टरों के साथ YOLOv7 तुलना

SOTA ऑब्जेक्ट डिटेक्टरों की तुलना

में परिणामों से YOLO तुलना तालिका हम जानते हैं कि प्रस्तावित विधि में व्यापक रूप से सर्वोत्तम गति-सटीकता व्यापार-बंद है। अगर हम YOLOv7-tiny-SiLU की तुलना करें YOLOv5-एन (आर 6.1), हमारी विधि एपी पर 127 एफपीएस तेज और 10.7% अधिक सटीक है। इसके अलावा, YOLOv7 में 161 एफपीएस की फ्रेम दर पर 51.4% एपी है, जबकि उसी एपी के साथ पीपीयोलो-एल में केवल 78 एफपीएस फ्रेम दर है। पैरामीटर उपयोग के संदर्भ में, YOLOv7 PPYOLOE-L से 41% कम है। यदि हम YOLOv7-X की तुलना 114 fps अनुमान गति से करते हैं YOLOv5-L (r6.1) 99 fps अनुमान गति के साथ, YOLOv7-X AP में 3.9% तक सुधार कर सकता है। यदि YOLOv7-X की तुलना इनके साथ की जाती है YOLOv5-X (r6.1) समान पैमाने का, YOLOv7-X की अनुमान गति 31 fps तेज है। इसके अलावा, मापदंडों और गणना की मात्रा के संदर्भ में, YOLOv7-X की तुलना में 22% पैरामीटर और 8% गणना को कम करता है YOLOv5-एक्स (आर 6.1), लेकिन एपी में 2.2% (स्रोत) से सुधार करता है।

को गढ़ना	परम ^(एम)	फ्लॉप ^(जी)	आकार वाला ^{(पिक्सेल)}	एफपीएस	एपी^{टेस्ट / 50-95}	एपी^{परीक्षा 50}	एपी^{परीक्षा 75}	एपी^{परीक्षा दक्षिणी}	एपी^{परीक्षा लाख}	एपी^{परीक्षा बड़ा}
योलॉक्स-एस	9.0M	26.8G	640	102	40.5% / 40.5%	-	-	-	-	-
योलॉक्स-एम	25.3M	73.8G	640	81	47.2% / 46.9%	-	-	-	-	-
योलॉक्स-एल	54.2M	155.6G	640	69	50.1% / 49.7%	-	-	-	-	-
योलॉक्स-एक्स	99.1M	281.9G	640	58	51.5% / 51.1%	-	-	-	-	-

पीपीयोलो-एस	7.9M	17.4G	640	208	43.1% / 42.7%	60.5%	46.6%	23.2%	46.4%	56.9%
पीपीयोलो-एम	23.4M	49.9G	640	123	48.9% / 48.6%	66.5%	53.0%	28.6%	52.9%	63.8%
पीपीयोलो-एल	52.2M	110.1G	640	78	51.4% / 50.9%	68.9%	55.6%	31.4%	55.3%	66.1%
पीपीयोलो-एक्स	98.4M	206.6G	640	45	52.2% / 51.9%	69.9%	56.5%	33.3%	56.3%	66.4%

YOLOv5-एन (आर 6.1)	1.9M	4.5G	640	159	- / 28.0%	-	-	-	-	-
YOLOv5-एस (आर 6.1)	7.2M	16.5G	640	156	- / 37.4%	-	-	-	-	-
YOLOv5-एम (आर 6.1)	21.2M	49.0G	640	122	- / 45.4%	-	-	-	-	-
YOLOv5-एल (आर 6.1)	46.5M	109.1G	640	99	- / 49.0%	-	-	-	-	-
YOLOv5-एक्स (आर 6.1)	86.7M	205.7G	640	83	50.7%	-	-	-	-	-

योलोर-सीएसपी	52.9M	120.4G	640	106	51.1% / 50.8%	69.6%	55.7%	31.7%	55.3%	64.7%
योलोर-सीएसपी-एक्स	96.9M	226.8G	640	87	53.0% / 52.7%	71.4%	57.9%	33.7%	57.1%	66.8%
YOLOv7-टिनी-SiLU	6.2M	13.8G	640	286	38.7% / 38.7%	56.7%	41.7%	18.8%	42.4%	51.9%
योलोव7	36.9M	104.7G	640	161	51.4% / 51.2%	69.7%	55.9%	31.8%	55.5%	65.0%
योलोव्7-एक्स	71.3M	189.9G	640	114	53.1% / 52.9%	71.2%	57.8%	33.8%	57.1%	67.4%

YOLOv5-N6 (r6.1)	3.2M	18.4G	1280	123	- / 36.0%	-	-	-	-	-
YOLOv5-एस 6 (आर 6.1)	12.6M	67.2G	1280	122	- / 44.8%	-	-	-	-	-
YOLOv5-एम 6 (आर 6.1)	35.7M	200.0G	1280	90	- / 51.3%	-	-	-	-	-
YOLOv5-एल 6 (आर 6.1)	76.8M	445.6G	1280	63	- / 53.7%	-	-	-	-	-
YOLOv5-X6 (r6.1)	140.7M	839.2G	1280	38	55.0%	-	-	-	-	-

योलोर-P6	37.2M	325.6G	1280	76	53.9% / 53.5%	71.4%	58.9%	36.1%	57.7%	65.6%
योलोर-W6	79.8G	453.2G	1280	66	55.2% / 54.8%	72.7%	60.5%	37.7%	59.1%	67.1%
योलोर-ई6	115.8M	683.2G	1280	45	55.8% / 55.7%	73.4%	61.1%	38.4%	59.7%	67.7%
योलोर-डी6	151.7M	935.6G	1280	34	56.5% / 56.1%	74.1%	61.9%	38.9%	60.4%	68.7%

योलोव्7-डब्ल्यू6	70.4M	360.0G	1280	84	54.9% / 54.6%	72.6%	60.1%	37.3%	58.7%	67.1%
योलोव्7-ई6	97.2M	515.2G	1280	56	56.0% / 55.9%	73.5%	61.2%	38.0%	59.9%	68.4%
योलोव्7-डी6	154.7M	806.8G	1280	44	56.6% / 56.3%	74.0%	61.8%	38.8%	60.1%	69.5%
योलोव्7-ई6ई	151.7M	843.2G	1280	36	56.8% / 56.8%	74.4%	62.1%	39.3%	60.5%	69.0%

विहंगावलोकन

रीयल-टाइम ऑब्जेक्ट डिटेक्शन कई कंप्यूटर विज़न सिस्टम में एक महत्वपूर्ण घटक है, जिसमें मल्टी-ऑब्जेक्ट ट्रैकिंग, स्वायत्त ड्राइविंग, रोबोटिक्स और मेडिकल इमेज एनालिसिस शामिल हैं। हाल के वर्षों में, रीयल-टाइम ऑब्जेक्ट डिटेक्शन डेवलपमेंट ने कुशल आर्किटेक्चर को डिजाइन करने और विभिन्न सीपीयू, जीपीयू और तंत्रिका प्रसंस्करण इकाइयों (एनपीयू) की अनुमान गति में सुधार करने पर ध्यान केंद्रित किया है। YOLOv7 दोनों मोबाइल का समर्थन करता है GPU और GPU उपकरण, किनारे से बादल तक।

आर्किटेक्चर ऑप्टिमाइज़ेशन पर ध्यान केंद्रित करने वाले पारंपरिक रीयल-टाइम ऑब्जेक्ट डिटेक्टरों के विपरीत, YOLOv7 प्रशिक्षण प्रक्रिया के अनुकूलन पर ध्यान केंद्रित करता है। इसमें मॉड्यूल और अनुकूलन विधियां शामिल हैं जो अनुमान लागत में वृद्धि किए बिना ऑब्जेक्ट डिटेक्शन की सटीकता में सुधार करने के लिए डिज़ाइन की गई हैं, एक अवधारणा जिसे "ट्रेनेबल बैग-ऑफ-फ्रीबीज" के रूप में जाना जाता है।

प्रमुख विशेषताऐं

YOLOv7 कई प्रमुख विशेषताओं का परिचय देता है:

मॉडल पुन: पैरामीटरीकरण: YOLOv7 एक नियोजित पुन: पैरामीटर मॉडल का प्रस्ताव करता है, जो ढाल प्रसार पथ की अवधारणा के साथ विभिन्न नेटवर्क में परतों पर लागू एक रणनीति है।
डायनेमिक लेबल असाइनमेंट: कई आउटपुट परतों वाले मॉडल का प्रशिक्षण एक नया मुद्दा प्रस्तुत करता है: "विभिन्न शाखाओं के आउटपुट के लिए गतिशील लक्ष्य कैसे निर्दिष्ट करें?" इस समस्या को हल करने के लिए, YOLOv7 एक नई लेबल असाइनमेंट विधि पेश करता है जिसे मोटे-टू-फाइन लीड गाइडेड लेबल असाइनमेंट कहा जाता है।
विस्तारित और यौगिक स्केलिंग: YOLOv7 रीयल-टाइम ऑब्जेक्ट डिटेक्टर के लिए "विस्तार" और "यौगिक स्केलिंग" विधियों का प्रस्ताव करता है जो प्रभावी रूप से मापदंडों और गणना का उपयोग कर सकते हैं।
दक्षता: YOLOv7 द्वारा प्रस्तावित विधि प्रभावी रूप से लगभग 40% मापदंडों और अत्याधुनिक रीयल-टाइम ऑब्जेक्ट डिटेक्टर की 50% गणना को कम कर सकती है, और इसमें तेज अनुमान गति और उच्च पहचान सटीकता है।

उपयोग के उदाहरण

लेखन के समय तक, Ultralytics वर्तमान में YOLOv7 मॉडल का समर्थन नहीं करता है। इसलिए, YOLOv7 का उपयोग करने में रुचि रखने वाले किसी भी उपयोगकर्ता को स्थापना और उपयोग निर्देशों के लिए सीधे YOLOv7 GitHub रिपॉजिटरी को संदर्भित करना होगा।

YOLOv7 का उपयोग करने के लिए आपके द्वारा उठाए जा सकने वाले विशिष्ट चरणों का संक्षिप्त विवरण यहां दिया गया है:

YOLOv7 GitHub रिपॉजिटरी पर जाएं: https://github.com/WongKinYiu/yolov7।
स्थापना के लिए README फ़ाइल में दिए गए निर्देशों का पालन करें। इसमें आमतौर पर रिपॉजिटरी की क्लोनिंग करना, आवश्यक निर्भरताएं स्थापित करना और किसी भी आवश्यक पर्यावरण चर को स्थापित करना शामिल है।
एक बार इंस्टॉलेशन पूरा हो जाने के बाद, आप रिपॉजिटरी में दिए गए उपयोग निर्देशों के अनुसार मॉडल को प्रशिक्षित और उपयोग कर सकते हैं। इसमें आमतौर पर आपका डेटासेट तैयार करना, मॉडल मापदंडों को कॉन्फ़िगर करना, मॉडल को प्रशिक्षित करना और फिर ऑब्जेक्ट डिटेक्शन करने के लिए प्रशिक्षित मॉडल का उपयोग करना शामिल होता है।

कृपया ध्यान दें कि आपके विशिष्ट उपयोग के मामले और YOLOv7 रिपॉजिटरी की वर्तमान स्थिति के आधार पर विशिष्ट चरण भिन्न हो सकते हैं। इसलिए, YOLOv7 GitHub रिपॉजिटरी में दिए गए निर्देशों को सीधे संदर्भित करने की दृढ़ता से अनुशंसा की जाती है।

इसके कारण होने वाली किसी भी असुविधा के लिए हमें खेद है और हम इस दस्तावेज़ को उपयोग के उदाहरणों के साथ अपडेट करने का प्रयास करेंगे Ultralytics एक बार YOLOv7 के लिए समर्थन लागू हो जाने के बाद।

प्रशंसा पत्र और पावती

हम YOLOv7 लेखकों को रीयल-टाइम ऑब्जेक्ट डिटेक्शन के क्षेत्र में उनके महत्वपूर्ण योगदान के लिए स्वीकार करना चाहते हैं:

बिबटेक्स

@article{wang2022yolov7,
  title={{YOLOv7}: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors},
  author={Wang, Chien-Yao and Bochkovskiy, Alexey and Liao, Hong-Yuan Mark},
  journal={arXiv preprint arXiv:2207.02696},
  year={2022}
}

मूल YOLOv7 पेपर arXiv पर पाया जा सकता है। लेखकों ने अपना काम सार्वजनिक रूप से उपलब्ध कराया है, और कोडबेस को GitHub पर एक्सेस किया जा सकता है। हम क्षेत्र को आगे बढ़ाने और उनके काम को व्यापक समुदाय के लिए सुलभ बनाने में उनके प्रयासों की सराहना करते हैं।

अक्सर पूछे जाने वाले प्रश्न

YOLOv7 क्या है और इसे रीयल-टाइम ऑब्जेक्ट डिटेक्शन में सफलता क्यों माना जाता है?

YOLOv7 एक अत्याधुनिक रीयल-टाइम ऑब्जेक्ट डिटेक्शन मॉडल है जो अद्वितीय गति और सटीकता प्राप्त करता है। यह अन्य मॉडलों से आगे निकल जाता है, जैसे कि YOLOX, YOLOv5, और PPYOLOE, दोनों मापदंडों के उपयोग और अनुमान की गति में। YOLOv7 की विशिष्ट विशेषताओं में इसका मॉडल री-पैरामीटराइजेशन और डायनेमिक लेबल असाइनमेंट शामिल है, जो अनुमान लागत में वृद्धि किए बिना इसके प्रदर्शन को अनुकूलित करता है। इसकी वास्तुकला के बारे में अधिक तकनीकी विवरण और अन्य अत्याधुनिक ऑब्जेक्ट डिटेक्टरों के साथ तुलना मीट्रिक के लिए, YOLOv7 पेपर देखें।

YOLOv7 पिछले पर कैसे सुधार करता है YOLO YOLOv4 और जैसे मॉडल YOLOv5?

YOLOv7 मॉडल री-पैरामीटराइजेशन और डायनेमिक लेबल असाइनमेंट सहित कई इनोवेशन पेश करता है, जो प्रशिक्षण प्रक्रिया को बढ़ाता है और अनुमान सटीकता में सुधार करता है। की तुलना में YOLOv5, YOLOv7 गति और सटीकता को काफी बढ़ा देता है। उदाहरण के लिए, YOLOv7-X सटीकता में 2.2% की सुधार करता है और इसकी तुलना में मापदंडों को 22% तक कम करता है YOLOv5विस्तृत तुलना SOTA ऑब्जेक्ट डिटेक्टरों के साथ प्रदर्शन तालिका YOLOv7 तुलना में पाई जा सकती है।

क्या मैं YOLOv7 का उपयोग कर सकता हूं Ultralytics उपकरण और प्लेटफार्म?

अब तक, Ultralytics अपने उपकरणों और प्लेटफार्मों में सीधे YOLOv7 का समर्थन नहीं करता है। YOLOv7 का उपयोग करने में रुचि रखने वाले उपयोगकर्ताओं को YOLOv7 GitHub रिपॉजिटरी में दिए गए इंस्टॉलेशन और उपयोग निर्देशों का पालन करना होगा। अन्य अत्याधुनिक मॉडलों के लिए, आप इसका उपयोग करके एक्सप्लोर और प्रशिक्षित कर सकते हैं Ultralytics जैसे उपकरण Ultralytics हब।

मैं कस्टम ऑब्जेक्ट डिटेक्शन प्रोजेक्ट के लिए YOLOv7 कैसे स्थापित और चलाऊं?

स्थापित करें और YOLOv7 को चलाने के लिए, निम्न चरणों का पालन करें:

YOLOv7 रिपॉजिटरी को क्लोन करें:
```
git clone https://github.com/WongKinYiu/yolov7
```
क्लोन की गई निर्देशिका पर नेविगेट करें और निर्भरताएं स्थापित करें:
```
cd yolov7
pip install -r requirements.txt
```
अपना डेटासेट तैयार करें और रिपॉजिटरी में दिए गए उपयोग निर्देशों के अनुसार मॉडल मापदंडों को कॉन्फ़िगर करें। अधिक मार्गदर्शन के लिए, नवीनतम जानकारी और अपडेट के लिए YOLOv7 GitHub रिपॉजिटरी पर जाएं।

YOLOv7 में पेश की गई प्रमुख विशेषताएं और अनुकूलन क्या हैं?

YOLOv7 कई प्रमुख विशेषताएं प्रदान करता है जो रीयल-टाइम ऑब्जेक्ट डिटेक्शन में क्रांति लाती हैं:

मॉडल पुन: पैरामीटरीकरण: ढाल प्रसार पथों को अनुकूलित करके मॉडल के प्रदर्शन को बढ़ाता है।
डायनेमिक लेबल असाइनमेंट: सटीकता में सुधार करते हुए, विभिन्न शाखाओं में आउटपुट के लिए गतिशील लक्ष्य निर्दिष्ट करने के लिए एक मोटे-से-ठीक लीड निर्देशित विधि का उपयोग करता है।
विस्तारित और यौगिक स्केलिंग: विभिन्न वास्तविक समय अनुप्रयोगों के लिए मॉडल को स्केल करने के लिए मापदंडों और गणना का कुशलतापूर्वक उपयोग करता है।
दक्षता: तेजी से अनुमान गति प्राप्त करते हुए अन्य अत्याधुनिक मॉडलों की तुलना में पैरामीटर संख्या को 40% और गणना को 50% तक कम कर देता है। इन सुविधाओं के बारे में अधिक जानकारी के लिए, YOLOv7 अवलोकन अनुभाग देखें।

बनाया गया 2023-11-12, अपडेट किया गया 2024-07-04
लेखक: ग्लेन-जोचर (8), सर्जीउवैक्समैन (1)