YOLOv4: हाई-स्पीड और सटीक ऑब्जेक्ट डिटेक्शन

में आपका स्वागत है Ultralytics YOLOv4 के लिए प्रलेखन पृष्ठ, एक अत्याधुनिक, रीयल-टाइम ऑब्जेक्ट डिटेक्टर जिसे 2020 में एलेक्सी बोचकोवस्की द्वारा https://github.com/AlexeyAB/darknet में लॉन्च किया गया था। YOLOv4 को गति और सटीकता के बीच इष्टतम संतुलन प्रदान करने के लिए डिज़ाइन किया गया है, जिससे यह कई अनुप्रयोगों के लिए एक उत्कृष्ट विकल्प बन जाता है।

YOLOv4 आर्किटेक्चर आरेख. YOLOv4 के जटिल नेटवर्क डिज़ाइन को प्रदर्शित करना, जिसमें रीढ़ की हड्डी, गर्दन और सिर के घटक, और इष्टतम रीयल-टाइम ऑब्जेक्ट डिटेक्शन के लिए उनकी परस्पर जुड़ी परतें शामिल हैं।

परिचय

YOLOv4 का मतलब यू ओनली लुक वन्स वर्जन 4 है। यह एक वास्तविक समय वस्तु का पता लगाने वाला मॉडल है जिसे पिछले की सीमाओं को संबोधित करने के लिए विकसित किया गया है YOLO YOLOv3 और अन्य ऑब्जेक्ट डिटेक्शन मॉडल जैसे संस्करण। अन्य दृढ़ तंत्रिका नेटवर्क (सीएनएन) आधारित ऑब्जेक्ट डिटेक्टरों के विपरीत, YOLOv4 न केवल सिफारिश प्रणालियों के लिए बल्कि स्टैंडअलोन प्रक्रिया प्रबंधन और मानव इनपुट कमी के लिए भी लागू है। पारंपरिक ग्राफिक्स प्रोसेसिंग यूनिट्स (GPU) पर इसका संचालन एक सस्ती कीमत पर बड़े पैमाने पर उपयोग की अनुमति देता है, और इसे पारंपरिक पर वास्तविक समय में काम करने के लिए डिज़ाइन किया गया हैGPU जबकि केवल एक की आवश्यकता होती है GPU प्रशिक्षण के लिए।

स्‍थापत्‍यशैली

YOLOv4 कई नवीन सुविधाओं का उपयोग करता है जो इसके प्रदर्शन को अनुकूलित करने के लिए एक साथ काम करते हैं। इनमें भारित-अवशिष्ट-कनेक्शन (WRC), क्रॉस-स्टेज-आंशिक-कनेक्शन (CSP), क्रॉस मिनी-बैच सामान्यीकरण (CmBN), स्व-प्रतिकूल-प्रशिक्षण (SAT), Mish-सक्रियण, मोज़ेक डेटा वृद्धि, ड्रॉपब्लॉक नियमितीकरण, और CIoU हानि शामिल हैं। अत्याधुनिक परिणाम प्राप्त करने के लिए इन विशेषताओं को जोड़ा गया है।

एक विशिष्ट ऑब्जेक्ट डिटेक्टर इनपुट, रीढ़, गर्दन और सिर सहित कई हिस्सों से बना होता है। YOLOv4 की रीढ़ इमेजनेट पर पूर्व-प्रशिक्षित है और इसका उपयोग वस्तुओं के वर्गों और बाउंडिंग बॉक्स की भविष्यवाणी करने के लिए किया जाता है। रीढ़ की हड्डी VGG, ResNet, ResNeXt, या DenseNet सहित कई मॉडलों से हो सकती है। डिटेक्टर के गर्दन वाले हिस्से का उपयोग विभिन्न चरणों से फीचर मैप एकत्र करने के लिए किया जाता है और आमतौर पर इसमें कई नीचे-ऊपर पथ और कई टॉप-डाउन पथ शामिल होते हैं। सिर का हिस्सा वह है जिसका उपयोग अंतिम वस्तु का पता लगाने और वर्गीकरण करने के लिए किया जाता है।

मुफ्त का बैग

YOLOv4 "मुफ्त के बैग" के रूप में जानी जाने वाली विधियों का भी उपयोग करता है, जो ऐसी तकनीकें हैं जो अनुमान की लागत को बढ़ाए बिना प्रशिक्षण के दौरान मॉडल की सटीकता में सुधार करती हैं। डेटा वृद्धि ऑब्जेक्ट डिटेक्शन में उपयोग की जाने वाली मुफ्त तकनीक का एक सामान्य बैग है, जो मॉडल की मजबूती में सुधार करने के लिए इनपुट छवियों की परिवर्तनशीलता को बढ़ाता है। डेटा वृद्धि के कुछ उदाहरणों में फोटोमेट्रिक विकृतियां (एक छवि की चमक, कंट्रास्ट, रंग, संतृप्ति और शोर को समायोजित करना) और ज्यामितीय विकृतियां (यादृच्छिक स्केलिंग, क्रॉपिंग, फ़्लिपिंग और घूर्णन जोड़ना) शामिल हैं। ये तकनीकें मॉडल को विभिन्न प्रकार की छवियों के लिए बेहतर सामान्यीकरण करने में मदद करती हैं।

फीचर्स और परफॉर्मेंस

YOLOv4 को ऑब्जेक्ट डिटेक्शन में इष्टतम गति और सटीकता के लिए डिज़ाइन किया गया है। YOLOv4 की वास्तुकला में CSPDarknet53 रीढ़ की हड्डी के रूप में, PANet गर्दन के रूप में, और YOLOv3 डिटेक्शन हेड के रूप में शामिल हैं। यह डिज़ाइन YOLOv4 को प्रभावशाली गति से ऑब्जेक्ट डिटेक्शन करने की अनुमति देता है, जिससे यह रीयल-टाइम अनुप्रयोगों के लिए उपयुक्त हो जाता है। YOLOv4 सटीकता में भी उत्कृष्टता प्राप्त करता है, ऑब्जेक्ट डिटेक्शन बेंचमार्क में अत्याधुनिक परिणाम प्राप्त करता है।

उपयोग के उदाहरण

लेखन के समय तक, Ultralytics वर्तमान में YOLOv4 मॉडल का समर्थन नहीं करता है। इसलिए, YOLOv4 का उपयोग करने में रुचि रखने वाले किसी भी उपयोगकर्ता को स्थापना और उपयोग निर्देशों के लिए सीधे YOLOv4 GitHub रिपॉजिटरी को संदर्भित करना होगा।

YOLOv4 का उपयोग करने के लिए आपके द्वारा उठाए जा सकने वाले विशिष्ट चरणों का संक्षिप्त विवरण यहां दिया गया है:

YOLOv4 GitHub रिपॉजिटरी पर जाएँ: https://github.com/AlexeyAB/darknet।
स्थापना के लिए README फ़ाइल में दिए गए निर्देशों का पालन करें। इसमें आमतौर पर रिपॉजिटरी की क्लोनिंग करना, आवश्यक निर्भरताएं स्थापित करना और किसी भी आवश्यक पर्यावरण चर को स्थापित करना शामिल है।
एक बार इंस्टॉलेशन पूरा हो जाने के बाद, आप रिपॉजिटरी में दिए गए उपयोग निर्देशों के अनुसार मॉडल को प्रशिक्षित और उपयोग कर सकते हैं। इसमें आमतौर पर आपका डेटासेट तैयार करना, मॉडल मापदंडों को कॉन्फ़िगर करना, मॉडल को प्रशिक्षित करना और फिर ऑब्जेक्ट डिटेक्शन करने के लिए प्रशिक्षित मॉडल का उपयोग करना शामिल होता है।

कृपया ध्यान दें कि आपके विशिष्ट उपयोग के मामले और YOLOv4 रिपॉजिटरी की वर्तमान स्थिति के आधार पर विशिष्ट चरण भिन्न हो सकते हैं। इसलिए, YOLOv4 GitHub रिपॉजिटरी में दिए गए निर्देशों को सीधे संदर्भित करने की दृढ़ता से अनुशंसा की जाती है।

इसके कारण होने वाली किसी भी असुविधा के लिए हमें खेद है और हम इस दस्तावेज़ को उपयोग के उदाहरणों के साथ अपडेट करने का प्रयास करेंगे Ultralytics एक बार YOLOv4 के लिए समर्थन लागू हो जाने के बाद।

समाप्ति

YOLOv4 एक शक्तिशाली और कुशल ऑब्जेक्ट डिटेक्शन मॉडल है जो गति और सटीकता के बीच संतुलन बनाता है। प्रशिक्षण के दौरान अनूठी विशेषताओं और मुफ्त तकनीकों के बैग का उपयोग इसे वास्तविक समय वस्तु का पता लगाने के कार्यों में उत्कृष्ट प्रदर्शन करने की अनुमति देता है। YOLOv4 को पारंपरिक रूप से किसी के द्वारा प्रशिक्षित और उपयोग किया जा सकता है GPU, इसे अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए सुलभ और व्यावहारिक बनाना।

प्रशंसा पत्र और पावती

हम YOLOv4 लेखकों को रीयल-टाइम ऑब्जेक्ट डिटेक्शन के क्षेत्र में उनके महत्वपूर्ण योगदान के लिए स्वीकार करना चाहते हैं:

बिबटेक्स

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

मूल YOLOv4 पेपर arXiv पर पाया जा सकता है। लेखकों ने अपना काम सार्वजनिक रूप से उपलब्ध कराया है, और कोडबेस को GitHub पर एक्सेस किया जा सकता है। हम क्षेत्र को आगे बढ़ाने और उनके काम को व्यापक समुदाय के लिए सुलभ बनाने में उनके प्रयासों की सराहना करते हैं।

अक्सर पूछे जाने वाले प्रश्न

YOLOv4 क्या है और मुझे ऑब्जेक्ट डिटेक्शन के लिए इसका उपयोग क्यों करना चाहिए?

YOLOv4, जिसका अर्थ है "यू ओनली लुक वन्स वर्जन 4," 2020 में एलेक्सी बोचकोवस्की द्वारा विकसित एक अत्याधुनिक रीयल-टाइम ऑब्जेक्ट डिटेक्शन मॉडल है। यह गति और सटीकता के बीच एक इष्टतम संतुलन प्राप्त करता है, जिससे यह वास्तविक समय के अनुप्रयोगों के लिए अत्यधिक उपयुक्त हो जाता है। YOLOv4 के आर्किटेक्चर में अत्याधुनिक परिणाम प्राप्त करने के लिए वेटेड-रेसिडुअल-कनेक्शन (WRC), क्रॉस-स्टेज-आंशिक-कनेक्शन (CSP), और सेल्फ-एडवरसैरियल-ट्रेनिंग (SAT) जैसी कई नवीन विशेषताएं शामिल हैं। यदि आप एक उच्च-प्रदर्शन मॉडल की तलाश कर रहे हैं जो पारंपरिक GPU पर कुशलता से संचालित होता है, तो YOLOv4 एक उत्कृष्ट विकल्प है।

YOLOv4 का आर्किटेक्चर इसके प्रदर्शन को कैसे बढ़ाता है?

YOLOv4 की वास्तुकला में कई प्रमुख घटक शामिल हैं: रीढ़ की हड्डी, गर्दन और सिर। बैकबोन, जो VGG, ResNet, या CSPDarknet53 जैसे मॉडल हो सकते हैं, कक्षाओं और बाउंडिंग बॉक्स की भविष्यवाणी करने के लिए पूर्व-प्रशिक्षित हैं। पैननेट का उपयोग करने वाली गर्दन, व्यापक डेटा निष्कर्षण के लिए विभिन्न चरणों से फीचर मानचित्रों को जोड़ती है। अंत में, सिर, जो YOLOv3 से कॉन्फ़िगरेशन का उपयोग करता है, अंतिम वस्तु का पता लगाता है। YOLOv4 मोज़ेक डेटा वृद्धि और ड्रॉपब्लॉक नियमितीकरण जैसी "बैग ऑफ फ्रीबीज" तकनीकों को भी नियोजित करता है, जो इसकी गति और सटीकता को और अनुकूलित करता है।

YOLOv4 के संदर्भ में "मुफ्त का बैग" क्या हैं?

"मुफ्त का बैग" उन तरीकों को संदर्भित करता है जो अनुमान की लागत में वृद्धि किए बिना YOLOv4 की प्रशिक्षण सटीकता में सुधार करते हैं। इन तकनीकों में डेटा वृद्धि के विभिन्न रूप शामिल हैं जैसे फोटोमेट्रिक विकृतियां (चमक, कंट्रास्ट, आदि को समायोजित करना) और ज्यामितीय विकृतियां (स्केलिंग, क्रॉपिंग, फ़्लिपिंग, रोटेटिंग)। इनपुट छवियों की परिवर्तनशीलता को बढ़ाकर, ये वृद्धि YOLOv4 को विभिन्न प्रकार की छवियों के लिए बेहतर सामान्यीकरण करने में मदद करती है, जिससे इसके वास्तविक समय के प्रदर्शन से समझौता किए बिना इसकी मजबूती और सटीकता में सुधार होता है।

YOLOv4 को पारंपरिक GPU पर रीयल-टाइम ऑब्जेक्ट डिटेक्शन के लिए उपयुक्त क्यों माना जाता है?

YOLOv4 को गति और सटीकता दोनों को अनुकूलित करने के लिए डिज़ाइन किया गया है, जो इसे रीयल-टाइम ऑब्जेक्ट डिटेक्शन कार्यों के लिए आदर्श बनाता है जिनके लिए त्वरित और विश्वसनीय प्रदर्शन की आवश्यकता होती है। यह पारंपरिक जीपीयू पर कुशलता से संचालित होता है, प्रशिक्षण और अनुमान दोनों के लिए केवल एक की आवश्यकता होती है। यह अनुशंसा प्रणालियों से लेकर स्टैंडअलोन प्रक्रिया प्रबंधन तक के विभिन्न अनुप्रयोगों के लिए सुलभ और व्यावहारिक बनाता है, जिससे व्यापक हार्डवेयर सेटअप की आवश्यकता कम हो जाती है और यह वास्तविक समय ऑब्जेक्ट डिटेक्शन के लिए लागत प्रभावी समाधान बन जाता है।

मैं YOLOv4 के साथ कैसे शुरुआत कर सकता हूं यदि Ultralytics वर्तमान में इसका समर्थन नहीं करता है?

YOLOv4 के साथ आरंभ करने के लिए, आपको आधिकारिक YOLOv4 GitHub रिपॉजिटरी पर जाना चाहिए। README फ़ाइल में दिए गए इंस्टॉलेशन निर्देशों का पालन करें, जिसमें आमतौर पर रिपॉजिटरी को क्लोन करना, निर्भरताएं स्थापित करना और पर्यावरण चर सेट करना शामिल है। एक बार इंस्टॉल हो जाने पर, आप अपना डेटासेट तैयार करके, मॉडल मापदंडों को कॉन्फ़िगर करके और दिए गए उपयोग निर्देशों का पालन करके मॉडल को प्रशिक्षित कर सकते हैं। क्योंकि Ultralytics वर्तमान में YOLOv4 का समर्थन नहीं करता है, सबसे अद्यतित और विस्तृत मार्गदर्शन के लिए सीधे YOLOv4 GitHub को संदर्भित करने की अनुशंसा की जाती है।

बनाया गया 2023-11-12, अपडेट किया गया 2024-07-04
लेखक: ग्लेन-जोचर (9), सर्जियुवैक्समैन (1)