सामग्री पर जाएं

YOLOv4: हाई-स्पीड और सटीक ऑब्जेक्ट डिटेक्शन

में आपका स्वागत है Ultralytics YOLOv4 के लिए प्रलेखन पृष्ठ, एक अत्याधुनिक, रीयल-टाइम ऑब्जेक्ट डिटेक्टर जिसे 2020 में एलेक्सी बोचकोवस्की द्वारा https://github.com/AlexeyAB/darknet में लॉन्च किया गया था। YOLOv4 को गति और सटीकता के बीच इष्टतम संतुलन प्रदान करने के लिए डिज़ाइन किया गया है, जिससे यह कई अनुप्रयोगों के लिए एक उत्कृष्ट विकल्प बन जाता है।

YOLOv4 आर्किटेक्चर आरेख YOLOv4 आर्किटेक्चर आरेख. YOLOv4 के जटिल नेटवर्क डिज़ाइन को प्रदर्शित करना, जिसमें रीढ़ की हड्डी, गर्दन और सिर के घटक, और इष्टतम रीयल-टाइम ऑब्जेक्ट डिटेक्शन के लिए उनकी परस्पर जुड़ी परतें शामिल हैं।

परिचय

YOLOv4 का मतलब यू ओनली लुक वन्स वर्जन 4 है। यह एक वास्तविक समय वस्तु का पता लगाने वाला मॉडल है जिसे पिछले की सीमाओं को संबोधित करने के लिए विकसित किया गया है YOLO YOLOv3 और अन्य ऑब्जेक्ट डिटेक्शन मॉडल जैसे संस्करण। अन्य दृढ़ तंत्रिका नेटवर्क (सीएनएन) आधारित ऑब्जेक्ट डिटेक्टरों के विपरीत, YOLOv4 न केवल सिफारिश प्रणालियों के लिए बल्कि स्टैंडअलोन प्रक्रिया प्रबंधन और मानव इनपुट में कमी के लिए भी लागू है। पारंपरिक ग्राफिक्स प्रोसेसिंग यूनिट्स (जीपीयू) पर इसका संचालन एक सस्ती कीमत पर बड़े पैमाने पर उपयोग की अनुमति देता है, और इसे पारंपरिक जीपीयू पर वास्तविक समय में काम करने के लिए डिज़ाइन किया गया है, जबकि प्रशिक्षण के लिए केवल एक ऐसे जीपीयू की आवश्यकता होती है।

स्‍थापत्‍यशैली

YOLOv4 कई नवीन सुविधाओं का उपयोग करता है जो इसके प्रदर्शन को अनुकूलित करने के लिए एक साथ काम करते हैं। इनमें भारित-अवशिष्ट-कनेक्शन (WRC), क्रॉस-स्टेज-आंशिक-कनेक्शन (CSP), क्रॉस मिनी-बैच सामान्यीकरण (CmBN), स्व-प्रतिकूल-प्रशिक्षण (SAT), Mish-सक्रियण, मोज़ेक डेटा वृद्धि, ड्रॉपब्लॉक नियमितीकरण, और CIoU हानि शामिल हैं। अत्याधुनिक परिणाम प्राप्त करने के लिए इन विशेषताओं को जोड़ा गया है।

एक विशिष्ट ऑब्जेक्ट डिटेक्टर इनपुट, रीढ़, गर्दन और सिर सहित कई हिस्सों से बना होता है। YOLOv4 की रीढ़ इमेजनेट पर पूर्व-प्रशिक्षित है और इसका उपयोग वस्तुओं के वर्गों और बाउंडिंग बॉक्स की भविष्यवाणी करने के लिए किया जाता है। रीढ़ की हड्डी VGG, ResNet, ResNeXt, या DenseNet सहित कई मॉडलों से हो सकती है। डिटेक्टर के गर्दन वाले हिस्से का उपयोग विभिन्न चरणों से फीचर मैप एकत्र करने के लिए किया जाता है और आमतौर पर इसमें कई नीचे-ऊपर पथ और कई टॉप-डाउन पथ शामिल होते हैं। सिर का हिस्सा वह है जिसका उपयोग अंतिम वस्तु का पता लगाने और वर्गीकरण करने के लिए किया जाता है।

मुफ्त का बैग

YOLOv4 "मुफ्त के बैग" के रूप में जानी जाने वाली विधियों का भी उपयोग करता है, जो ऐसी तकनीकें हैं जो अनुमान की लागत को बढ़ाए बिना प्रशिक्षण के दौरान मॉडल की सटीकता में सुधार करती हैं। डेटा वृद्धि ऑब्जेक्ट डिटेक्शन में उपयोग की जाने वाली मुफ्त तकनीक का एक सामान्य बैग है, जो मॉडल की मजबूती में सुधार करने के लिए इनपुट छवियों की परिवर्तनशीलता को बढ़ाता है। डेटा वृद्धि के कुछ उदाहरणों में फोटोमेट्रिक विकृतियां (एक छवि की चमक, कंट्रास्ट, रंग, संतृप्ति और शोर को समायोजित करना) और ज्यामितीय विकृतियां (यादृच्छिक स्केलिंग, क्रॉपिंग, फ़्लिपिंग और घूर्णन जोड़ना) शामिल हैं। ये तकनीकें मॉडल को विभिन्न प्रकार की छवियों के लिए बेहतर सामान्यीकरण करने में मदद करती हैं।

फीचर्स और परफॉर्मेंस

YOLOv4 को ऑब्जेक्ट डिटेक्शन में इष्टतम गति और सटीकता के लिए डिज़ाइन किया गया है। YOLOv4 की वास्तुकला में CSPDarknet53 रीढ़ की हड्डी के रूप में, PANet गर्दन के रूप में, और YOLOv3 डिटेक्शन हेड के रूप में शामिल हैं। यह डिज़ाइन YOLOv4 को प्रभावशाली गति से ऑब्जेक्ट डिटेक्शन करने की अनुमति देता है, जिससे यह रीयल-टाइम अनुप्रयोगों के लिए उपयुक्त हो जाता है। YOLOv4 सटीकता में भी उत्कृष्टता प्राप्त करता है, ऑब्जेक्ट डिटेक्शन बेंचमार्क में अत्याधुनिक परिणाम प्राप्त करता है।

उपयोग के उदाहरण

लेखन के समय तक, Ultralytics वर्तमान में YOLOv4 मॉडल का समर्थन नहीं करता है। इसलिए, YOLOv4 का उपयोग करने में रुचि रखने वाले किसी भी उपयोगकर्ता को स्थापना और उपयोग निर्देशों के लिए सीधे YOLOv4 GitHub रिपॉजिटरी को संदर्भित करना होगा।

YOLOv4 का उपयोग करने के लिए आपके द्वारा उठाए जा सकने वाले विशिष्ट चरणों का संक्षिप्त विवरण यहां दिया गया है:

  1. YOLOv4 GitHub रिपॉजिटरी पर जाएँ: https://github.com/AlexeyAB/darknet

  2. स्थापना के लिए README फ़ाइल में दिए गए निर्देशों का पालन करें। इसमें आमतौर पर रिपॉजिटरी की क्लोनिंग करना, आवश्यक निर्भरताएं स्थापित करना और किसी भी आवश्यक पर्यावरण चर को स्थापित करना शामिल है।

  3. एक बार इंस्टॉलेशन पूरा हो जाने के बाद, आप रिपॉजिटरी में दिए गए उपयोग निर्देशों के अनुसार मॉडल को प्रशिक्षित और उपयोग कर सकते हैं। इसमें आमतौर पर आपका डेटासेट तैयार करना, मॉडल मापदंडों को कॉन्फ़िगर करना, मॉडल को प्रशिक्षित करना और फिर ऑब्जेक्ट डिटेक्शन करने के लिए प्रशिक्षित मॉडल का उपयोग करना शामिल होता है।

कृपया ध्यान दें कि आपके विशिष्ट उपयोग के मामले और YOLOv4 रिपॉजिटरी की वर्तमान स्थिति के आधार पर विशिष्ट चरण भिन्न हो सकते हैं। इसलिए, YOLOv4 GitHub रिपॉजिटरी में दिए गए निर्देशों को सीधे संदर्भित करने की दृढ़ता से अनुशंसा की जाती है।

इसके कारण होने वाली किसी भी असुविधा के लिए हमें खेद है और हम इस दस्तावेज़ को उपयोग के उदाहरणों के साथ अपडेट करने का प्रयास करेंगे Ultralytics एक बार YOLOv4 के लिए समर्थन लागू हो जाने के बाद।

समाप्ति

YOLOv4 एक शक्तिशाली और कुशल ऑब्जेक्ट डिटेक्शन मॉडल है जो गति और सटीकता के बीच संतुलन बनाता है। प्रशिक्षण के दौरान अनूठी विशेषताओं और मुफ्त तकनीकों के बैग का उपयोग इसे वास्तविक समय की वस्तु का पता लगाने के कार्यों में उत्कृष्ट प्रदर्शन करने की अनुमति देता है। YOLOv4 को पारंपरिक GPU वाले किसी भी व्यक्ति द्वारा प्रशिक्षित और उपयोग किया जा सकता है, जिससे यह अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए सुलभ और व्यावहारिक हो जाता है।

प्रशंसा पत्र और पावती

हम YOLOv4 लेखकों को रीयल-टाइम ऑब्जेक्ट डिटेक्शन के क्षेत्र में उनके महत्वपूर्ण योगदान के लिए स्वीकार करना चाहते हैं:

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

मूल YOLOv4 पेपर arXiv पर पाया जा सकता है। लेखकों ने अपना काम सार्वजनिक रूप से उपलब्ध कराया है, और कोडबेस को GitHub पर एक्सेस किया जा सकता है। हम क्षेत्र को आगे बढ़ाने और उनके काम को व्यापक समुदाय के लिए सुलभ बनाने में उनके प्रयासों की सराहना करते हैं।



2023-11-12 बनाया गया, अपडेट किया गया 2024-01-07
लेखक: ग्लेन-जोचर (6), सर्गिउवैक्समैन (1)

टिप्पणियाँ