1. समस्याएं और चुनौतियां
आधुनिक FPV-स्वचालित निशाना लगाने के कार्यों के लिए उच्च फ्रेम दर और न्यूनतम विलंब के साथ वास्तविक समय में वीडियो प्रोसेसिंग की आवश्यकता होती है। प्रसंस्करण के लिए वीडियो को दूरस्थ सर्वर पर प्रसारित करने पर आधारित पारंपरिक दृष्टिकोण, सक्रिय सुरक्षा प्रणालियों के लिए अस्वीकार्य विलंबता रखते हैं।
सीधे टर्नटेबल पर कम्प्यूटेशनल क्षमताओं को रखने की आवश्यकता कठोर प्रतिबंध लगाती है:
-
सीमित बिजली की खपत (5 W से कम)
-
कम्प्यूटिंग मॉड्यूल के लघु आयाम
-
व्यापक तापमान सीमा में कार्य (-40°C से +85°C)
-
धारावाहिक उत्पादन के अनुकूल लागत
RV1106 की हार्डवेयर सीमाएं
तुलना के लिए: NVIDIA Jetson Nano (21 TOPS) 5-10 W खपत करता है और $99 से शुरू होता है
मुख्य चुनौती
उच्च गति वाले लक्ष्यों के प्रभावी अनुरक्षण के लिए कम से कम 25 FPS की प्रसंस्करण दर बनाए रखते हुए, केवल 0.5 TOPS NPU प्रदर्शन वाले SoC पर आधुनिक न्यूरल नेटवर्क ऑब्जेक्ट डिटेक्शन एल्गोरिदम (YOLOv5-nano) के निष्पादन को सुनिश्चित करना।
2. आर्किटेक्चरल पैराडाइम «Cyclops-Hybrid»
«Cyclops-Hybrid» पैराडाइम SoC के विभिन्न ब्लॉकों के बीच कम्प्यूटेशनल लोड के वितरण के लिए एक नवीन दृष्टिकोण का प्रतिनिधित्व करता है। पारंपरिक दृष्टिकोण के बजाय, जहां न्यूरल नेटवर्क विशेष रूप से NPU पर निष्पादित होता है, हमने एक हाइब्रिड मॉडल विकसित किया है, जो:
पाइपलाइन विभाजन
विभिन्न कम्प्यूटेशनल ब्लॉकों पर निष्पादित उपकार्यों में न्यूरल नेटवर्क का विभाजन
समानांतर प्रसंस्करण
प्रसंस्करण के विभिन्न चरणों के लिए NPU, CPU और DSP का एक साथ उपयोग
अनुकूली फ़िल्टरिंग
दृश्य के विश्लेषण के आधार पर कम्प्यूटेशनल लोड का गतिशील कमी
«Cyclops-Hybrid» आर्किटेक्चरल योजना
चरण 1: CPU
वीडियो फ्रेम तैयार करना: 640×640 तक स्केलिंग, पिक्सेल सामान्यीकरण, रंग स्थान रूपांतरण। अनुकूलित लाइब्रेरी के कारण CPU पर सबसे कुशलता से निष्पादित होता है।
चरण 2: NPU
YOLOv5-nano न्यूरल नेटवर्क की कनवल्शनल परतों का निष्पादन। विशेष NPU न्यूनतम बिजली की खपत के साथ गुणन-संचय संचालन (MAC) की अधिकतम दक्षता सुनिश्चित करता है।
चरण 3: DSP + CPU
परिणामों का प्रसंस्करण: Non-Maximum Suppression (NMS), ऑब्जेक्ट ट्रैकिंग, झूठी सकारात्मकता फ़िल्टरिंग। DSP वेक्टर ऑपरेशनों को प्रभावी ढंग से संसाधित करता है, CPU - निर्णय लेने का तर्क।
दृष्टिकोण की नवीनता
NPU पर पूरे न्यूरल नेटवर्क को निष्पादित करने के प्रयास के बजाय (जो मेमोरी और प्रदर्शन सीमाओं के कारण असंभव है), हमने नेटवर्क को भागों में विभाजित किया, प्रारंभिक और अंतिम परतों को CPU और DSP पर निष्पादित किया। इसने RV1106 NPU की नाममात्र क्षमताओं से 3 गुना बड़े मॉडल को संसाधित करने की अनुमति दी।
3. SoC Rockchip RV1106 पर कार्यान्वयन
न्यूरल नेटवर्क मॉडल अनुकूलन
RV1106 पर कार्यान्वयन के लिए YOLOv5-nano मॉडल का गहन अनुकूलन किया गया:
-
INT8 क्वांटिज़ेशन: 95% सटीकता बनाए रखते हुए वज़न और सक्रियणों का 8-बिट पूर्णांक प्रारूप में रूपांतरण
-
प्रिज़्मैटिक विभाजन: CPU/DSP पर निष्पादन के लिए प्रारंभिक और अंतिम परतों का चयन
-
मेमोरी अनुकूलन: वज़न को चरणबद्ध लोडिंग के माध्यम से मेमोरी खपत 450 MB से 120 MB तक कम किया गया
-
पाइपलाइनिंग: निष्क्रियता को कम करने के लिए इनपुट/आउटपुट संचालन और गणना का ओवरलैप
पाइपलाइन अनुकूलन उदाहरण
// Cyclops-Hybrid पाइपलाइन स्यूडोकोड
void cyclops_hybrid_pipeline(Frame input_frame) {
// चरण 1: CPU - पूर्व-प्रसंस्करण
Frame preprocessed = cpu_preprocess(input_frame);
// चरण 2: NPU - कनवल्शनल परतें (अगले फ्रेम की तैयारी के साथ समानांतर)
Tensor features = npu_conv_layers(preprocessed);
// चरण 3: DSP/CPU - पश्च-प्रसंस्करण (अगले फ्रेम के NPU के साथ समानांतर)
Detections detections = postprocess(features);
// चरण 4: CPU - ट्रैकिंग और निर्णय लेना
TrackedObjects tracked = track_objects(detections);
return tracked;
}
पाइपलाइन प्रसंस्करण फ्रेम कैप्चर से लक्ष्य निर्देशांक प्राप्त करने तक केवल 40 ms की देरी के साथ 25 FPS प्राप्त करने की अनुमति देता है।
अनुकूलन दृष्टिकोणों की तुलना
| अनुकूलन विधि | गति (FPS) | मेमोरी (MB) | सटीकता (mAP) | प्रयोज्यता |
|---|---|---|---|---|
|
मूल YOLOv5-nano (FP32)
|
2-3 FPS | 450 MB | 28.5% | अप्रयोज्य |
|
INT8 क्वांटिज़ेशन (NPU पर पूर्ण)
|
8-10 FPS | 220 MB | 27.1% | सीमित |
|
Cyclops-Hybrid (INT8)
|
25-28 FPS | 120 MB | 26.8% | इष्टतम |
4. परिणाम और दक्षता
वीडियो प्रसंस्करण गति
औसत बिजली की खपत
पहचान सटीकता
वास्तविक परिस्थितियों में प्रदर्शन
फील्ड परीक्षणों के दौरान, «Cyclops-Hybrid» आर्किटेक्चर के साथ RV1106 आधारित प्रणाली ने विभिन्न परिस्थितियों में स्थिर कार्य प्रदर्शित किया:
-
दिन का समय
अच्छी रोशनी में 300 मीटर तक की दूरी पर 30×30 सेमी आकार के ड्रोन का पता लगाना
-
कम रोशनी
गोधूलि में 150 मीटर तक की पहचान सीमा के साथ कार्य
-
प्रतिकूल परिस्थितियां
-20°C से +60°C तापमान और 95% तक आर्द्रता पर स्थिर कार्य
एनालॉग्स के साथ तुलना
*Coral TPU को एक अलग होस्ट प्रोसेसर की आवश्यकता होती है, जो कुल बिजली की खपत और प्रणाली लागत बढ़ाता है।
5. एपीके «लोवची» में एकीकरण
«Cyclops-Hybrid» आर्किटेक्चर एपीके «लोवची» के हिस्से के रूप में स्वायत्त टर्नटेबल्स का एक प्रमुख घटक बन गया है। प्रत्येक टर्नटेबल RV1106 आधारित कम्प्यूटेशनल मॉड्यूल से सुसज्जित है, जो सुनिश्चित करता है:
पूर्ण स्वायत्तता
टर्नटेबल केंद्रीय सर्वर के साथ निरंतर संचार की आवश्यकता के बिना स्वतंत्र रूप से लक्ष्यों का पता लगाता है और उनका अनुसरण करता है, जो ईडब्ल्यू परिस्थितियों में कार्य करते समय महत्वपूर्ण रूप से महत्वपूर्ण है।
आर्थिक दक्षता
$50 से कम की कम्प्यूटेशनल मॉड्यूल लागत तैनाती के बजट में उल्लेखनीय वृद्धि के बिना सुरक्षा प्रणालियों के बड़े पैमाने पर निर्माण की अनुमति देती है।
Cyclops-Hybrid आधारित टर्नटेबल आर्किटेक्चर
स्तर 1: सेंसर
स्तर 2: प्रसंस्करण
RV1106
Cyclops-Hybrid आर्किटेक्चर
10 लक्ष्यों तक का पता लगाना
स्तर 3: निष्पादन
RV1106 की कम बिजली की खपत के कारण टर्नटेबल 12V/100Ah बैटरी से 72 घंटे तक स्वायत्त रूप से कार्य करने में सक्षम है
रणनीतिक महत्व
घरेलू घटक आधार पर पूरी तरह से स्वायत्त टर्नटेबल का विकास सुरक्षा प्रणालियों के क्षेत्र में तकनीकी संप्रभुता सुनिश्चित करने के लिए रणनीतिक महत्व रखता है। «Cyclops-Hybrid» आर्किटेक्चर आयातित उच्च-प्रदर्शन कम्प्यूटेशनल प्लेटफार्मों पर निर्भरता के बिना प्रभावी सुरक्षा प्रणालियों के निर्माण की अनुमति देता है।
6. निष्कर्ष और संभावनाएं
प्राप्त परिणाम
-
हार्डवेयर सीमाओं पर काबू पाना
केवल 0.5 TOPS के औपचारिक प्रदर्शन वाले SoC पर 25 FPS की प्रसंस्करण दर प्राप्त की गई
-
ऊर्जा दक्षता
3 W से कम खपत प्रणाली को बैटरी से स्वायत्त कार्य के लिए उपयुक्त बनाती है
-
आर्थिक व्यवहार्यता
कम्प्यूटेशनल मॉड्यूल की लागत सुरक्षा प्रणालियों के बड़े पैमाने पर तैनाती की अनुमति देती है
-
तकनीकी संप्रभुता
प्रतिबंधात्मक प्लेटफार्मों पर निर्भरता के बिना घरेलू और बाजार में उपलब्ध घटकों का उपयोग
आशाजनक दिशाएं
आर्किटेक्चर स्केलिंग
अधिक शक्तिशाली SoC (RK3588, Jetson Orin Nano) के लिए «Cyclops-Hybrid» दृष्टिकोण का अनुकूलन अधिक जटिल कार्यों को हल करने के लिए, जिसमें UAV प्रकारों का वर्गीकरण और प्रक्षेपवक्र पूर्वानुमान शामिल है।
मल्टीमॉडल डिटेक्शन
जटिल परिस्थितियों में खोज की विश्वसनीयता बढ़ाने के लिए थर्मल इमेजर और रेडियो सेंसर से डेटा के प्रसंस्करण का एकीकरण एक एकीकृत प्रसंस्करण पाइपलाइन में।
प्रोजेक्ट «सर्विटर»
न्यूरल नेटवर्क कम्प्यूटेशन को तेज करने के लिए FPGA आधारित एक विशेष को-प्रोसेसर का विकास, जो एपीके «लोवची» में आयातित समाधानों से पूरी तरह से मुक्त होने की अनुमति देगा।
निष्कर्ष
आर्किटेक्चरल पैराडाइम «Cyclops-Hybrid» प्रदर्शित करता है कि कठोर हार्डवेयर सीमाओं की उपस्थिति में भी महत्वपूर्ण कार्यों को हल करने के लिए प्रभावी कंप्यूटर विज़न प्रणालियों का निर्माण संभव है।
विकसित समाधान न केवल एपीके «लोवची» के हिस्से के रूप में FPV-स्वचालित निशाना लगाने की प्रणाली के लिए आवश्यक विशेषताएं प्रदान करता है, बल्कि घरेलू घटक आधार पर बड़े पैमाने पर, ऊर्जा कुशल और आर्थिक रूप से व्यवहार्य सुरक्षा प्रणालियों के निर्माण के लिए नई संभावनाएं खोलता है।
संबंधित सामग्री और लिंक
आंतरिक दस्तावेज
प्रकाशन तिथि और स्थिति
रिपोर्ट मार्च 2025 तक की स्थिति के अनुसार तैयार की गई है। विकास सक्रिय परीक्षण और धारावाहिक उत्पादन की तैयारी के चरण में है। सभी तकनीकी विशेषताएं प्रयोगशाला और फील्ड परीक्षणों द्वारा पुष्टि की गई हैं।