अब गूंगे CCTV वीडियो भी बोल उठेंगे, Google का नया AI मॉडल लिप रीडिंग करेगा - Tech News

राष्ट्रीय सुरक्षा और सामाजिक सुरक्षा के मामले में यह एक बड़ी उपलब्धि है। Google की DeepMind रिसर्च लैब ने V2A (वीडियो-टू-ऑडियो) नामक एक नया AI मॉडल पेश किया है। इसके उपयोग से उन वीडियो में भी डायलॉग और साउंड ट्रैक शामिल किया जा सकता है, जिनमें या तो ऑडियो रिकॉर्ड ही नहीं हुई या फिर ऑडियो को हटा दिया गया था। 

नेशनल और सोशल सिक्योरिटी में क्या फायदा मिलेगा

नेशनल सिक्योरिटी के मामले में कई कैमरे बेहद दूरी से अपने दुश्मन को कैप्चर करते हैं। ऐसी स्थिति में दुश्मन क्या बोल रहा है, इसका पता नहीं चल पाता। लिप रीडिंग एक्सपर्ट को बुलाना पड़ता है। भारत में CCTV कैमरे इससे एक कदम आगे हैं। उनमें ऑडियो रिकॉर्ड ही नहीं होती, केवल वीडियो रिकॉर्ड होते हैं। ऐसी स्थिति में CCTV कैमरे द्वारा कैप्चर किए गए घटनाओं के वीडियो में यदि यह पता चल जाए कि लोग आपस में क्या बात कर रहे हैं तो किसी भी क्रिमिनल केस को सुलझाना काफी आसान हो जाएगा। 

V2A के अन्य फायदे

उदाहरण के लिए आपने कहीं दूर दौड़ते हुए घोड़े का वीडियो शूट किया। ऐसी स्थिति में उसे घोड़े के दौड़ने की आवाज रिकॉर्ड नहीं होगी परंतु गूगल के इस नए फीचर के कारण आप इस वीडियो में घोड़े के टापों की आवाज सुन पाएंगे। लाखों वीडियो क्रिएटर के सामने बैकग्राउंड म्यूजिक का सिलेक्शन करना बड़ी चुनौती होती है। इस फीचर के माध्यम से वीडियो के सब्जेक्ट और अन्य कई सिग्नल का प्रयोग करके कुछ ही देर में बैकग्राउंड म्यूजिक उपलब्ध हो जाएगा। 

विनम्र निवेदन:🙏कृपया हमें गूगल न्यूज़ पर फॉलो करें। सबसे तेज अपडेट प्राप्त करने के लिए टेलीग्राम चैनल सब्सक्राइब करें एवं हमारे व्हाट्सएप कम्युनिटी ज्वॉइन करें। इन सबकी डायरेक्ट लिंक नीचे स्क्रॉल करने पर मिल जाएंगी। मध्य प्रदेश के महत्वपूर्ण समाचार पढ़ने के लिए कृपया स्क्रॉल करके सबसे नीचे POPULAR Category में technology पर क्लिक करें।

#buttons=(Accept !) #days=(20)

Our website uses cookies to enhance your experience. Check Now
Accept !