मुख्य नवोन्मेष Google AI अब उपयोगकर्ताओं को फ़ोन कैमरों के साथ 27 भाषाओं में टेक्स्ट का तुरंत अनुवाद करने देता है

Google AI अब उपयोगकर्ताओं को फ़ोन कैमरों के साथ 27 भाषाओं में टेक्स्ट का तुरंत अनुवाद करने देता है

क्या फिल्म देखना है?
 
(जीआईएफ: गूगल)

(जीआईएफ: गूगल)



आर्टिफिशियल इंटेलिजेंस की बदौलत विदेश यात्रा करना इतना आसान कभी नहीं रहा।

Google अनुवाद ऐप उपयोगकर्ताओं को टेक्स्ट का तुरंत अनुवाद करने देता है। ऐप में, बस अपने कैमरे को उस टेक्स्ट की ओर इंगित करें जिसका आप अनुवाद करना चाहते हैं और आप इसे अपनी आंखों के ठीक सामने अपनी इच्छित भाषा में बदलते हुए देखेंगे—कोई इंटरनेट कनेक्शन या सेल फोन डेटा की आवश्यकता नहीं है। यह आसान सुविधा कुछ समय के लिए उपलब्ध है, लेकिन यह केवल सात भाषाओं के साथ संगत थी। अब क , मशीन लर्निंग की बदौलत, Google ने 27 भाषाओं का तुरंत अनुवाद करने के लिए ऐप को अपग्रेड किया है।

तो अगली बार जब आप प्राग में हों और एक मेनू नहीं पढ़ सकते हैं, तो हमें आपकी पीठ मिल गई है, Google के सॉफ्टवेयर इंजीनियर ओटावियो गुड ने कंपनी के शोध पर लिखा है ब्लॉग .

Google ने भी अपनी वाक् पहचान त्रुटियों को आधा करने के लिए AI का उपयोग किया।

आज तक, अंग्रेजी, फ्रेंच, जर्मन, इतालवी, पुर्तगाली, रूसी और स्पेनिश के बीच अनुवाद के अलावा, निम्नलिखित 20 भाषाओं का वास्तविक समय में भी अनुवाद किया जा सकता है: बल्गेरियाई, कैटलन, क्रोएशियाई, चेक, डेनिश, डच, फिलिपिनो, फ़िनिश, हंगेरियन, इंडोनेशियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, रोमानियाई, स्लोवाक, स्वीडिश, तुर्की और यूक्रेनी। और अगर आप टेक्स्ट ट्रांसलेट को लाइव देखने के बजाय तस्वीर को स्नैप करने का विकल्प चुनते हैं, तो कुल 37 भाषाएं समर्थित हैं।

तो Google कैसे उपलब्ध भाषाओं की संख्या बढ़ाने में सक्षम था? उन्होंने पहले वर्ड लेंस का अधिग्रहण किया, जो पहले एक संवर्धित वास्तविकता अनुवाद एप्लिकेशन था, और ऐप की क्षमताओं को बढ़ाने के लिए मशीन लर्निंग और कन्वेन्शनल न्यूरल नेटवर्क का इस्तेमाल किया। छवि पहचान में प्रगति महत्वपूर्ण थी।

पांच साल पहले, यदि आपने कंप्यूटर को बिल्ली या कुत्ते की छवि दी, तो उसे यह बताने में परेशानी हुई कि कौन सा है। दृढ़ तंत्रिका नेटवर्क के लिए धन्यवाद, न केवल कंप्यूटर बिल्लियों और कुत्तों के बीच अंतर बता सकते हैं, वे कुत्तों की विभिन्न नस्लों को भी पहचान सकते हैं, श्री गुड ने कहा। हाँ, वे सिर्फ से अधिक के लिए अच्छे हैं ट्रिपी आर्ट —यदि आप किसी विदेशी मेनू का अनुवाद कर रहे हैं या Google के अनुवाद ऐप के नवीनतम संस्करण के साथ साइन इन कर रहे हैं, तो आप अब एक गहरे तंत्रिका जाल का उपयोग कर रहे हैं।

क्रमशः

प्रथम , अनुवाद को पृष्ठभूमि की अव्यवस्था को दूर करना चाहिए और पाठ का पता लगाना चाहिए। जब यह एक ही रंग के पिक्सेल के बूँद का पता लगाता है, तो यह निर्धारित करता है कि वे अक्षर हैं। और जब वे बूँदें एक-दूसरे के करीब होती हैं, तो वह समझती है कि यह एक सतत पंक्ति है जिसे पढ़ा जाना है।

अगला, ऐप को यह पहचानना चाहिए कि प्रत्येक व्यक्तिगत पत्र क्या है। यहीं से गहरी सीख आती है।

हम एक दृढ़ तंत्रिका नेटवर्क का उपयोग करते हैं, इसे अक्षरों और गैर-अक्षरों पर प्रशिक्षित करते हैं ताकि यह सीख सके कि विभिन्न अक्षर कैसा दिखते हैं, ब्लॉग पोस्ट पढ़ता है।

शोधकर्ताओं को न केवल साफ दिखने वाले अक्षरों का उपयोग करके सॉफ्टवेयर को प्रशिक्षित करना था, बल्कि गंदे अक्षरों का भी उपयोग करना था। मिस्टर गुड ने लिखा है कि वास्तविक दुनिया के पत्र प्रतिबिंब, गंदगी, धब्बे और सभी प्रकार की अजीबता से प्रभावित होते हैं। इसलिए हमने वास्तविक दुनिया के शोर की नकल करने के लिए सभी प्रकार की नकली गंदगी बनाने के लिए अपने पत्र जनरेटर का निर्माण किया- नकली प्रतिबिंब, नकली धुंध, नकली अजीबता। कुछ के

प्रशिक्षण के लिए इस्तेमाल किए जाने वाले कुछ गंदे अक्षर। (फोटो: गूगल)








तीसरा चरण अनुवाद प्राप्त करने के लिए एक शब्दकोश में मान्यता प्राप्त अक्षरों को देख रहा है। और सटीकता पर एक अतिरिक्त प्रयास के लिए, शब्दकोश लुकअप अनुमानित हैं यदि एस को 5 के रूप में गलत तरीके से पढ़ा जाता है।

अंततः, अनुवादित पाठ मूल के शीर्ष पर उसी शैली में प्रस्तुत किया गया है।

हम ऐसा इसलिए कर सकते हैं क्योंकि हम पहले से ही छवि में अक्षरों को ढूंढ और पढ़ चुके हैं, इसलिए हम जानते हैं कि वे कहां हैं। हम अक्षरों के आस-पास के रंगों को देख सकते हैं और इसका उपयोग मूल अक्षरों को मिटाने के लिए कर सकते हैं। और फिर हम मूल अग्रभूमि रंग का उपयोग करके अनुवाद को शीर्ष पर बना सकते हैं, ब्लॉग पोस्ट पढ़ता है।

जितना संभव हो उतना कुशल होने के लिए और इन सभी चरणों को इंटरनेट या डेटा कनेक्शन के बिना वास्तविक समय में पूरा करने की अनुमति देने के लिए, Google टीम ने एक बहुत छोटा तंत्रिका जाल विकसित किया है जो सूचना के घनत्व पर एक ऊपरी सीमा के साथ है जिसे वह संभाल सकता है। चूंकि वे अपना स्वयं का प्रशिक्षण डेटा तैयार कर रहे थे, इसलिए सही डेटा शामिल करना महत्वपूर्ण था, लेकिन अतिरिक्त कुछ भी नहीं, इसलिए तंत्रिका नेटवर्क महत्वहीन चीजों पर अपने सूचना घनत्व का बहुत अधिक उपयोग नहीं कर रहा है। एक उदाहरण यह होगा कि कैसे इसे एक अक्षर को थोड़े से घूर्णन के साथ पहचानने की आवश्यकता होती है, लेकिन बहुत अधिक नहीं।

अंत में, उपयोगकर्ताओं के पास 20 और भाषाओं के साथ छोड़ दिया जाता है लेकिन वही तेज गति।

यह भी देखें: Google की AI टीम ने हमें उनके मशीन लर्निंग रिसर्च में कमी दी है

लेख जो आपको पसंद हो सकते हैं :

यह सभी देखें:

क्रिस्टोफ वाल्ट्ज द्वारा 'जॉर्जटाउन' एक योग्य निर्देशन की शुरुआत है
क्रिस्टोफ वाल्ट्ज द्वारा 'जॉर्जटाउन' एक योग्य निर्देशन की शुरुआत है
एपिक सीज़न 3 रीयूनियन के दौरान 'बॉडी शेमिंग' के लिए 'लव इज़ ब्लाइंड्स ज़ानब जाफरी स्लैम कोल बार्नेट
एपिक सीज़न 3 रीयूनियन के दौरान 'बॉडी शेमिंग' के लिए 'लव इज़ ब्लाइंड्स ज़ानब जाफरी स्लैम कोल बार्नेट'
पीट डेविडसन की पूर्व एरियाना ग्रांडे को सुनते हुए किम कार्दशियन ने धमाकेदार शुरुआत की: देखें
पीट डेविडसन की पूर्व एरियाना ग्रांडे को सुनते हुए किम कार्दशियन ने धमाकेदार शुरुआत की: देखें
स्कूल की लड़ाई में, हम 'माता-पिता के अधिकार' की चर्चा पूरी तरह से गलत कर रहे हैं
स्कूल की लड़ाई में, हम 'माता-पिता के अधिकार' की चर्चा पूरी तरह से गलत कर रहे हैं
रोसालिया और रॉ एलेजांद्रो अलग हो गए: प्रस्ताव के ठीक 4 महीने बाद जोड़े ने सगाई खत्म कर दी
रोसालिया और रॉ एलेजांद्रो अलग हो गए: प्रस्ताव के ठीक 4 महीने बाद जोड़े ने सगाई खत्म कर दी
जस्टिन बीबर ने सेलेना गोमेज़ के साथ प्यार भरी नई 'कडल' तस्वीर पोस्ट की
जस्टिन बीबर ने सेलेना गोमेज़ के साथ प्यार भरी नई 'कडल' तस्वीर पोस्ट की
बिज़नेस और मीडिया हस्तियाँ जो अब तक डिज़्नी-पेल्ट्ज़ प्रॉक्सी युद्ध में बॉब इगर का समर्थन करती हैं
बिज़नेस और मीडिया हस्तियाँ जो अब तक डिज़्नी-पेल्ट्ज़ प्रॉक्सी युद्ध में बॉब इगर का समर्थन करती हैं