Google AI अब उपयोगकर्ताओं को फ़ोन कैमरों के साथ 27 भाषाओं में टेक्स्ट का तुरंत अनुवाद करने देता है

(जीआईएफ: गूगल)

आर्टिफिशियल इंटेलिजेंस की बदौलत विदेश यात्रा करना इतना आसान कभी नहीं रहा।

Google अनुवाद ऐप उपयोगकर्ताओं को टेक्स्ट का तुरंत अनुवाद करने देता है। ऐप में, बस अपने कैमरे को उस टेक्स्ट की ओर इंगित करें जिसका आप अनुवाद करना चाहते हैं और आप इसे अपनी आंखों के ठीक सामने अपनी इच्छित भाषा में बदलते हुए देखेंगे—कोई इंटरनेट कनेक्शन या सेल फोन डेटा की आवश्यकता नहीं है। यह आसान सुविधा कुछ समय के लिए उपलब्ध है, लेकिन यह केवल सात भाषाओं के साथ संगत थी। अब क , मशीन लर्निंग की बदौलत, Google ने 27 भाषाओं का तुरंत अनुवाद करने के लिए ऐप को अपग्रेड किया है।

तो अगली बार जब आप प्राग में हों और एक मेनू नहीं पढ़ सकते हैं, तो हमें आपकी पीठ मिल गई है, Google के सॉफ्टवेयर इंजीनियर ओटावियो गुड ने कंपनी के शोध पर लिखा है ब्लॉग .

Google ने भी अपनी वाक् पहचान त्रुटियों को आधा करने के लिए AI का उपयोग किया।

आज तक, अंग्रेजी, फ्रेंच, जर्मन, इतालवी, पुर्तगाली, रूसी और स्पेनिश के बीच अनुवाद के अलावा, निम्नलिखित 20 भाषाओं का वास्तविक समय में भी अनुवाद किया जा सकता है: बल्गेरियाई, कैटलन, क्रोएशियाई, चेक, डेनिश, डच, फिलिपिनो, फ़िनिश, हंगेरियन, इंडोनेशियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, रोमानियाई, स्लोवाक, स्वीडिश, तुर्की और यूक्रेनी। और अगर आप टेक्स्ट ट्रांसलेट को लाइव देखने के बजाय तस्वीर को स्नैप करने का विकल्प चुनते हैं, तो कुल 37 भाषाएं समर्थित हैं।

तो Google कैसे उपलब्ध भाषाओं की संख्या बढ़ाने में सक्षम था? उन्होंने पहले वर्ड लेंस का अधिग्रहण किया, जो पहले एक संवर्धित वास्तविकता अनुवाद एप्लिकेशन था, और ऐप की क्षमताओं को बढ़ाने के लिए मशीन लर्निंग और कन्वेन्शनल न्यूरल नेटवर्क का इस्तेमाल किया। छवि पहचान में प्रगति महत्वपूर्ण थी।

पांच साल पहले, यदि आपने कंप्यूटर को बिल्ली या कुत्ते की छवि दी, तो उसे यह बताने में परेशानी हुई कि कौन सा है। दृढ़ तंत्रिका नेटवर्क के लिए धन्यवाद, न केवल कंप्यूटर बिल्लियों और कुत्तों के बीच अंतर बता सकते हैं, वे कुत्तों की विभिन्न नस्लों को भी पहचान सकते हैं, श्री गुड ने कहा। हाँ, वे सिर्फ से अधिक के लिए अच्छे हैं ट्रिपी आर्ट —यदि आप किसी विदेशी मेनू का अनुवाद कर रहे हैं या Google के अनुवाद ऐप के नवीनतम संस्करण के साथ साइन इन कर रहे हैं, तो आप अब एक गहरे तंत्रिका जाल का उपयोग कर रहे हैं।

क्रमशः

प्रथम , अनुवाद को पृष्ठभूमि की अव्यवस्था को दूर करना चाहिए और पाठ का पता लगाना चाहिए। जब यह एक ही रंग के पिक्सेल के बूँद का पता लगाता है, तो यह निर्धारित करता है कि वे अक्षर हैं। और जब वे बूँदें एक-दूसरे के करीब होती हैं, तो वह समझती है कि यह एक सतत पंक्ति है जिसे पढ़ा जाना है।

अगला, ऐप को यह पहचानना चाहिए कि प्रत्येक व्यक्तिगत पत्र क्या है। यहीं से गहरी सीख आती है।

हम एक दृढ़ तंत्रिका नेटवर्क का उपयोग करते हैं, इसे अक्षरों और गैर-अक्षरों पर प्रशिक्षित करते हैं ताकि यह सीख सके कि विभिन्न अक्षर कैसा दिखते हैं, ब्लॉग पोस्ट पढ़ता है।

शोधकर्ताओं को न केवल साफ दिखने वाले अक्षरों का उपयोग करके सॉफ्टवेयर को प्रशिक्षित करना था, बल्कि गंदे अक्षरों का भी उपयोग करना था। मिस्टर गुड ने लिखा है कि वास्तविक दुनिया के पत्र प्रतिबिंब, गंदगी, धब्बे और सभी प्रकार की अजीबता से प्रभावित होते हैं। इसलिए हमने वास्तविक दुनिया के शोर की नकल करने के लिए सभी प्रकार की नकली गंदगी बनाने के लिए अपने पत्र जनरेटर का निर्माण किया- नकली प्रतिबिंब, नकली धुंध, नकली अजीबता।

प्रशिक्षण के लिए इस्तेमाल किए जाने वाले कुछ गंदे अक्षर। (फोटो: गूगल)

तीसरा चरण अनुवाद प्राप्त करने के लिए एक शब्दकोश में मान्यता प्राप्त अक्षरों को देख रहा है। और सटीकता पर एक अतिरिक्त प्रयास के लिए, शब्दकोश लुकअप अनुमानित हैं यदि एस को 5 के रूप में गलत तरीके से पढ़ा जाता है।

अंततः, अनुवादित पाठ मूल के शीर्ष पर उसी शैली में प्रस्तुत किया गया है।

हम ऐसा इसलिए कर सकते हैं क्योंकि हम पहले से ही छवि में अक्षरों को ढूंढ और पढ़ चुके हैं, इसलिए हम जानते हैं कि वे कहां हैं। हम अक्षरों के आस-पास के रंगों को देख सकते हैं और इसका उपयोग मूल अक्षरों को मिटाने के लिए कर सकते हैं। और फिर हम मूल अग्रभूमि रंग का उपयोग करके अनुवाद को शीर्ष पर बना सकते हैं, ब्लॉग पोस्ट पढ़ता है।

जितना संभव हो उतना कुशल होने के लिए और इन सभी चरणों को इंटरनेट या डेटा कनेक्शन के बिना वास्तविक समय में पूरा करने की अनुमति देने के लिए, Google टीम ने एक बहुत छोटा तंत्रिका जाल विकसित किया है जो सूचना के घनत्व पर एक ऊपरी सीमा के साथ है जिसे वह संभाल सकता है। चूंकि वे अपना स्वयं का प्रशिक्षण डेटा तैयार कर रहे थे, इसलिए सही डेटा शामिल करना महत्वपूर्ण था, लेकिन अतिरिक्त कुछ भी नहीं, इसलिए तंत्रिका नेटवर्क महत्वहीन चीजों पर अपने सूचना घनत्व का बहुत अधिक उपयोग नहीं कर रहा है। एक उदाहरण यह होगा कि कैसे इसे एक अक्षर को थोड़े से घूर्णन के साथ पहचानने की आवश्यकता होती है, लेकिन बहुत अधिक नहीं।

अंत में, उपयोगकर्ताओं के पास 20 और भाषाओं के साथ छोड़ दिया जाता है लेकिन वही तेज गति।

यह भी देखें: Google की AI टीम ने हमें उनके मशीन लर्निंग रिसर्च में कमी दी है

Google AI अब उपयोगकर्ताओं को फ़ोन कैमरों के साथ 27 भाषाओं में टेक्स्ट का तुरंत अनुवाद करने देता है

क्रमशः

लेख जो आपको पसंद हो सकते हैं :

प्रिंस हैरी को लॉस एंजिल्स में अपने और मेघन के नए जीवन के साथ तालमेल बिठाने में परेशानी हो रही है

कास्ट ऑफ लकी इज किलर। बहुत खराब प्लॉट और स्क्रिप्ट नहीं हैं।

यह सभी देखें:

क्रिस्टोफ वाल्ट्ज द्वारा 'जॉर्जटाउन' एक योग्य निर्देशन की शुरुआत है

एपिक सीज़न 3 रीयूनियन के दौरान 'बॉडी शेमिंग' के लिए 'लव इज़ ब्लाइंड्स ज़ानब जाफरी स्लैम कोल बार्नेट'

पीट डेविडसन की पूर्व एरियाना ग्रांडे को सुनते हुए किम कार्दशियन ने धमाकेदार शुरुआत की: देखें

स्कूल की लड़ाई में, हम 'माता-पिता के अधिकार' की चर्चा पूरी तरह से गलत कर रहे हैं

रोसालिया और रॉ एलेजांद्रो अलग हो गए: प्रस्ताव के ठीक 4 महीने बाद जोड़े ने सगाई खत्म कर दी

जस्टिन बीबर ने सेलेना गोमेज़ के साथ प्यार भरी नई 'कडल' तस्वीर पोस्ट की

बिज़नेस और मीडिया हस्तियाँ जो अब तक डिज़्नी-पेल्ट्ज़ प्रॉक्सी युद्ध में बॉब इगर का समर्थन करती हैं