आर्टिफिशियल इंटेलिजेंस की बदौलत विदेश यात्रा करना इतना आसान कभी नहीं रहा।
Google अनुवाद ऐप उपयोगकर्ताओं को टेक्स्ट का तुरंत अनुवाद करने देता है। ऐप में, बस अपने कैमरे को उस टेक्स्ट की ओर इंगित करें जिसका आप अनुवाद करना चाहते हैं और आप इसे अपनी आंखों के ठीक सामने अपनी इच्छित भाषा में बदलते हुए देखेंगे—कोई इंटरनेट कनेक्शन या सेल फोन डेटा की आवश्यकता नहीं है। यह आसान सुविधा कुछ समय के लिए उपलब्ध है, लेकिन यह केवल सात भाषाओं के साथ संगत थी। अब क , मशीन लर्निंग की बदौलत, Google ने 27 भाषाओं का तुरंत अनुवाद करने के लिए ऐप को अपग्रेड किया है।
तो अगली बार जब आप प्राग में हों और एक मेनू नहीं पढ़ सकते हैं, तो हमें आपकी पीठ मिल गई है, Google के सॉफ्टवेयर इंजीनियर ओटावियो गुड ने कंपनी के शोध पर लिखा है ब्लॉग .
Google ने भी अपनी वाक् पहचान त्रुटियों को आधा करने के लिए AI का उपयोग किया।
आज तक, अंग्रेजी, फ्रेंच, जर्मन, इतालवी, पुर्तगाली, रूसी और स्पेनिश के बीच अनुवाद के अलावा, निम्नलिखित 20 भाषाओं का वास्तविक समय में भी अनुवाद किया जा सकता है: बल्गेरियाई, कैटलन, क्रोएशियाई, चेक, डेनिश, डच, फिलिपिनो, फ़िनिश, हंगेरियन, इंडोनेशियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, रोमानियाई, स्लोवाक, स्वीडिश, तुर्की और यूक्रेनी। और अगर आप टेक्स्ट ट्रांसलेट को लाइव देखने के बजाय तस्वीर को स्नैप करने का विकल्प चुनते हैं, तो कुल 37 भाषाएं समर्थित हैं।
तो Google कैसे उपलब्ध भाषाओं की संख्या बढ़ाने में सक्षम था? उन्होंने पहले वर्ड लेंस का अधिग्रहण किया, जो पहले एक संवर्धित वास्तविकता अनुवाद एप्लिकेशन था, और ऐप की क्षमताओं को बढ़ाने के लिए मशीन लर्निंग और कन्वेन्शनल न्यूरल नेटवर्क का इस्तेमाल किया। छवि पहचान में प्रगति महत्वपूर्ण थी।
पांच साल पहले, यदि आपने कंप्यूटर को बिल्ली या कुत्ते की छवि दी, तो उसे यह बताने में परेशानी हुई कि कौन सा है। दृढ़ तंत्रिका नेटवर्क के लिए धन्यवाद, न केवल कंप्यूटर बिल्लियों और कुत्तों के बीच अंतर बता सकते हैं, वे कुत्तों की विभिन्न नस्लों को भी पहचान सकते हैं, श्री गुड ने कहा। हाँ, वे सिर्फ से अधिक के लिए अच्छे हैं ट्रिपी आर्ट —यदि आप किसी विदेशी मेनू का अनुवाद कर रहे हैं या Google के अनुवाद ऐप के नवीनतम संस्करण के साथ साइन इन कर रहे हैं, तो आप अब एक गहरे तंत्रिका जाल का उपयोग कर रहे हैं।
क्रमशः
प्रथम , अनुवाद को पृष्ठभूमि की अव्यवस्था को दूर करना चाहिए और पाठ का पता लगाना चाहिए। जब यह एक ही रंग के पिक्सेल के बूँद का पता लगाता है, तो यह निर्धारित करता है कि वे अक्षर हैं। और जब वे बूँदें एक-दूसरे के करीब होती हैं, तो वह समझती है कि यह एक सतत पंक्ति है जिसे पढ़ा जाना है।
अगला, ऐप को यह पहचानना चाहिए कि प्रत्येक व्यक्तिगत पत्र क्या है। यहीं से गहरी सीख आती है।
हम एक दृढ़ तंत्रिका नेटवर्क का उपयोग करते हैं, इसे अक्षरों और गैर-अक्षरों पर प्रशिक्षित करते हैं ताकि यह सीख सके कि विभिन्न अक्षर कैसा दिखते हैं, ब्लॉग पोस्ट पढ़ता है।
शोधकर्ताओं को न केवल साफ दिखने वाले अक्षरों का उपयोग करके सॉफ्टवेयर को प्रशिक्षित करना था, बल्कि गंदे अक्षरों का भी उपयोग करना था। मिस्टर गुड ने लिखा है कि वास्तविक दुनिया के पत्र प्रतिबिंब, गंदगी, धब्बे और सभी प्रकार की अजीबता से प्रभावित होते हैं। इसलिए हमने वास्तविक दुनिया के शोर की नकल करने के लिए सभी प्रकार की नकली गंदगी बनाने के लिए अपने पत्र जनरेटर का निर्माण किया- नकली प्रतिबिंब, नकली धुंध, नकली अजीबता।
तीसरा चरण अनुवाद प्राप्त करने के लिए एक शब्दकोश में मान्यता प्राप्त अक्षरों को देख रहा है। और सटीकता पर एक अतिरिक्त प्रयास के लिए, शब्दकोश लुकअप अनुमानित हैं यदि एस को 5 के रूप में गलत तरीके से पढ़ा जाता है।
अंततः, अनुवादित पाठ मूल के शीर्ष पर उसी शैली में प्रस्तुत किया गया है।
हम ऐसा इसलिए कर सकते हैं क्योंकि हम पहले से ही छवि में अक्षरों को ढूंढ और पढ़ चुके हैं, इसलिए हम जानते हैं कि वे कहां हैं। हम अक्षरों के आस-पास के रंगों को देख सकते हैं और इसका उपयोग मूल अक्षरों को मिटाने के लिए कर सकते हैं। और फिर हम मूल अग्रभूमि रंग का उपयोग करके अनुवाद को शीर्ष पर बना सकते हैं, ब्लॉग पोस्ट पढ़ता है।
जितना संभव हो उतना कुशल होने के लिए और इन सभी चरणों को इंटरनेट या डेटा कनेक्शन के बिना वास्तविक समय में पूरा करने की अनुमति देने के लिए, Google टीम ने एक बहुत छोटा तंत्रिका जाल विकसित किया है जो सूचना के घनत्व पर एक ऊपरी सीमा के साथ है जिसे वह संभाल सकता है। चूंकि वे अपना स्वयं का प्रशिक्षण डेटा तैयार कर रहे थे, इसलिए सही डेटा शामिल करना महत्वपूर्ण था, लेकिन अतिरिक्त कुछ भी नहीं, इसलिए तंत्रिका नेटवर्क महत्वहीन चीजों पर अपने सूचना घनत्व का बहुत अधिक उपयोग नहीं कर रहा है। एक उदाहरण यह होगा कि कैसे इसे एक अक्षर को थोड़े से घूर्णन के साथ पहचानने की आवश्यकता होती है, लेकिन बहुत अधिक नहीं।
अंत में, उपयोगकर्ताओं के पास 20 और भाषाओं के साथ छोड़ दिया जाता है लेकिन वही तेज गति।
यह भी देखें: Google की AI टीम ने हमें उनके मशीन लर्निंग रिसर्च में कमी दी है