शुक्रवार, 24 सितंबर 2010

मशीन अनुवाद का विस्तार !

                 पिछली कड़ी में हमारे कुछ मित्रों ने टिप्पणी में ये बात भी कही थी कि हम क्या हमारी अगली ५ पीढ़ी भी मशीन से सही अनुवाद प्राप्त नहीं कर सकती! इसका क्या आधार था, ये तो मैं नहीं समझ पाई, पर जहाँ तक मेरा अपना विचार है - मानव, मेधा और मशीन ये तीनों ही ऐसी चीजें हैं जिन्होंने विज्ञान की दृष्टि से वो प्रगति की है जिसकी कुछ दशकों पूर्व कल्पना नहीं की जा सकती थी.              
             अगर हम मानव अनुवादक और मशीन अनुवाद की तुलना करें तो हमें उसकी गति , स्तर  और क्षेत्र सभी का ध्यान रखना होगा. मानव मष्तिष्क की एक सीमा है और ज्ञान के क्षेत्र में भी हम तभी प्रविष्ट होते है जब हम उससे जुड़े होते हैं. जीवन में बहुत सारे क्षेत्र है और उनके बहुत सारे  विशेषज्ञ भी हैं. परन्तु व्यक्ति हर क्षेत्र की जानकारी अपने मष्तिष्क में एक सीमा तक ही संचित कर सकता है और मशीन असीमित. इसके लिए मशीन अनुवाद प्रक्रिया में अलग अलग क्षेत्र निश्चित कर दिए जाते हैं जैसे -- चिकित्सा, विधि, पर्यटन, प्रशासनिक आदि आदि.
               हर क्षेत्र में अनुवाद की जरूरत होती है, यह आवश्यक नहीं है कि चिकित्सा क्षेत्र का विशेषज्ञ एक अच्छा अनुवादक सिद्ध हो  सके क्योंकि उसको भाषा का उतना अच्छा ज्ञान न हो और यही बात सभी क्षेत्रों में लागू होती है. हम शब्दकोश के कितने शब्दों को प्रयोग करेंगे क्योंकि उसके लिए समय लगता है और तब हमारी अनुवाद की गति प्रभावित होगी और अगर हम नेट पर पड़े शब्दकोश के प्रयोग की बात करें तो उसकी शब्द सीमा अभी बहुत ही सीमित है. मशीन अनुवाद के लिए अलग अलग क्षेत्र निश्चित किये गए हैं. बहुअर्थी शब्दों को सम्बंधित क्षेत्र के शब्दकोश में संचित किया जाता है और जो एक सामान्य शब्दकोश है शेष को उसमें. जिस शब्द का सिर्फ एक ही अर्थ होता है उसको हम सामान्य क्षेत्र में ही रख देते हैं. अगर हम प्रशासनिक सामग्री को मशीन से अनुवादित कर रहे हैं तो आरम्भ में ही संकेत से इंगित किया जाता है कि हमारी सामग्री किस क्षेत्र की है और उसको किस शब्दकोश को प्राथमिकता देनी है अगर वह शब्द वहाँ अनुपस्थित होता है तो उसे सामान्य  शब्दकोश से ही ले लिया जाता है और सही अनुवाद प्राप्त किया जा सकता है. 
                अगर हम आरोप का एक पक्ष देखें तो "गुड मोर्निंग " का अनुवाद हमारी मशीन को तो "अच्छी सुबह " ही देना चाहिए क्योंकि उसको तो नहीं मालूम है कि ये एक अपने आप में एक सम्पूर्ण वाक्य कहा जाता है. लेकिन मशीन मानव निर्देशित नियमों पर काम कर रही है और उसको इस बात का पूरा पूरा निर्देश दिया गया है कि इस तरह के वाक्यों को  कैसे अनुवादित करना है और हमें "शुभ प्रभात" ही अनुवाद प्राप्त होगा. 
                मैं इस विषय में एक बहुत अच्छा उदहारण देती हूँ जैसे -- "old " विशेषण के लिए हम हिंदी में विभिन्न संज्ञा के साथ विभिन्न अर्थों में प्रयोग करते हैं . इसके लिए "old man ", "old friend "  और 3 years old "  . आम धारणा के अनुसार तो मशीन को पुराना आदमी, पुराना मित्र और ३ साल पुराना ही देना चाहिए जो कि इसका साधारण अर्थ समझा जाता है लेकिन नहीं ये मशीन भी इस के लिए "बूढा आदमी", "पुराना मित्र" और " ३ वर्षीय " ही अनुवादित करेगी. मशीन कैसे अलग अलग अर्थों को अलग अलग संज्ञा के साथ प्रयोग में ला सकती है. इसके लिए उसको विभिन्न  प्रकार के निर्देशों के द्वारा सक्षम बनाया जाता है कि उसको किस स्थिति में कौन सा नियम प्रयोग करना है. किस वर्ग  के शब्द के साथ कैसे अन्य वर्ग  को प्रयोग करना है. सभी कुछ  विशेषज्ञों  के द्वारा निर्देशित होता है. इसके लिए इतने  स्पष्ट  निर्देश होते  हैं कि  मशीन को संज्ञा, सर्वनाम , क्रिया , विशेषण , क्रिया  विशेषण सभी के विभिन्न प्रकारों  से भी उसको अवगत  कराने  के लिए सामग्री संचित की जाती है और उसको पहचानने  के लिए हमारे  विशेषज्ञों  ने बहुत बारीकी  से उसकी  सीमायें  तय  की  हैं ताकि  उसको अनुवाद  के लिए किसी  भी संशय  का सामना  न  करना पड़े और सही अनुवाद के लिए सही शब्द का प्रयोग किया जा सके. अगर हम मानव त्रुटि  से किसी  गलत  संकेत को दे  देते हैं तो हमको  अवश्य  ही गलत  शब्द का प्रयोग ही अनुवाद में प्राप्त होगा. मशीन उसको अपने अनुसार सही नहीं कर सकती  है.
                     मशीन अनुवाद जिस पर पूरे  देश  में विभिन्न संस्थान  विभिन्न भाषाओं  में कार्य  कर रहे हैं और उसमें हम सफलतापूर्वक  कार्य  कर सकते  हैं. हाँ  , यह अवश्य  है कि इसके विस्तार  और परिमार्जन  का कार्य  असीमित  होता है क्योंकि जैसे जैसे हमारे परीक्षण होते हैं वैसे ही हमें ज्ञात होता है  कि अमुक शब्द या अमुक वाक्य अभी अनुवादित होने में कुछ समस्या है और फिर उसके निराकरण के लिए कार्य करना होता है ताकि हम किसी भी सीमा में उसको प्रयोग करने के लिए सफल हो सकें. मशीन अनुवाद मात्र अंग्रेजी से हिंदी और हिंदी से अंग्रेजी में ही नहीं हो रहा है अपितु यह अंग्रेजी से मराठी, मलयालम, कन्नड़, तेलुगु, उर्दू, पंजाबी, बंगला सभी भाषाओं में हो रहा है. यह अवश्य है किसी में अभी सक्षमता में कमी है और किसी भाषा में बहुत सक्षमता से कार्य कर रहा है. हिंदी में कार्य करते हुए बहुत वर्ष बीत चुके हैं और इसका सम्पूर्ण ढांचा सफलतापूर्वक कार्य कर रहा है. इसके लिए विभिन्न भाषाओं के भाषाविद , कंप्यूटर  विशेषज्ञ, व्याकरण  के ज्ञाता  सभी का उल्लेखनीय  सहयोग  रहा है और आगे  भी इनके  सहयोग  से ही हम इसकी  गुणवत्ता  को और अधिक  बेहतर  बनाने  के लिए कार्य  कर रहे हैं.
            

19 टिप्‍पणियां:

  1. एक जानकारी पूर्ण लेख... मशीनों के दिल नहीं होता की अवधारणा को आपने गलत साबित किया है... मशीने भी दिमाग़ से सोचती हैं... बहुत अच्छी जानकारी से भरपूर है यह लेख. धन्यवाद रेखा जी!!

    जवाब देंहटाएं
  2. एक बहुत ही सरल और सरस भाषा में आपने इसकी तकनीकी विशेषता और अन्य पक्षों को समझाया है। वो एक शब्द "कंप्यूटर इंटेलिजेंस" का प्रयोग करते हैं ना हम मशीनी अनुवाद के लिए, उस पर भी प्रकाश डाल देंगी, कभी।
    आपका आभार, आप राजभाषा हिन्दी को समृद्ध से समृद्धतर कर रही हैं।

    जवाब देंहटाएं
  3. ज्ञान का सागर बांट रही हैं आप। बहुत अच्छी प्रस्तुति। हार्दिक शुभकामनाएं!
    स्वरोदय विज्ञान – 10 आचार्य परशुराम राय, द्वारा “मनोज” पर, पढिए!

    जवाब देंहटाएं
  4. बहुत ही सुन्‍दर एवं ज्ञानवर्धक प्रस्‍तुति ।

    जवाब देंहटाएं
  5. बहुत अच्छी जानकारी दे रही हैं ...उदाहरण भी सटीक दिए हैं ...अच्छी प्रस्तुति

    जवाब देंहटाएं
  6. इन सद्प्रयासों हेतु शुभकामनाएँ।

    जवाब देंहटाएं
  7. बहुत ज्ञान वर्धक लेख |अच्छी पोस्ट बधाई
    आशा

    जवाब देंहटाएं
  8. मशीनी अनुवाद के बारे मे अच्छी जानकारी मिल रही है आपके आलेख से.. इसके सुलभता से उपलब्धता भी सुनिश्चित करनी होगी.. फिर भी.. मशीनी अनुवाद की अब भी अपनी सीमा है.. और रहेगी भी... लेकिन सहायक तो है ही...

    जवाब देंहटाएं
  9. बहुत अच्छा लेख है। धन्यवाद


    हमारे ब्लॉग पर आपका स्वागत है।

    मालीगांव
    साया
    लक्ष्य

    जवाब देंहटाएं
  10. अरुण जी ,
    सीमायें तो इंसान की भी है फिर वह तो मशीन है फिर भी मशीन एक साथ कई मानव मस्तिष्कों का ज्ञान एक साथ समेटने में सक्षम है तो हम एक मशीन से बहुत सारे ऐसे कम लेते हैं जो एक व्यक्ति के लिए संभव नहीं है. ये क्या कम है? हमें अपनी उपलब्धियों से कभी संतुष्ट नहीं होना चाहिए नहीं तो प्रगति वही रुक जायेगी. मैं अभी छुट्टी पर चल रही हूँ, जैसे ही मैं ऑफिस ज्वाइन करूंगी किसी लेख में मशीन अनुवाद के snap shot प्रस्तुत करूंगी और निर्णय सब करेंगे कि क्या मैं इसको उपलब्धि नहीं कह सकते हैं?

    जवाब देंहटाएं
  11. अरुण जी ,
    सीमायें तो इंसान की भी है फिर वह तो मशीन है फिर भी मशीन एक साथ कई मानव मस्तिष्कों का ज्ञान एक साथ समेटने में सक्षम है तो हम एक मशीन से बहुत सारे ऐसे कम लेते हैं जो एक व्यक्ति के लिए संभव नहीं है. ये क्या कम है? हमें अपनी उपलब्धियों से कभी संतुष्ट नहीं होना चाहिए नहीं तो प्रगति वही रुक जायेगी. मैं अभी छुट्टी पर चल रही हूँ, जैसे ही मैं ऑफिस ज्वाइन करूंगी किसी लेख में मशीन अनुवाद के snap shot प्रस्तुत करूंगी और निर्णय सब करेंगे कि क्या मैं इसको उपलब्धि नहीं कह सकते हैं?

    जवाब देंहटाएं
  12. राजभाषा हिंदी,

    कम्प्यूटर में "Artificial Intelligence " एक क्षेत्र है जिसमें हम इस प्रकार के कार्य सम्पन्न करते हैं.

    जवाब देंहटाएं
  13. आप सबके हौसला बढ़ाने के लिए बहुत बहुत शुक्रिया, अगर समय हो तो नीचे दिए लिनक्स पर आइये बहुत कुछ ऐसा ही मिलेगा.
    --


    http://kriwija.blogspot.com/
    http://hindigen.blogspot.com
    http://rekha-srivastava.blogspot.com
    http://merasarokar.blogspot.com
    http://katha-saagar.blogspot.com

    जवाब देंहटाएं
  14. मैंने मशीनी अनुवाद के बीसियों डेमो देखे हैं। मेरा अनुभव है कि मशीन केवल उन्हीं शब्दों अथवा शब्दावलियों का अनुवाद कर सकता है,जिनके लिए मुहरें बनाकर भी काम चलाया जा सकता है। सोचने की प्रक्रिया इसके वश की नहीं। अगर सामग्री बड़ी हो,तो परिमार्जन में ही घंटों निकल जाते हैं। अनुवाद मूलतः जिन प्रयोजनों के लिए चाहिए होता है,उसमें यह एकदम नाकाम है। एक उदाहरणः
    राम के चार बेटे हैं-Ram has four sons.
    पुस्तक में चार सौ पृष्ठ हैं-This book has 400 pages.
    मोहन को बुखार है-Mohan has caught fever.
    उसके पास एक टेलीविजन है-He has a television.
    क्या मशीन यह तय कर सकती है कि अंग्रेजी के has के लिए कहां "के" होगा,कहां "में",कहां "को" और कहां "के पास"? और अगर इतने छोटे-छोटे वाक्यों को भी परिमार्जित करना पड़े,तो फिर मशीन का क्या काम?

    जवाब देंहटाएं
  15. राधारमण जी,

    आपने डेमो कहाँ देखे और किस अनुवाद प्रणाली के देखे ये तो मैं नहीं जानती हूँ लेकिन मशीन इनको has को जिस रूप में प्रयोग होना चाहिए उसी में कर रही है. कृपया अपनी शंकाओं को इसी तरह से बताते रहें. मैं समयानुसार इनका अनुवाद प्रस्तुत करूंगी. यही नहीं बल्कि अपनी अगली कड़ियों में - मैं इस विषय में और भी स्पष्ट उदाहरण दूँगी कि मशीन कैसे अलग अलग अर्थों को लेकर अनुवाद करती है. वैसे इसमें प्रस्तुत "old " का उदहारण इस बात का द्योतक हैकि मशीन सोच नहीं सकती लेकिन हम सोच कर ही उसे निर्देश देते हैं और इस सोच में कोई एक व्यक्ति नहीं बल्कि बहुत लोगों का समूह होता है . जो अपने विषय में पारंगत होते हैं . ये एक संयुक्त प्रयास है.

    जवाब देंहटाएं
  16. रेखा जी आपका आलेख निश्चित रूर से बहुत ज्ञानवर्धक है . आपने यह ब्लॉग राष्ट्र-भाषा और राजभाषा हिन्दी के लिए समर्पित किया है , यह और भी खुशी की बात है .अगर संभव हो तो कृपया केन्द्रीय राज-भाषा अधिनियम के बारे में भी कोई आलेख ज़रूर प्रस्तुत करें , ताकि ज्यादा से ज्यादा लोगों को यह मालूम हो सके कि राज भाषा के रूप में हिन्दी को कितना कानूनी संरक्षण प्राप्त है . हार्दिक शुभकामनाएं

    जवाब देंहटाएं

आप अपने सुझाव और मूल्यांकन से हमारा मार्गदर्शन करें