தமிழைக் கணினியில் மொழிபெயர்க்கும் மென்பொருளை உருவாக்கப் பயன்படும் ஆய்வு: முதல்முறையாக முனைவர் பட்டம் பெற்ற சென்னை மாணவி

By டி.செல்வகுமார்

தமிழைக் கணினியில் மொழி பெயர்க்கும் மென்பொருளை உரு வாக்கப் பயன்படும் ஆய்வுக் கட்டுரைக்கு முதன்முறையாக முனைவர் பட்டம் பெற்றிருக்கிறார் சென்னை மாணவி.

மொழிபெயர்ப்புக்கு 100 ஆண்டு வரலாறு உண்டு. இந்தியாவில் இந்தி உட்பட பல மொழிகளின் மொழிபெயர்ப்புக்குக் கணினியை ஏறக்குறைய முழுமையாகப் பயன்படுத்திவிட்டனர் என்றே சொல் லலாம். அதாவது பிற மொழியில் நடைமுறையில் எழுதப் படும் ஒரு வாக்கியத்தைக் கணினியில் பதிவு செய்தால், அது அப்ப டியே ஆங்கிலத்தில் மொழி பெயர்க் கப்படுகிறது. ஆனால், தமிழ் மொழி யில், நாம் எழுதுகிற தமிழை அப்படியே ஆங்கிலத்தில் மொழி பெயர்க்கும் நிலை இப்போது இல்லை.

இந்நிலையில், சென்னைப் பல் கலைக்கழக மொழியியல் துறை முன்னாள் தலைவர் ந. தெய்வ சுந்தரம், நாம் எழுதுகிற தமி ழைக் கணினி தானாகவே மொழி பெயர்க்கும் திறன்கொண்ட மென் பொருளை உருவாக்கும் முயற்சி யில் ஈடுபட்டுள்ளார்.

இத்தகைய முயற்சியில் தன்னை முழுமையாக ஈடுபடுத்திக் கொண்டுள்ள இவரது மாணவி கி.உமாதேவி, நாம் எழுதுகிற தமிழை அப்படியே பொருள் மாறா மல் ஆங்கிலத்தில் மொழிபெயர்ப் பது குறித்து இலக்கண அடிப்படை யில் மூன்று ஆண்டுகளாக ஆய்வு செய்துள்ளார். இதற்காக சென் னைப் பல்கலைக்கழகத்தில் முனை வர் பட்டம் பெற்றிருக்கிறார். அவருக்கு ஆங்கிலத்துறைப் பேராசிரியர் அருணாதேவி என்பவர் வழிகாட்டியாக இருந்துள்ளார்.

இளங்கலை தமிழ் படித்த உமாதேவி, மொழியியலை அறிவி யல்பூர்வமாகப் படித்து அதில் முதுகலை பட்டம் பெற்றார். தமிழ் வாக்கியத்தை அப்படியே இலக் கணப் பிழையில்லாமல் ஆங்கிலத் தில் மொழிபெயர்க்கப் பயன்படும் ஆய்வுக் கட்டுரை எழுத வேண் டும். அதைக் கணினியிலும் சாத்திய மாக்க வேண்டும் என்பதை வாழ் நாள் லட்சியமாகக் கொண்டுள்ளார்.

தனது ஆய்வு நூல் பற்றி அவர் நம்மிடம் பகிர்ந்து கொண்ட தகவல்கள்:

ஆங்கில மொழி, ஐரோப்பிய மொழிக் குடும்பம், தமிழ் மொழி, திராவிட மொழிக் குடும்பம். அத னால், இரண்டு மொழிகளின் இலக் கணத்தில் ஒற்றுமை, வேற்றுமை நிறையவே இருக்கிறது. தமிழில் இலக்கணச் சொற்கள் ஏராள மாக இணைக்கப்படுகிறது. ஆங்கி லத்தில் அவ்வாறு இல்லை.

‘Write’ என்ற வார்த்தைக்கு write, writes, wrote, written, writing, to write ஆகிய 6 வடிவங்கள்தான் இருக்கின்றன. ஆனால், ‘எழுது’ என்ற தமிழ் வேர்ச் சொல்லுக்கு எழுத வேண்டும், எழுதியிருக்கலாம், எழுதியாக வேண்டும் என்பன போன்ற சுமார் 8 ஆயிரம் வடிவங்கள் இருக்கின்றன. எனது ஆய்வுக் கட்டுரையில் 400-க்கும் மேற்பட்ட தமிழ் இலக்கணச் சொற்களுக்கு ஆங்கில மொழிபெயர்ப்பைக் கொடுத்துள்ளேன்.

அதாவது, தமிழ் ஆங்கிலம் அகராதியில் இலக்கணச் சொற்கள் சேராத தமிழ் அடிச்சொல்லுக்கு மட்டுமே இணையான ஆங்கிலச் சொல் - மொழிபெயர்ப்பு இருக்கும். உதாரணத்துக்கு ‘சொல்’ என்ற வார்த்தையை அகராதியில் பார்த் தால் ‘tell’ என்ற மொழிபெயர்ப்பு இருக்கும்.

ஆனால், நாம் சாதாரணமா கப் பயன்படுத்துகிற இலக்கணச் சொற்கள் சேர்ந்த தமிழ்ச்சொல் லுக்கு மொழிபெயர்ப்பு அகராதியில் இருக்காது. எடுத்துக்காட்டாக ‘சொல்லப்பட்டிருக்கலாம்’, ‘சொல் லியாக வேண்டும்’ என்பது போன்ற பல்வேறு வார்த்தைகளுக்கு ஆங் கில அகராதியில் மொழிபெயர்ப்பு இருக்காது. இதைச் சரியாக மொழி பெயர்க்க வேண்டும் என்றால், முதலில் தமிழ்ச் சொல்லை இலக் கணப்படி முறையாகப் பிரிக்க வேண்டும்.

பின்னர் அதற்கு இணை யாக ஆங்கில இலக்கணச் சொல் லைக் கண்டுபிடிக்க வேண்டும். அவ்வாறு செய்தால்தான், தமிழ் சொல்லுக்கு இணையான ஆங்கில மொழிபெயர்ப்பு மிகச்சரியாக இருக்கும்.

ஒரு சொல்லை மொழிபெயர்ப் பதற்கும், ஒரு வாக்கியத்தை மொழி பெயர்ப்பதற்கும் இடைப்பட்ட நிலையே எனது ஆய்வு நூல். வாக்கிய மொழிபெயர்ப்புக்கான ஆய்வு மேற்கொள்ள இந்த நூல் மிகவும் பயன்படும். எனவே, மொழி பெயர்ப்புக்கான இரண்டாவது அகராதி என்று இதைச் சொல்லலாம். அத்துடன் கணினியில் தமிழை ‘டைப்’ செய்தால் அதற்கு இணையான ஆங்கில மொழி பெயர்ப்பு வழங்கும் திறன்கொண்ட மென்பொருளை உருவாக்கவும் இந்த ஆய்வு நூலே அடிப்படையாக இருக்கும்.

இவ்வாறு உமாதேவி கூறினார்.

VIEW COMMENTS

முக்கிய செய்திகள்

தமிழகம்

3 hours ago

தமிழகம்

34 mins ago

தமிழகம்

1 hour ago

தமிழகம்

8 hours ago

தமிழகம்

8 hours ago

தமிழகம்

9 hours ago

தமிழகம்

9 hours ago

தமிழகம்

11 hours ago

தமிழகம்

13 hours ago

தமிழகம்

13 hours ago

தமிழகம்

14 hours ago

தமிழகம்

14 hours ago

தமிழகம்

14 hours ago

தமிழகம்

15 hours ago

தமிழகம்

15 hours ago

மேலும்