தமிழ் எழுத்துணரி (OCR)

தொட்டல் பூ மலரும்!!!
தொடாமல் தமிழ் மலரும்!!!

ஒரு நூலில் முக்கிய குறிப்பொன்றை பார்க்கிறோம். அதனை மேற்கோள் காண்பிக்கவோ அல்லது பயன்படுத்தவோ முயற்சி செய்கிறீர்கள். . இப்போது அதை முழுமையாக நாம் தட்டச்சு செய்ய முற்படுகிறீர்கள். ஆனால் அப்படியெல்லாம் நீங்கள் மெனக் கெட வேண்டியதில்லை என்கிறது கணி தொழில் நுட்பம்.

OCR எனும் Optical charecter reader எழுத்துணரியின் பயன்பாடு இப்போது பதிப்புகில் வெகுவாக பயன்படுத்தப்பட்டு வரப்படுகிறது. அனைத்து எழுத்து வடிவங்களையும் உணர்ந்து அதை ஒருங்குறி எழுத்தாக (Unicode Font) மாற்றும் கருவி. இனி தமிழில் வெகு நாட்களாக நிலவி வந்த எழுத்துரு பிரச்சனை ஓரளவு முடிவுக்குக் கொண்டு வரும் முயற்சியாகவே இதனைக் கருதுகிறேன்.

இதனை எப்படி பயன் படுத்த வேண்டுமெனப் பார்ப்போம். . எந்தப் பகுதியை Text ஆக மாற்ற வேண்டுமோ அதனை உங்கள் கைப்பேசி கொண்டு நிழற்படமெடுங்கள். இப்போது இதனை கூகுள் டிரைவில் சேமித்து வையுங்கள். கோப்பினை pdf ஆகவோ அல்லது jpg கோப்பாகவோ சேமிக்கலாம் அது உங்கள் விருப்பம். 

உங்களின் கணினியில் கூகுள் டிரைவ் சென்று அக்கோப்பினை சுட்டி கொண்டு வலது க்ளிக் செய்யுங்கள். Open with … google doc என கோப்பினை திறந்தால் Image ஆக உள்ள எழுத்துகள் அனைத்தும் ஒருங்குறி எழுத்தாக மாறி இருப்பதைக் காணலாம். அதாவது படமும் உரைநடையும் உங்களுக்கு கிடைக்கும்.

இதனை நகலெடுத்து எல்லா விதமான தரவு உள்ளீட்டிற்கும் பயன்படுத்தலாம். பெரியார் எழுத்துச் சீர்திருத்தம் செய்த பழைய ‘லை’ கூட இந்த எழுத்துணரி மாற்றித் தருகிறது என்பது வியப்பான செய்தி.

தமிழில் நல்ல எழுத்துணரி இல்லை என்ற நெருடல் நீண்ட நாட்களாகவே நமக்கு ஒரு குறையாக இருந்தது. அது இப்போது கூகுளின் முயற்சியால் நீங்கி இருப்பது. ஒரு உவப்பான செய்தி # சென்னைத்தமிழன்


0 comments:

Post a Comment

Newer Post Older Post Home
மண்ணை நேசிக்கும் மனிதனின் மனசாட்சி

என்னைப்பற்றி

நான் ஒரு வழிப்போக்கன், உங்களைப்போல எனக்கும் எதன் மீதும் கருத்து உண்டு. அதன் மீது உங்களுக்கும் விமர்சனம் இருக்கக்கூடும். இக்குளத்தில் கல்லெறியுங்கள். இனி இப்புவியில் நூறு பூக்கள் மலரட்டும்.

Followers

நூறு வார்த்தை பதிவு

காலச்சக்கரம் வேகமாய் சுழல்கிறது. நூறு வாரத்தைக்குமேல் படிக்க உங்களுக்கும் நேரமில்லாமல், எழுத எனக்கும் நேரமில்லாமல் - இடையே கிடைக்கும் சொற்ப காலத்தில் மனிதவாழ்வினை பற்றி பேசுவோம்.

Recent Comments