தமிழ் எழுத்துணரி (OCR)
தொட்டல் பூ மலரும்!!!
தொடாமல் தமிழ் மலரும்!!!
தொடாமல் தமிழ் மலரும்!!!
ஒரு நூலில் முக்கிய குறிப்பொன்றை பார்க்கிறோம். அதனை மேற்கோள் காண்பிக்கவோ அல்லது பயன்படுத்தவோ முயற்சி செய்கிறீர்கள். . இப்போது அதை முழுமையாக நாம் தட்டச்சு செய்ய முற்படுகிறீர்கள். ஆனால் அப்படியெல்லாம் நீங்கள் மெனக் கெட வேண்டியதில்லை என்கிறது கணி தொழில் நுட்பம்.
OCR எனும் Optical charecter reader எழுத்துணரியின் பயன்பாடு இப்போது பதிப்புகில் வெகுவாக பயன்படுத்தப்பட்டு வரப்படுகிறது. அனைத்து எழுத்து வடிவங்களையும் உணர்ந்து அதை ஒருங்குறி எழுத்தாக (Unicode Font) மாற்றும் கருவி. இனி தமிழில் வெகு நாட்களாக நிலவி வந்த எழுத்துரு பிரச்சனை ஓரளவு முடிவுக்குக் கொண்டு வரும் முயற்சியாகவே இதனைக் கருதுகிறேன்.
இதனை எப்படி பயன் படுத்த வேண்டுமெனப் பார்ப்போம். . எந்தப் பகுதியை Text ஆக மாற்ற வேண்டுமோ அதனை உங்கள் கைப்பேசி கொண்டு நிழற்படமெடுங்கள். இப்போது இதனை கூகுள் டிரைவில் சேமித்து வையுங்கள். கோப்பினை pdf ஆகவோ அல்லது jpg கோப்பாகவோ சேமிக்கலாம் அது உங்கள் விருப்பம்.
உங்களின் கணினியில் கூகுள் டிரைவ் சென்று அக்கோப்பினை சுட்டி கொண்டு வலது க்ளிக் செய்யுங்கள். Open with … google doc என கோப்பினை திறந்தால் Image ஆக உள்ள எழுத்துகள் அனைத்தும் ஒருங்குறி எழுத்தாக மாறி இருப்பதைக் காணலாம். அதாவது படமும் உரைநடையும் உங்களுக்கு கிடைக்கும்.
இதனை நகலெடுத்து எல்லா விதமான தரவு உள்ளீட்டிற்கும் பயன்படுத்தலாம். பெரியார் எழுத்துச் சீர்திருத்தம் செய்த பழைய ‘லை’ கூட இந்த எழுத்துணரி மாற்றித் தருகிறது என்பது வியப்பான செய்தி.
தமிழில் நல்ல எழுத்துணரி இல்லை என்ற நெருடல் நீண்ட நாட்களாகவே நமக்கு ஒரு குறையாக இருந்தது. அது இப்போது கூகுளின் முயற்சியால் நீங்கி இருப்பது. ஒரு உவப்பான செய்தி # சென்னைத்தமிழன்
0 comments:
Post a Comment