Feb 2, 2011

கணினியில் தமிழ் தெரிவது எப்படி?

{mosimage} கணினியில் ஆங்கிலம் மட்டுமே இயங்கும் அல்லது கணினி ஆங்கிலத்தை மட்டுமே புரிந்து கொள்ளும்.  என நினைக்கிறீர்களா? கணினி தமிழைப் புரிந்து கொள்ளுமா,  கணினி தமிழ் மட்டுமல்ல எந்த மனித மொழியையும் புரிந்து கொள்ளாது. அதற்குப் புரியக் கூடிய ஒரே மொழி இலக்க மொழி (Machine Language) தான். இந்த மொழியில் இரண்டே இரண்டு குறியீடுகள் தான். அவை ஒன்று மற்றும் சுழி (பூஜ்யம்).
ஆனால் நாங்கள் ஆங்கிலத்தில் தானே கணினித் திரையில் பார்க்கிறோம். கட்டளைகள் எல்லாம் ஆங்கிலத்தில் தானே இருக்கின்றன என்று தோன்றுகிறதா? அவை உங்களுக்கு ஆங்கிலத்தில் இருக்கின்றன ஆனால் கணினி அந்த ஒவ்வொரு கட்டளையையும் அது புரிந்துகொள்ளக் கூடிய இலக்க மொழியில் மாற்றப்பட்டு கணினியின் மூளையான செயலகம் (Processor) நிறைவேற்றுகிறது.
கணினி எவ்வாறு செயல்படுகிறது எவ்வாறு இயங்குதளம் தரவுதளம் இயங்குகின்றன என்கிற நுணுக்கங்களுக்குச் செல்லாமல் திரையில் ஒரு குறிப்பிட்ட மொழியில் எழுத்துருவில் தெரிவது எப்படி என்று மட்டும் பார்ப்போம்.
கணினியை நாம் அச்சுத்துறைக்குப்(print) பயன்படுத்தும் பொழுது நாம் விரும்பும்படி தான் ஆங்கில மொழியின் எழுத்துக்களைக் கூட பயன்படுத்திச் சேமிக்க வேண்டும். அதனால் ஒரு கணினி புரிந்து கொள்ளும் படி நாம் ஒவ்வொரு எழுத்தையும் ஒவ்வொரு எண்ணாக மாற்றித்தான் சேமிக்கவேண்டும்.
சரி ஆங்கிலம் தெரிவதே சிக்கல் என்றால் வேறு சில மொழிகள் இப்போது நீங்கள் படித்துக் கொண்டிருக்கும் தமிழ் தெரிவது எப்படி?
ஒரு மொழியை நாம் கணிப்பொறியில் பயன்படுத்த வேண்டுமென்றால் அந்த மொழியின் ஒவ்வொரு எழுத்துக்கும் ஒவ்வொரு எண்ணை நிர்ணயிக்க வேண்டும். இவ்வாறு நிர்ணயிக்கும் முறையை நாம் குறியீட்டு முறை (Character Encoding) என்று அழைக்கிறோம்.  
நாம் இந்த குறியீட்டு முறையை பயன்படுத்தி ஒரு புத்தகத்தின் பக்கங்களை கணிணிக்குள் சேமித்துவிடுகிறோம் என்று வைத்துக்கொள்வோம். பிறகு அதை நாம் கணினி திரையில் பார்க்க விரும்பும் பொழுது, சேமித்த எண்களையெல்லம் கூட்டி, கழித்து எழுத்துக்களாக மாற்றும் வேலையை யாராவது செய்ய வேண்டுமில்லையா?  கணிப்பொறி எழுத்துரு (Fontஎன்ற கோப்புச்செயலியைப் பயன்படுத்தி, ஒவ்வொரு எண்ணுக்கும் என்ன எழுத்து வடிவம் என்பதை தேர்ந்தெடுத்து பிரதியிட்டுவிடும்.
ஆங்கில மொழிக்கு, தகவல் பரிமாற்றத்துக்கான அமெரிக்க நியமக் குறியீட்டு முறை சுருக்கமாக ஆஸ்கி - ASCII (American Standard Code For Information Interchange) அல்லது அதன் அடிப்படையில் உருவாக்கப்பட்ட விண்டோஸ் அமெரிக்க தேசியத் தரநிர்ணயக் கழக முறை சுருக்கமாக ஆன்ஸி - Windows ANSI (American National Standards Institute) என்ற குறியீட்டு முறையை பயன்படுத்துகிறார்கள்.
தமிழில் ஒவ்வொரு மென்பொருள் எழுத்துருவும் பற்பல தன்னார்வலர்களின் படைப்புகளாகும். ஆளாளுக்கு ஒவ்வொரு குறியீட்டு முறையைப் பயன்படுத்தி எழுதி வந்தார்கள். இதனால் இவர் எழுதுவது அவருக்கும் அவர் எழுதுவது இவருக்கும் புரியாத நிலை ஏற்பட்டது.  விளைவு? தமிழில் ஒருவர் எழுதியது இன்னொருவருக்கு கிரேக்கம் இலத்தீன் போலத் தெரிந்தன.
இதனைச் சீர்செய்யும் முயற்சியில், புனேயில் உள்ள சி-டாக் - C-DAC (Centre for Development of Advanced Computing) என்ற இந்திய அரசு நிறுவனம் பல்வேறு கணினி நிபுணர்கள், விற்பன்னர்களின் துணையுடன் இந்திய மொழிகள் அனைத்திற்கும் பொதுவாக இந்திய நியமக் குறியீட்டு முறை சுருக்கமாக 'இஸ்கி' - ISCII (Indian Standard Code for Information Interchange) என்ற குறியீட்டு முறையை அறிமுகப்படுத்தியது.  இக்குறியீடு இந்திய மத்திய அரசு நிறுவனங்கள் மற்றும் மாவட்ட ஆட்சி மையங்களில் புகழ்பெற்ற அளவுக்கு பொதுமக்களிடம் போதுமான வரவேற்பைப் பெறாததால் தோல்வியடைந்தது. பெரும்பாலான இந்திய மொழிகளைத் தன்னுள் அடக்க வல்ல எளிதான ஒரு குறியீட்டு முறையை உருவாக்குவதில் 'இஸ்கி' ஓரளவுக்கு வெற்றி கண்டாலும் மக்கள் ' அதனை ஒதுக்கிவிட்டார்கள்.
பிறகு, ஆங்கிலம் போல் தமிழிலும் எல்லோரும் ஒரே குறியீட்டு முறையை பயன்படுத்த வேண்டும் என்ற எண்ணத்தில், சென்னையில் 1999-ஆம் ஆண்டு பிப்ரவரி 7-8 தேதி சர்வதேச அங்கீகாரம் பெற்ற பொதுவான தமிழ் நியமக் குறியீட்டு முறை அல்லது 'திஸ்கி' (TSCII - Tamil Standard Code for Information Interchange) குறியீட்டு முறையை அறிவித்தது.
 தற்போது ஒருங்குறி (Unicode) சக்தி வாய்ந்த சர்வதேச குறியீட்டு முறையாக ஏற்றுக்கொள்ளப்பட்டு, இந்திய மொழிகள்  மட்டுமல்லாமல், உலக மொழிகள் அனைத்தையும்  தன்னகத்தே  கொண்டு உலா வருகிறது! 

0 கருத்துக்கள்:

Post a Comment