கணினித் தமிழின் காலடித் தடங்கள்

கணித்தமிழின் வரலாறு மிக நீண்டது, மிகப் பரந்தது, மிக ஆழமானது. எத்தனையோ ஆர்வலர்கள், ஆய்வாளர்கள், மாணவர்கள், பேராசிரியர்கள் மற்றும் பயனாளர்களின் பங்களிப்பில் எழுதப்பட்ட கணித்தமிழ் வரலாற்றின் முக்கியக் காலகட்டங்களைச் சுருக்கமாக இங்கு நோக்குவோம்.(1). எழுத்துருவும் சொல் செயலாக்கியும்
(Font and word processor)
கணித்தமிழின் வரலாறு தமிழ் எழுத்துருவில் (font) தொடங்கியது என்பதை மறுப்பதற்கில்லை. கணிப்பொறியில் தமிழைக் கையாள ‘எழுத்துரு’ அடிப்படைத் தேவை ஆகும். எண்பதுகளின் தொடக்கத்தில் கணிப்பொறிகளில் டாஸ் (DOS) இயக்க முறைமையே (operating system) இருந்தது. டாஸில் பயன்படுத்தக்கூடிய தமிழ் உரைத் தொகுப்பிகள் (text editors) எண்பதுகளின் தொடக்கத்திலேயே வெளியிடப்பட்டன. அவற்றில் தமிழ் எழுத்துருக்களும் உள்ளிணைக்கப்பட்டிருந்தன. தமிழ்நாட்டில் சில கல்லூரிகளில் ‘பாரதி’ பயன்படுத்தப்பட்டது. அமெரிக்க, ஐரோப்பிய, கனடா தமிழர்கள், டாக்டர் சீனிவாசனின் ‘ஆதமி’யைப் பயன்படுத்தினர். மலேசியா, சிங்கப்பூர் நாடுகளில் துணைவன், பாரதி, கணியன், முரசு ஆகியவை உருவாக்கப்பட்டன. வட அமெரிக்கப் பல்கலைக்கழகங்களில் பணிபுரிந்த தமிழ் அறிஞர்கள் ‘யூனிக்ஸ்’ முறைமையில் பயன் படுத்தக்கூடிய தமிழ் எழுத்துருக்களை உருவாக்கினர். ‘யூஸ்நெட்’ செய்திக் குழுக்களில் பயன்படுத்தப்பட்ட ‘மதுரை’ எழுத்துரு அவற்றுள் குறிப்பிடத்தக்கது.
கணிப்பொறியில் தமிழ் எழுத்துகள் மென் பொருள் மூலமாகவே சாத்தியப்பட்ட அந்தக் காலகட்டத்தில், இந்தியாவில் புனேயில் இருக்கும் இந்திய அரசு நிறுவனமான C-DAC, கணிப்பொறியில் வட்டார மொழிகளைப் பயன்படுத்த GIST என்னும் வன்பொருள் கார்டினை அறிமுகப்படுத்தியது. சிங்கப்பூரிலும் இது போன்ற EPROM கிராஃபிக்ஸ் கார்டு மூலமாக ஆப்பிள்-II கணிப்பொறிகளில் தமிழ் எடுத்தாளப்பட்டதாகப் பதிவுசெய்யப்பட்டுள்ளது.
1985 முதல் 1995 வரையிலான பத்தாண்டுகளில் டாஸ், யூனிக்ஸ், மேக் இயக்க முறைமைகளில் செயல்படக்கூடிய ஏராளமான தமிழ் எழுத்துருக்களும் அவற்றைப் பயன்படுத்தி ஆவணங்களை அச்சிடக்கூடிய ஏராளமான சொல் செயலாக்க மென்பொருள்களும் தமிழ்நாட்டிலும் தமிழர்கள் வாழும் வெளிநாடுகளிலும் ஏராளமாக உருவாக்கப்பட்டன. ஆஸ்திரேலியாவில் ‘கம்பன்’, மலேசியாவில் ‘நளினம்’, சிங்கப்பூரில் ‘தாரகை’ ஆகியவை குறிப்பிடத்தக்கவை.
தமிழ்நாட்டில் பல்வேறு பத்திரிகை நிறுவனங்கள் தத்தமக்கெனத் தயாரிக்கப்பட்ட மென்பொருள்களைப் பயன்படுத்தினர். தமிழ் நாளிதழ்கள், வார, மாதப் பத்திரிகைகள் இத்தகைய மென்பொருள்களைப் பயன்படுத்தி அச்சேற்றப்பட்டன. புனேயின் மாடுலர் சிஸ்டம்ஸ், சென்னையில் உள்ள காட் கிராஃப், சாஃப்ட்வியூ, லாஸ்டெக், பெங்களூரில் உள்ள ஆப்பிள்சாஃப்ட் போன்ற நிறுவனங்கள் பத்திரிகைப் பணிகளுக்கான மென்பொருள்களையும் எழுத்துருக்களையும் உருவாக்கிப் பரந்த அளவில் சந்தைப்படுத்தின. பழனியப்பா பிரதர்ஸ் நிறுவனம், தனது தமிழ் நூல்களை ஆப்பிள் மெக்கின்டாஷ் கணிப்பொறிகளில் தானே உருவாக்கிய தமிழ் எழுத்துருக்களைப் பயன்படுத்தி வெளியிட்டது.
(2) விண்டோஸ் பயன்பாடுகளில் தமிழ்
1984ஆம் ஆண்டில் ஆப்பிள் நிறுவனம் வரைகலைப் பயனர் இடைமுகம் (Graphical User
Interface) கொண்ட மெக்கின்டாஷ் இயக்க முறைமையை வெளியிட்டது. அதனைத் தொடர்ந்து 1995இல் மைக்ரோசாஃப்ட் நிறுவனம் டாஸில் செயல்படும் விண்டோ ஸ் இயக்கத் தளத்தை வெளியிட்டது. 1990இல் விண்டோ ஸ் 3.0 வெளியிடப்பட்ட பிறகு அடிப்படைக் கணிப்பொறி அனுபவம் இல்லாதோரும் கணிப்பொறியை விரும்பிப் பயன்படுத்தும் நிலை ஏற்பட்டது. உலகம் முழுவதிலும் கணிப் பொறியின் பரவல் அதிகரித்தது. சாதாரண மக்களுக்கான பயன்பாடுகள் அவரவர் தாய்மொழியில் இருக்க வேண்டிய தேவை ஏற்பட்டதால், உலக மக்கள் தத்தம் தாய்மொழிக்கான எழுத்துருக்களையும் பயன்பாடுகளையும் உருவாக்கிக்கொண்டனர்.
இக்காலகட்டத்தில் தமிழ்நாட்டு, வெளிநாட்டு நிறுவனங்கள் பலவும் ஏராளமான தமிழ் எழுத்துருக்களையும் பயன்பாடுகளையும் உருவாக்கினர். வட்டார மொழி எழுத்துருக்களை உருவாக்க உலகெங்கும் truetype font என்னும் தொழில்நுட்பம் பயன்படுத்தப்பட்டது. இவற்றுள் எளிமையானவை 7-பிட் எழுத்துருக்கள். இவற்றில் 128 எழுத்துக் குறிகள் இருக்கும். அக்காலத் தமிழ் எழுத்துருக்கள் பெரும்பாலானவை இத்தகைய 7-பிட் குறியாக்கத்தைக் (encoding) கொண்டவை. இவை பெருமளவு தமிழ்த் தட்டச்சின் வடிவமைப்பை ஒத்தவை. இத்தகைய எழுத்துருக்களை உள்ளீடு செய்யத் தனிச் சிறப்பான நிரல்கள் (keyboard drivers) எதுவும் தேவையில்லை. இவற்றைக் கணிப்பொறியில் நிறுவிய பின் நேரடியாகச் சொல் செயலாக்கி (word processor), விரிதாள் (spread sheet), தரவுத்தளம் போன்ற எந்தப் பயன்பாட்டிலும் கையாள முடியும்.
அடுத்த கட்டமாக, ஐரோப்பிய மொழிகளைக் கணிப்பொறியில் பயன்படுத்துவதற்கென 8-பிட் குறியாக்க முறை (Extended ASCII) அறிமுகப்படுத்தப்பட்டது. இதில் 256 எழுத்துக் குறிகளைப் பயன் படுத்திக்கொள்ள முடியும். விண்டோ ஸ் குறியாக்க முறை 1252 இதற்கு இடம் தந்தது. தமிழ் மொழியின் உயிர், மெய், உயிர்மெய் எழுத்துகளைத் தனித்தனியே அப்படியே உருவகித்துக்கொள்ள இடம் இருந்ததால், பழைய ஆப்செட் அச்சுத் தரத்துக்கு ஈடுகட்டும் வகையில் தமிழ் எழுத்துகளைக் கணிப்பொறி வழியாகச் சிறப்பாக அச்சிட முடிந்தது. தமிழ்ப் பத்திரிகைகள், பதிப்பகங்கள் அனைத்தும் 8-பிட் ஒரு மொழிக் குறியாக்கத்தில் அமைந்த எழுத்துருக்களையே பயன்படுத்தத் தொடங்கின. ஆனாலும் இவர்கள் தங்கள் விருப்பப்படி உருவாக்கப்பட்ட எழுத்துருக்களையும் தத்தம் விருப்பப்படி அமைத்துக் கொண்டனர்; எந்தக் குறிப்பிட்ட குறியாக்க (encoding) முறையையும் பின்பற்றவில்லை. எழுத்துரு வடிவமைப்பு நிறுவனங்கள் அவர்கள் விருப்பப்படி குறியாக்கத்தை அமைத்துக்கொடுத்தன.
1985 முதல் 1995 வரையிலான பத்தாண்டுக் காலகட்டத்தில் கணிப்பொறியில் தமிழின் பயன்பாடும் தமிழில் கணிப்பொறிப் பயன்பாடுகளும் பெருமளவு அதிகரித்தபோதும், தரப்பாட்டுக்குள் (standard) அடங்காத எழுத்துருக்களும் அவற்றின் அடிப்படையிலான மென்பொருள்களும் புற்றீசல் போலப் புழக்கத்துக்கு வந்தன. தரப்படுத்தப்பட்ட குறியாக்க முறையே (standardised encoding system) இல்லாமைக்கு வணிக உள்நோக்கமும் ஒரு காரணமாக இருந்தது என்பதே உண்மை. இதனால் குழப்பத்துக்கு ஆளானவர்கள் பயனாளர்களே. ஒரு நிறுவனத்திலுள்ள கணிப்பொறியில் தயாரிக்கப்பட்ட ஒரு தமிழ் ஆவணத்தை நகலெடுத்து வேறொரு நிறுவனத்திலுள்ள கணிப்பொறியில் பதிவுசெய்து படித்தறிய முடியாது. காரணம், இரு நிறுவனங்களும் வெவ்வேறு குறியாக்க முறையில் அமைந்த எழுத்துருக்களைப் பயன்படுத்துவதுதான்.
(3) இணையத்தில் தமிழ்
இணையத்தின் வருகை, கணிப்பொறி வரலாற்றில் ஒரு முக்கியமான திருப்புமுனையாக அமைந்தது. உலகத் தமிழர் தமக்குள்ளே கருத்துகளைப் பரிமாறிக்கொள்ள மின்னஞ்சல் வழிவகுத்தது. விண்டோ ஸ், யூனிக்ஸ், மெக்கின்டாஷ் என எந்தக் கணிப்பொறியாக இருந்தாலும் இணையவழி எவ்வித இடையூறும் இன்றித் தகவல் பரிமாறிக்கொள்ள முடியும் என்ற நிலை உருவானது. மேற்கண்ட இயக்க முறைமைகளில் செயல்படக்கூடிய ஒரே மாதிரியான குறியாக்கம் கொண்ட எழுத்துருக்கள் தேவைப்பட்டன. மூன்று பணித்தளங்களிலும் செயல்படக்கூடிய தமிழ் எழுத்துருக்கள் இணையம் வழி இலவசமாக விநியோகிக்கப்பட்டன. மயிலை, இணை மதி, தமிழ்ஃபிக்ஸ் போன்றவை அவற்றுள் சில. தொண்ணூறுகளின் தொடக்கத்தில் வரைகலை அடிப்படையிலான வையவிரிவலை (WWW) இணையத்தின் அங்கமானது, 1995இல் விண்டோ ஸ் 95இன் அறிமுகம் ஆகியவை இணையத்தை ஒரு புதிய உச்சத்திற்கு உயர்த்தின. இணையத்தில் ஏராளமான தமிழ் வலையகங்கள் (websites) இடம்பெறலாயின.
தமிழ்நாட்டில் அச்சில் வெளிவந்த பல்வேறு நாளேடுகள், வார, மாத இதழ்கள் இணையத்தில் இடம்பிடித்தன. தினபூமி, தினமணி, தினத்தந்தி, தினமலர், ஆனந்த விகடன், குமுதம், கல்கி, கணையாழி ஆகியவை அவற்றுள் சில. இவை தவிர இணையத்தில் மட்டுமே வெளியிடப்பட்ட மின்னிதழ்கள் (e-zines) பலவும் தோன்றலாயின. தமிழ்சினிமா, மின்னம்பலம், ஆறாம்திணை, திண்ணை ஆகியவற்றை முன்னோடிகளாகக் கூறலாம். மின்னிதழ்கள் இணையத்தில் வெளியிடப்பட்டபோதும் அவை கணிப்பொறியின் பல்லூடகத் தொழில் நுட்பத்தின் சிறப்புக் கூறுகளைப் பயன்படுத்திக்கொள்ளவில்லை; அச்சுப் பத்திரிகைகளின் உள்ளடக்கத்தையும் முன்வைப்பு முறையையுமே பின்பற்றின. எனினும் அவை கணித் தமிழின் வளர்ச்சியை அடுத்த கட்டத்துக்கு எடுத்துச்சென்றன என்பதை மறுப்பதற்கில்லை.
இவ்வாறாக இணையத்தில் தமிழின் பரவல் குறிப்பிட்டுச் சொல்லும்படி இருந்தபோதும், இணையப் பயனாளர்களின் அனுபவமோ அவலம் மிக்கதாகவே இருந்தது. தமிழ் வலையகம் ஒவ்வொன்றைப் பார்வையிடவும் ஒவ்வொரு தமிழ் எழுத்துருவைப் பதிவிறக்க (download) வேண்டியதாயிற்று. ஒவ்வொரு இணையப் பத்திரிகையைப் படிக்கவும் வெவ்வேறு எழுத்துருவைப் பதிவிறக்க வேண்டும். இணையத்தில் தகவலை வெளியிட்ட ஒவ்வொருவரும் தமக்கே உரிய எழுத்துருக்களைப் பயன்படுத்தினர். அந்த எழுத்துருக்கள் ஒரே குறியாக்க முறையின் அடிப் படையில் உருவாக்கப்பட்டவை அல்ல. ஆங்கில வலைப்பக்கங்களைப் பொறுத்தவரை வெவ்வேறு எழுத்துருக்களில் அமைந்திருந்தாலும் அவை ஒரே குறியாக்க முறையைப் பின்பற்றுபவை. வெவ்வேறு இயக்க முறைமைகள் என்றாலும் ஒத்த எழுத்துருக் குறியாக்க முறையைப் பின்பற்றினர்; பயனாளர்கள் தத்தம் கணிப்பொறியில் பார்வையிடத் தடையில்லை. ஆனால் இணையத்தில் பயன்படுத்தப்பட்ட தமிழ் எழுத்துருக்கள் வெவ்வேறு குறியாக்க முறையில் உருவாக்கப்பட்டவை. எனவே, ஒரு வலையகம் எந்த எழுத்துருவில் உருவாக்கப்பட்டதோ அதே எழுத்துருவில் மட்டுமே அதைப் பார்க்க முடியும்.
(4) எழுத்துரு, விசைப்பலகை தரப்படுத்துதல்
(Standardisation of font and keyboard)
மின்னஞ்சல், அஞ்சல் குழுக்கள், மின்னிதழ்கள், வலையகங்கள் வாயிலாகத் தமிழில் தகவல் பரிமாற்றம் உச்சகட்டத்தை எட்டியபோதுதான் தரப்படுத்தப்பட்ட தமிழ் எழுத்துருக் குறியாக்கத்தின் தேவை உணரப்பட்டது. உலகெங்கிலுமுள்ள தமிழ் ஆர்வலர்கள் இது குறித்துப் பரவலாக விவாதித்தனர். 1996இல் கலிஃபோர்னியாவின் பெர்க்கிலியில் பேராசியர் ஜார்ஜ் ஹார்ட் இது பற்றிய கருத்துப் பரிமாற்றத்துக்கு ஒரு கூட்டத்தை ஏற்பாடு செய்தார். அதனைத் தொடர்ந்து, கணித்தமிழ் முன்னோடிகளில் ஒருவரான நா. கோவிந்தசாமி 1997இல் சிங்கப்பூரில் இணையத்தில் தமிழ்த் தகவல் பரி மாற்றத்துக்கான முதல் சர்வதேச மாநாட்டை நடத்தினார். ‘தமிழ்நெட் 97′ என்றழைக்கப்பட்ட இந்த மாநாட்டில் உலகெங்கிலுள்ள கணித்தமிழ் ஆர்வலர்களும் அறிஞர்களும் கலந்துகொண்டு, தமிழ் எழுத்துருக் குறியாக்கத் தரப்பாடு பற்றி விவாதித்தனர். இரு மொழி 8-பிட் எழுத்துருக் குறியாக்க முறையொன்றைத் தரப்படுத்துதல் பற்றிய சில முக்கியமான முடிவுகள் இம்மாநாட்டில் மேற் கொள்ளப்பட்டன.
‘தமிழ்நெட் 97′ மாநாட்டுக்குப் பின் இணையம் வழித் தமிழ்த் தகவல் பரிமாற்றத்தில் பங்குபெற்ற தமிழ் ஆர்வலர்கள் ‘அஞ்சல் குழு’ வழியே விவாதங்களை நடத்தி ஓர் எழுத்துருக் குறியாக்கத்தை வடிவமைத்தனர். அது டிஸ்க்கி (TSCII) என்றழைக்கப்பட்டது. இதனடிப்படையில் அமைந்த தமிழ் எழுத்துருக்கள், மென்பொருள்கள் இலவசமாக வினியோகிக்கப்பட்டன. பிற குறியாக்க முறைகளிலுள்ள ஆவணங்களை டிஸ்க்கிக்கு மாற்றுவதற்கான மென் பொருள்களும் கருவிகளும் உருவாக்கப்பட்டன.
‘தமிழ்நெட் 97′ மாநாட்டுப் பரிந்துரைகளின் அடிப்படையில் தரப்படுத்தப்பட்ட ஓர் எழுத்துருக் குறியாக்க முறையை வடிவமைப்பதற்கான அடுத்தகட்ட நடவடிக்கைகளைத் தமிழ்நாடு அரசு மேற்கொண்டது. இதற்கென ஓர் உயர்மட்டக் குழு அமைக்கப்பட்டது. நடைமுறையில் இருந்த அனைத்துக் குறியாக்க முறைகளையும் அக்குழு அலசி ஆய்வு செய்தது. 1999 பிப்ரவரியில் சென்னையில் நடைபெற்ற ‘தமிழ்நெட் 99′ உலகத் தமிழ் இணைய மாநாட்டில் இக்குழுவின் பரிந்துரைகள் முன்வைக்கப்பட்டன. மாநாட்டின் இறுதியில் இரண்டு நகல்கள் குறியாக்க முறையில் வெளியிடப்பட்டன. TANSCII மற்றும் TAM தரப்படுத்தப்பட்ட விசைப்பலகை வடிவமைப்புக்கான மாதிரியமும் முன்வைக்கப்பட்டது. 8-பிட் குறியாக்க முறையில் 128-160 ஆகிய இடங்களில் தமிழ் எழுத்துகளைப் பயன்படுத்துவது தொடர்பான விவாதத்தில் இறுதி முடிவு எடுக்க முடியாததால், மாநாட்டைத் தொடர்ந்து, நூறு நாள்களுக்கு விவாதத்துக்கும் சோதனைக்கும் பிறகு இறுதித் தரப்பாடு வெளியிடப்படுமென முடிவு செய்யப்பட்டது.
‘தமிழ்நெட் 99′ மாநாட்டை ஒட்டித் தமிழ் மென்பொருள் தயாரிப்பாளர்களும் கணித்தமிழ் ஆர்வலர்களும் இணைந்து ‘கணித் தமிழ்ச் சங்கம்’ என்ற அமைப்பை உருவாக்கினர். அரசின் ஆதரவும் இச்சங்கத்துக்கு இருந்தது. ‘தமிழ் நெட் 99′ மாநாட்டில் முன்வைக்கப்பட்ட TANSCII, TAM குறியாக்க முறைகளை இச்சங்கத்தினர் ஆய்வுகளையும் சோதனைகளையும் மேற்கொண்டு அவற்றில் இருந்த குறைகளை நீக்கினர். தமிழ் விசைப் பலகை வடிவமைப்பில் இருந்த சிக்கல்களைத் தீர்த்தனர். TAB/TAM ஆகிய இருமொழி/ஒரு மொழிக் குறியாக்க முறைகள் முன்வைக்கப்பட்டன. ‘தமிழ் 99′ என்கிற விசைப்பலகை வடிவமைப்பும் பரிந்துரைக்கப்பட்டது. கணித்தமிழ்ச் சங்கத்தின் பரிந்துரைகளைத் தமிழ்நாடு அரசு ஏற்றுக்கொண்டு அரசாணை வெளியிட்டது. இனி வெளியிடப்படும் தமிழ் மென்பொருள்கள் இத்தரப் பாடுகளுக்கு உட்பட்டுள்ளனவா என்பதைப் பரி சோதித்துச் சான்றளிக்கும் பொறுப்பையும் தமிழ் நாடு அரசு கணித்தமிழ்ச் சங்கத்துக்கு வழங்கியது.
உலக அளவில் அனைத்து மொழிகளுக்கும் யூனிகோடு (Unicode) என்னும் பொதுவான ஓர் எழுத்துருக் குறியாக்க முறை உருவாக்கப்பட்டுள்ளது. இது (ஐ.எஸ்.ஓ – 10646) 32-பிட் குறியாக்க முறை. TAB, TAM, TSCII ஆகியவை 8-பிட் குறியாக்கம் என்பதை நினைவில் கொள்க. உலக மொழிகள் அனைத்துக்கும் யூனிகோடில் இடம் வழங்கப் பட்டுள்ளது. யூனிகோடில் தமிழுக்கு 128 இடங்கள் வழங்கப்பட்டுள்ளன. ஒவ்வொரு உயிர்மெய் எழுத்துக்கும் தனித்தனி இடம் கிடையாது. எண்பதுகளில் இந்திய அரசின் சி-டாக் நிறுவனம், இந்திய மொழிகளுக்கென உருவாக்கிய பொதுக் குறியாக்க முறையான இஸ்க்கியை (ISCII) அடிப்படையாகக் கொண்டே யூனிகோடில் இந்திய மொழிகளுக்கு இடங்கள் வழங்கப்பட்டுள்ளன. யூனிகோடில் தமிழ் எழுத்துகள் அகர வரிசைப்படி இடம்பெறவில்லை என்கிற குறைபாடும் சுட்டிக்காட்டப்பட்டுள்ளது. தமிழ்நாடு அரசு யூனிகோடு கூட்டமைப்பில் உறுப்பினராகத் தன்னை இணைத்துக்கொண்டுள்ளது. குறைபாடுகளைக் களைவதற்குத் தமிழ்நாடு அரசு, தமிழ் இணையப் பல்கலைக்கழகம், கணித்தமிழ்ச் சங்கம் ஆகியவை கூட்டு முயற்சிகளை மேற்கொண்டுள்ளன. ஏற்கனவே ஏராளமான தமிழ் வலைப் பக்கங்கள் யூனிகோடில் வடிவமைக்கப்பட்டு இணையத்தில் வெளியிடப்பட்டுள்ளன. விண்டோ ஸ் தமிழ் வலைப்பக்கங்கள் யூனிகோடில் வடிவமைக்கப்பட்டு இணையத்தில் வெளியிடப்பட்டுள்ளன. விண்டோ ஸ், லினக்ஸ், மெக்கின்டாஷ் இயக்க முறைமைகளின் புதிய பதிப்புகள் யூனிகோடை ஏற்கின்றன. வருங்காலத்தில் கணித்தமிழ் யூனிகோடிலேயே அமையும்.
(5) இயக்க முறைமைகளில் தமிழ்
கணித்தமிழின் முக்கியத்துவத்தை முதன்முதலாக மைக்ரோசாஃப்ட் நிறுவனமே உணர்ந்தது எனக் கூறலாம். உலகம் முழுவதும் 90%க்கும் அதிகமான கணிப்பொறிகளில் மைக்ரோசாஃப்ட்டின் விண்டோ ஸ் இயக்க முறைமையே செயல்படுகிறது. மைக்ரோசாஃப்ட் தனது விண்டோ ஸ் 2000 இயக்க முறைமையில் இந்தியையும் தமிழையும் இடம்பெறச் செய்தது. ஆவணங்களைத் தமிழில் உருவாக்கிய நிலை அடுத்த பரிமாணத்தை எட்டியது. ஆவணங்களுக்குத் தமிழிலேயே பெயரிட முடியும். கோப் புறைகளின் பெயர்கள் மற்றும் கணிப்பொறியில் அனைத்து வகைத் தகவல்களையும் தமிழிலேயே கையாள முடியும். மின்னஞ்சல் மற்றும் பிற தகவல் பரிமாற்றங்களையும் மிக இயல்பாகத் தமிழ் மொழியிலேயே மேற்கொள்ள விண்டோ ஸ் இடம் தந்தது. விண்டோ ஸ், எம்எஸ் ஆஃபீஸ் ஆகியவற்றைத் தமிழ் மட்டுமே அறிந்த ஒரு பயனாளர் பயன்படுத்த முடியும் என்பது கணித்தமிழ் வரலாற்றில் ஒரு குறிப்பிடத்தக்க நிகழ்வு. அடுத்து வந்த விண்டோ ஸ் எக்ஸ்பியில் பதினொரு இந்திய மொழிகள் இடம்பெற்றன.
விண்டோ ஸைத் தொடர்ந்து லினக்ஸிலும் தமிழ் இடம்பெறத் தொடங்கியது. விண்டோ ஸைப் போலன்றி, லினக்ஸ் இயக்க முறைமையை எவர் வேண்டுமானாலும் தம் விருப்பப்படி மாற்றியமைத்துப் புதிய பெயரில் வெளியிட முடியும். அவ்வாறு வெளியிடப்பட்டுள்ள பல்வேறு லினக்ஸ் பதிப்புகளில் தமிழ் உள்ளிணைக்கப்பட்டுள்ளது. கணித்தமிழ் வரலாற்றில் இது ஒரு முக்கிய மைல்கல்.
(6) கலைச் சொல்லாக்கம்
கணிப்பொறியியலின் கலைச் சொற்களை உரு வாக்கியதில் பலரது பங்களிப்பு உள்ளது. கணித் தமிழ் ஆர்வலர்கள், இணையத்தில் இயங்கும் சமூகக் குழுக்கள், தமிழ் நாளிதழ்கள், வார, மாதப் பத்திரிகைகள், நூலாசிரியர்கள், அரசு மற்றும் பல்கலைக் கழகங்கள் அமைத்த கலைச் சொல்லாக்கக் குழுக்கள், சங்கங்கள் ஆகிய அனைவருமே கணித்தமிழ்க் கலைச் சொல்லாக்கத்தில் கணிசமாகப் பங்காற்றியுள்ளனர்.
எழுத்தாளர் சுஜாதா பத்திரிகைகளில் எழுதியதோடு ஆயிரம் கணிப்பொறி வார்த்தைகள் என்னும் நூலை வெளியிட்டார். அண்ணா பல்கலைக்கழகத்தின் வளர்தமிழ் மன்றம் கலைச் சொல் தொகுப்பை வெளியிட்டது. 1993-94ஆம் ஆண்டுகளில் தினமலர் நாளிதழில் கணிப் பொறிப் பாடங்கள் தமிழில் விளக்கி எழுதப்பட்டன. 1994இல் இந்தியாவிலேயே முதன்முறையாக ஒரு வட்டார மொழியில் கணிப்பொறித் தொழில் நுட்பத்துக்கெனத் தனியாக ஒரு மாத இதழ் (இப்போது மாதமிரு முறை) – தமிழ் கம்ப்யூட்டர் – தமிழில் வெளியிடப்பட்டது. அனைத்து நவீனக் கணிப் பொறித் தொழில்நுட்பங்களும் ஆங்கில இதழ்களில் எழுதப்படுவதற்கு முன்பே தமிழில் எழுதப்பட்டன. சி, சி++, சி#, நெட்ஒர்க், ஆரக்கிள், ஜாவா, விஷுவல் பேசிக், ஏஎஸ்பி, விண்டோ ஸ், லினக்ஸ், ஹெச்டிஎம்எல், ஹார்டுவேர், ஆட்டோ கேட், டேலி, டிடிபி, கிராஃபிக்ஸ், அனிமேஷன் ஆகிய அனைத்துமே தமிழில் எழுதப்பட்டன. தமிழ் இணையம், கம்ப்யூட்டர் உலகம், கம்ப்யூட்டர் நேரம், கணிமொழி போன்ற இதழ்களும் வெளியாயின. இவற்றில் கலைச் சொல்லாக்கப் பகுதிகளும் இடம்பெற்றன. மனோரமா இயர்புக்கில் 1995 முதல் ஆண்டுதோறும் வெளியிடப்படும் நவீனத் தகவல் தொழில்நுட்பங்கள் தொடர்பான கட்டுரைகளையும் இங்குக் குறிப்பிட்டுக் கூற வேண்டும்.
‘தமிழ்நெட் 99′ மாநாட்டைத் தொடர்ந்து, எம்எஸ் ஆஃபீஸ் தொகுப்பிலுள்ள சில நூறு சொற்களைத் தமிழ்ப்படுத்த சுஜாதா தலைமையில் ஒரு குழு அமைக்கப்பட்டது. பலத்த விவாதங்களுக்குப் பின் ஒருமனதான பட்டியல் பத்திரிகைகளில் வெளியிடப்பட்டது. மணவை முஸ்தபா முதல் கலைச் சொல் தொகுப்பை 1999இல் என்னுடைய மேற்பார்வையில் வெளியிட்டார். இரண்டாம் பதிப்பு எனது முழுமையான பங்களிப்பில் 2001இல் வெளியிடப்பட்டது. இலங்கை அரசின் அரசக் கரும மொழிகள் ஆணைக்குழு 2000இல் கலைச் சொல் அகர முதலியை வெளியிட்டது.
2001இல் முனைவர் மு. ஆனந்த கிருஷ்ணன் தலைமையில் தகவல் தொழில்நுட்பக் கலைச் சொல்லாக்கக் குழுவைத் தமிழ்நாடு அரசு அமைத்தது. எட்டாயிரம் கலைச் சொற்கள் கொண்ட தொகுப்பு 2001 ஏப்ரலில் அரசிடம் வழங்கப்பட்டது. இப்பணியில் குழுவின் உறுப்பினரான என் னுடைய பங்களிப்பு கணிசமானது. இக்கலைச்சொல் தொகுப்பு தமிழ் இணையப் பல்கலைக்கழக வலையகத்தில் உள்ளது. தமிழ் இணைய மாநாடுகளில் கலைச் சொல்லாக்கத்துக்கெனத் தனிப்பட்ட முயற்சிகள் மேற்கொள்ளப்பட்டன. இதற்கென அமைக்கப்பட்ட பணிக் குழுவில் நானும் உறுப்பினராக இருந்துள்ளேன். மூவாயிரத்துக்கும் மேற்பட்ட கலைச்சொற்களின் தொகுப்பு தமிழ் இணையம் சார்பாக வெளியிடப்பட்டது.
மைக்ரோசாஃப்ட் நிறுவனம் தன்னுடைய விண்டோ ஸ் எக்ஸ்.பி., ஆஃபீஸ் எக்ஸ்.பி. ஆகியவற்றுக்காக Community Glossary என்ற பெயரில் கலைச் சொற்களைப் பொதுமக்களிடமிருந்து பெற்றுச் சிறந்தவற்றைத் தேர்ந்தெடுத்துப் பயன்படுத்திக்கொண்டது.
ஏராளமான கணிப்பொறி நூல்கள் தமிழில் வெளியிடப்பட்டுள்ளன. அவற்றுள் பெரும்பாலானவை தமிழில் எழுதப்பட்ட ஆங்கில நூல்கள் என்றே கூற வேண்டும். அவற்றுள் சில கணிப்பொறி அறிவும் தமிழறிவும் இல்லாதோர் மொழிபெயர்த்தவை. இவற்றை வெளியிட்ட பதிப்பகங்களின் நோக்கம் காற்றுள்ளபோதே காசு பார்த்துவிட வேண்டும் என்பதே. இவற்றில் பெரும் பாலான நூல்கள் கலைச் சொல்லாக்கத்துக்குக் கடுகளவும் பங்களிக்கவில்லை. இடைமுகங்களால் (interface) கணித்தமிழுக்கு ஏற்பட்ட சங்கடங்களையும் இங்குக் குறிப்பிட வேண்டும். ஏற்கெனவே பயனாளர்களிடம் செல்வாக்குப் பெற்று விளங்கும் மென்பொருள்களின் ஆங்கில இடைமுகத்தைத் தமிழில் வடிவ மைக்கும்போது மிகுந்த கவனம் தேவை.
(7) பிற மின்னணுச் சாதனங்களில் தமிழ்
கணிப்பொறியில் மட்டுமின்றி மின்னணுச் சாதனங்கள் எதிலும் இடம்பெறும் தமிழையும் கணித்தமிழாகவே கருதுவதில் தவறில்லை. அந்த வகையில் இன்றைக்கு ஏடிஎம் பொறிகளில் (ATM) தமிழைக் காண்கிறோம். பல்வேறு நிறுவனங்கள் வாடிக்கையாளர்களுக்கு அமைத்துக் கொடுத்துள்ள தொடுதிரைகளில் (touch
screens) தமிழைக் காண்கிறோம். சிம்ப்யூட்டர் எனப்படும் கையடக்கக் கணிப்பொறியில் தமிழ் உண்டு. எல்ஜி நிறுவனம் முதன்முதலாக செல்பேசிகளில் தமிழைப் புகுத்தியது. நோக்கியா நிறுவனமும் தனது செல்பேசிகளில் தமிழை இடம்பெறச் செய்துள்ளது. செல்பேசி மெனுக்கள் தமிழிலேயே இருக்கும். தமிழிலேயே குறுஞ்செய்தி (SMS) அனுப்பலாம். செல்பேசி/பி.டி.ஏ. கையகக் கணிப்பொறிகளில் செயல்படும் விண்டோ ஸ் சிஇ/எக்ஸ்.பி., மொபைல் மற்றும் அவற்றில் இயங்கும் வேர்டு/எக்சல் ஆகியவையும் கணித்தமிழ் பேசும் நாள் வெகு தொலைவில் இல்லை.
(8) கணித்தமிழ் ஆய்வுக் களங்கள்
‘கணித்தமிழ்’ என்பது எழுத் துருக்கள், இடைமுகங்கள், கலைச் சொற்கள், இவற்றில் மட்டுமே அடங்கிப்போய்விடவில்லை. இதன் களங்கள் பரந்துபட்டவை. கால் பதிக்க வேண்டிய துறைகள் பலப் பல. கண்டெடுக்க வேண்டிய தொழில்நுட்பங்கள் ஏராளம். இவை ஒவ்வொன்றாய்ச் சாத்தியப்பட்டுவருகின்றன. கணித்தமிழின் ஆய்வுக் களங்கள் சிலவற்றைப் பார்ப்போம்.
(i) சொல் / இலக்கணப் பிழை திருத்தம் (Spell check / grammar check)
எம்.எஸ். வேர்டில் ஓர் ஆவணத்தில் ஆங்கில உரையை உள்ளீடு செய்யும்போதே சொற்பிழை, இலக்கணப் பிழைகளைச் சுட்டிக்காட்டும்; பிழை திருத்தத்துக்கான வழிமுறைகளைக் கூறும். ‘பொன் மொழி’ போன்ற பல சொல் செயலாக்கிகளில் இன்றைக்குச் சொற்பிழை திருத்த மென்பொருள் கருவிகள் உள்ளிணைக்கப்பட்டுள்ளன. இதை இலக்கணப் பிழை திருத்தத்துக்கு நீட்டிப்பதற்கான ஆய்வுகளும் நடைபெற்றுவருகின்றன.
(ii) சொல் பிரித்தல் (Hyphenation)
‘பேஜ்மேக்கர்’ போன்ற டிடிபி மென்பொருள்களில் நூல்களைப் பதிப்பிடும்போது, பக்க வடிவமைப்பு (page layout) மேற்கொள்ளும்போது, வலப்பக்க ஓரங்களில் சொற்களைப் பிரிக்க வேண்டிய கட்டாயம் நேரும். நாமாக வலிந்து பிரித்தால், வடிவமைப்பு மாறும்போது சொல்லின் இடையில் இடவெளிகள் (spaces) உருவாகும். இதனைத் தவிர்ப்பதற்கான செயல்நுட்பமே ‘ஹைஃபனேஷன்’ எனப்படுவது. டிடிபி மென்பொருள்களில் ஆங்கில மொழிக்கு இவ்வசதி முன்னியல்பாக அமைந்துள்ளது. தமிழ் மொழிக்கு ஹைஃபனேஷன் கருவிகள் உருவாக்கப்பட்டுள்ளன.
(iii) வரிசையாக்கமும் தேடலும் (Sorting and searching)
தரவுத் தளங்களில் (databases) தேடல் விரைவு படுத்தப்பட வேண்டுமெனில் தரவுகள் (data)அகர வரிசையில் வரிசையாக்கப்பட (sorting) வேண்டும். எழுத்துருக் குறியாக்க முறைகள் வரிசையாக்கத்துக்கு ஒத்துழைக்க வேண்டும். யூனிகோடு குறியாக்க முறையிலேயே தமிழ் எழுத்துகள் அகர வரிசைப்படி அமைக்கப்படவில்லை. எனவே வரிசையாக்கத்துக்கான சிறந்த தீர்வு நெறிகள் (sorting algorithms) கண்டறியப்பட வேண்டும்.
தமிழ் வலைப்பக்கங்களில் தகவலைத் தேடிப் பெறுவதற்கான சிறந்த தீர்வு நெறிகள் உருவாக்கப்பட வேண்டும். சொற்களின் பொருளையும் அடிப்படையாகக் கொண்டு தேடும் தேடுபொறிகள் உருவாக்கப்பட வேண்டும். ‘மலர்கள்’ எனத் தேடும்போது ‘பூக்கள்’ இடம்பெற்ற ஆவணங்களும் தேடுபொறியில் சிக்க வேண்டும்.
(iv) ஓசிஆர் (OCR – Optical Character Recognition)
அச்சிட்ட ஓர் ஆவணத்தை பிட்மேப் ஃபைலாக ஸ்கேன் செய்து அதனைக் கணிப்பொறித் தகவலாக (digital information) மாற்றியமைக்கும் செயல்நுட்பமே ஓசிஆர் எனப்படுவது. ஆங்கிலத்துக்கென ஓசிஆர் மென்பொருள் கருவிகள் ஏராளமாக உள்ளன. அவை தமிழுக்கு வேண்டாமா? ஓசிஆர் மூலம் கணிப்பொறித் தகவலாய் மாற்றிச் சேமித்து வைத்துக்கொண்டால் அதில் எந்தத் தகவல் குறிப்பையும் தேடிப் பெற முடியும். தொகுத்து வெளியிட முடியும். தமிழ்நாடு அரசின் நிதி உதவியுடன் ‘பொன்விழி’ என்னும் தமிழ் ஓசிஆர் உருவாக்கப்பட்டு விற்பனையில் உள்ளது.
(v) கையெழுத்து அறிதல் (Handwriting recognition)
ஓசிஆரின் அடுத்த கட்டம் இது. அச்சிட்ட ஆவணம் மட்டுமின்றிக் கையெழுத்து ஆவணங்களையும் கணிப்பொறித் தகவலாய் மாற்றும் கருவி தமிழுக்கு வேண்டும். டேப்லட் பி.சி. (tablet PC) எனப்படும் அடக்க அளவுக் கணிப்பொறிகளில் திரையில் மின்பேனாவில் ஆங்கிலத்தில் கணிப் பொறி ஆவணமாகச் சேமிக்க முடியும். கணிப் பொறிக்கான கட்டளைகளைக் கையால் எழுதி உணர்த்த முடியும். அதே போன்று தமிழுக்கும் கையெழுத்து ஆவணங்களைக் கணிப்பொறி ஆவணமாக்கும் ஆய்வுகள் முழுமூச்சில் நடைபெற்று வருகின்றன.
(vi) குரல் அறிதல் (Voice recognition)
கணிப்பொறி முன் அமர்ந்து டிக்டா ஃபோன் என்னும் கருவியில் பேசப் பேசக் கணிப்பொறி அதனை உரை ஆவணமாக மாற்றித் தரும். ஆங்கில மொழிக் குரலறி மென் பொருள்கள் உள்ளன. தமிழுக்கும் அது போன்ற மென்பொருள் உருவாக்கப்பட வேண்டும். அதற்கான ஆய்வுகள் நடைபெற்றுவருகின்றன.
(vii) உரையைக் குரலாக்குதல் (Text to voice)
கணிப்பொறியில் உள்ள ஓர் ஆவணத்தைத் திறக்கிறீர்கள். ஒரு பொத்தானை அழுத்தியதும் அந்த ஆவணத்தில் உள்ள விவரங்களைக் கணிப் பொறியே உங்களுக்குப் படித்துக் காட்டும். இதுவும் தமிழில் வேண்டும்.
(viii) எந்திர மொழிபெயர்ப்பு (Machine Translation)
இணையத்தில் ஒரு வலையகத்தில் ஜெர்மன் மொழியில் சில தகவல்கள் சேமித்துவைக்கப்பட்டுள்ளன. அவை உங்களுக்குத் தேவைப்படுகின்றன. இணையத்தில் அத்தகவல்களைப் பார்வையிடும்போதே (on the fly) ஆங்கிலத்தில் மொழிபெயர்த்துத் தரப்படுவதாயின் எப்படி இருக்கும்? இதற்கான மென்பொருள்கள் இப்போது பயன்பாட்டில் உள்ளன. அவை துல்லியமான மொழிபெயர்ப்பைத் தராவிட்டாலும் அத்தகவல்களை ஓரளவு புரிந்து கொள்ளும் அளவிற்கு மொழிபெயர்ப்பு இருக்கும். இதுவே ‘எந்திர மொழிபெயர்ப்பு’. ஆங்கிலம் உள் படப் பல மேனாட்டு மொழிகளுக்கான எந்திர மொழிபெயர்ப்பு மென்பொருள்கள் பயன்பாட்டில் உள்ளன. ஆங்கிலம்-தமிழ் மொழிபெயர்ப்புக்கான எந்திர மொழிபெயர்ப்பு மென்பொருள்கள் இன்னும் தொடக்க நிலையிலேயே உள்ளன.
(ix) மின்-அரசாண்மை (E-governance)
ஓர் அலுவலகத்தின் தகவல் மேலாண்மையும் தகவல் பரிமாற்றமும் தாள்கள் மூலமாக நடைபெறாமல் முற்றிலும் கணிப்பொறி வழியாகவே நடை பெறுவதற்கான மென்பொருள் பயன்பாடுகள் புழக்கத்தில் உள்ளன. அதாவது இன்றைய சூழ்நிலையில் ‘தாளில்லா அலுவலகம்’ (paperless office) சாத்தியமே. அதுபோலவே, அரசு அலுவலகங்களைக் கணிப்பொறிப் பிணையங்கள் (computer networks) மூலமாகப் பிணைத்து அனைத்து அரசு நடவடிக்கைகளையும் தகவல் பரிமாற்றங்களையும் கணிப்பொறி மூலமாக மேற்கொள்ள முடியும். அரசின் திட்டப் பணிகள் விரைவாக நிறைவேறும். அவற்றின் பலன்கள் நேரடியாக மக்களைப் போய்ச் சேரும். ஊழல் குறையும். இத்தகைய அரசாட்சியை ‘மின்-அரசாண்மை’ என்கிறோம். தமிழ்நாட்டில் மின்-அரசாண்மை நடைமுறையாக்கம் மிக மெதுவாகவே மேற்கொள்ளப்பட்டுவருகிறது.
(9) கணித்தமிழில் கல்வி
வேறெந்த அறிவியல்/தொழில் நுட்பத்தை விடவும் கணிப்பொறித் தொழில்நுட்பத்துக்கென ஏராளமான நூல்கள் வெளியிடப்பட்டுள்ளன. ஏற்கனவே கூறியபடி அவற்றுள் பல பயனற்றவை என்றபோதிலும் சிறந்த நூல்களும் வெளியிடப்பட்டுள்ளன. தமிழ்நாடு அரசுப் பள்ளிகளில் பிளஸ்-1, பிளஸ்-2 மாணவர்களுக்கான கணிப்பொறியியல் புத்தகங்கள் தமிழில் வெளியிடப்படுகின்றன. தமிழ்வழி பயிலும் மாணவர்களுக்கு ஆறாம் வகுப்பிலிருந்து கணிப்பொறி இயல் விருப்பப் பாடமாக வைக்கப்பட வேண்டும். தமிழில் சிறந்த நூல்கள் எழுதப்பட வேண்டும். பல்கலைக்கழகங்கள் கணிப்பொறி இயலில் சான்றிதழ், பட்டய, பட்டப் படிப்புகளைத் தமிழ்வழி நடத்த வேண்டும். அதற்குரிய பாடத் திட்டங்கள் வகுக்கப்பட்டு, அப்பாடத்திட்டத்திற்குத் தரமான பாடப் புத்தகங்கள் தமிழில் எழுதப்பட வேண்டும். அவற்றில் தரப்படுத்தப்பட்ட கலைச் சொற்கள் பயன்படுத்தப்பட வேண்டும். கணிப்பொறித் தொழில்நுட்பத்திலும் தமிழிலும் ஆழ்ந்த புலமை ஒருசேர அமையப் பெற்ற அறிஞர் பெருமக்களிடம் இப்பொறுப்பு ஒப்படைக்கப்பட வேண்டும். அப்போது கனவுகள் மெய்ப்படும். கணித்தமிழின் வளர்ச்சி முழுமை பெறும்.

ஆக்கம்: மு. சிவலிங்கம்
நன்றி: காலச்சுவடு

Post a Comment

0 Comments