Sunday, November 26, 2017

මිනිස් හඬ හඳුනාගැනීමේ යාන්ත්‍රණය - බේබි ටෝක් සිට ගූගල් ජීබෝර්ඩ් දක්වා


පරිගණකයේ යතුරු පුවරුව දෙස බලා ඉංග්‍රීසි බසින් අමාරුවෙන් හෝ යතුරු ලියනය කරන්නට බොහෝ අයට හැකියාව තිබුණ ද, සිංහල බසින් යතුරු ලියනය කිරීම බොහෝ දෙනෙකුට ලේසි පහසු කටයුත්තක් නොවේ. මේ නිසා මේ කාර්යය කර ගැනීම සඳහා කලින් කලට විවිධ ක්‍රම විවිධ පිරිස් විසින් හඳුන්වා දෙනු ලැබිණි. පරිගණක යතුරු පුවරුවේ ඉංග්‍රීසි අක්ෂර සමග සිංහල අක්ෂර ද මුද්‍රණය කිරීම මෙයට දුන් එක් විසඳුමක් විය. නමුත් මේ ආකාරයට යතුරු ලියනය කරන්නට පුරුදු වූ පුද්ගලයකුට හදිසියේ වෙනත් ආකාරයක යතුරු පුවරුවක් සමග වැඩකටයුතු කරන්නට සිදුවුවහොත් මහත් දුෂ්කරතාවයන්ට මුහුණ දෙන්නට සිදු විය. ඒ වාගේම උච්චාරණය වන ශබ්දයට අනුව (Phonetic) අකුරු යතුරු ලියනය කිරීමේ ක්‍රමයක් ද හඳුන්වා දෙනු ලැබිණි. නමුත් මෙයින් ඇතැම් වචන නිවැරදිව යතුරු ලියනය කරගැනීම සඳහා අමතර වෙහෙසක් දරන්නට සිදු විය. මෙවැනි ගැටලු නිසා නිවැරදිව සිංහල බසින් යතුරු ලියනය කිරීම බොහෝ විට විජේසේකර සිංහල යතුරු පුවරුව පිළිබඳ යම් පුහුණුවක්, දැනුමක් ඇති පිරිසකට පමණක් සීමා විය. බොහෝ දෙනෙකු සිය යතුරු ලියන අවශ්‍යතා එවැනි පුද්ගලයන් ලවා කරවා ගැනීමට උත්සුක වුණා මිසක සිංහල බසින් යතුරු ලියනය කරන්නට උත්සාහ ගත්තේ නැත. කෙසේ නමුත් සිංහල භාෂාවට විශේෂ සැලකිල්ලක් දක්වන ගූගල් සමාගම නිසා මෙම තත්වය කෙමෙන් වෙනස් වන්නට විය.

අන්තර්ජාලයේ පවතින් සෙසු සෙවුම් යන්ත්‍ර (Search Engines) සිංහල බසට සහයෝගයක් නොදක්වන කාලයේ දී පවා ගූගල් සමාගම සිය සෙවුම් තුල, ගූගල් සිතියම තුළ සිංහල නම් ඇතුලත් කරන්නට උත්සුක වී තිබෙනු දක්නට හැකි විය. කිසියම් පුද්ගලයකු සිය හඬින් පවසන දෑ හඳුනාගෙන, ඒවා ඒ ආකාරයෙන්ම යතුරු ලියනය කරන ක්‍රමයක් ගූගල් සමාගම ලොවට ඉදිරිපත් කරන්නේ මේ අතරවාරයේය. කෙසේ නමුත් මිනිස් හඬ හඳුනා ගැනීමේ තාක්ෂණය මුළින්ම ලොවට ඉදිරිපත් කළේ ගූගල් සමාගම නොවේ. මෙහි ඉතිහාසය 60 දශකය තරම් ඈතකට ගමන් කරයි.

මේ සඳහා මුළින්ම ලොවට ඉදිරිපත් වූ ක්‍රමය වූයේ Baby Talk ය. කෙසේ නමුත් එයට හැකි වූයේ මිනිස් හඬින් පවසන අංක හඳුනාගැනීම පමණි. යන්ත්‍රයකට මිනිස් හඬ හඳුනාගැනීම දුෂ්කර දෙයක් බවට පත් වූයේ එක් එක් පුද්ගලයාගේ උච්චාරණය එකිනෙකට වෙනස් වීමය. සෑම හඬක්ම හඳුනාගැනීමේ තාක්ෂණයක් බිහිකිරීම මේ නිසා වඩ වඩාත් දුෂ්කර කටයුත්තක් විය. පසුව 1952 දී Audrey නමින් තවත් තාක්ෂණයක් හඳුන්වා දුන් අතර එයින් ද කර ගත හැකි මිනිස් හඬ හඳුනාගැනීම සහ හඬ භාවිතයෙන් උපදෙස් ලබාදීමය. ද අංක හඳුනා ගැනීම පමණි. පසුව 1962 දී Shoebox යන්ත්‍රය හඳුන්වා දුන් අතර එයට ඉංග්‍රීසි වචන 16ක් හඳුනාගත හැකි විය.

Shoebox යන්ත්‍රය


මේ ආකාරයට විවිධ යන්ත්‍ර මගින් ද, පරිගණක තාක්ෂණය දියුණු තත්වයට පත්වීමෙන් පසු විවිධ මෘදුකාංග මගින් ද මිනිස් හඬ හඳුනාගැනීමේ උත්සාහයන් හි නොකඩවා යෙදිණි. කෙසේ නමුත් අප සාමාන්‍ය පරිදි කතා බහ කරද්දී ඇසෙන හඬ හඳුනා ගැනීමට මේ කිසිදු උපක්‍රමයකට හැකියාව තිබුණේ නැත. බොහෝ විට මේවාට හඳුනා ගත හැකි වූයේ පුහුණු කරගත් යම් උච්චාරණ රටාවන් පමණක් විය.

ස්මාර්ට් වර්ගයේ ජංගම දුරකතන ලෝකයේ ජනප්‍රිය වීමත් සමග ගූගල් සමාගම මේ කාර්යයට සම්බන්ධ වන්නට තීරණය කළේය. මිනිස් හඬ නිවැරදිව හඳුනාගැනීමේ උපක්‍රම බිහිකිරීමේ උත්සාහයන් සියල්ලටම වඩා ගූගල් සමාගම දැරූ උත්සාහය වඩාත් සාර්ථකතවයට පත් විය. එයට හේතුව වූයේ මිනිස් හඬ හඳුනාගැනීමේ වඩාත් සාර්ථකව අත්හදා බැලීම සඳහා ජංගම දුරකතන තරම් වෙනත් උපාංගයක් නොමැති වීම නිසාය. අනෙක ජංගම දුරකතනයේ ඇති කුඩා යතුරු පුවරුව වෙනුවට මිනිස් හඬින් විධාන ලබාදීමට බොහෝ දෙනෙකු තුළ පවතින කැමැත්ත ද  මෙයට තවත් හේතුවක් විය. මේ නිසා ගූගල් හඳුන්වා දුන් මිනිස් හඬ හඳුනාගැනීමේ තාක්ෂණය සීඝ්‍ර ලෙස වර්ධනය වන්නට විය. අනෙක ලොව පුරා සිටින කෝටි සංඛ්‍යාත ජංගම දුරකතන පරිශීලකයන්ගේ එකිනෙකට වෙනස් උච්චාරණ ශෛලීන් ගූගල් සේවා පරිගණකවලට ලැබීම නිසා ස්වභාවික මිනිස් හඬ වඩාත් නිවැරදිව හඳුනා ගැනීමට මෙම තාක්ෂණයට හැකියාව ලැබිණි. ගූගල් සමාගම මේ ආකාරයට මිනිස් හඬ හඳුනා ගැනීමේ තාක්ෂණය අත්හදා බලද්දී ඇපල් සමාගම ද සිරි’ (Siri) නම් යෙදුමක් සිය දුරකතනවලට ඇතුළත් කළේය. නමුත් ගූගල් සමාගම වඩාත් වේගයෙන් ඉදිරියට යන බව දැකගත හැකි විය.



ගූගල් සමාගම ඕනෑම මිනිස් හඬක් හඳුනාගැනීම සාර්ථකව අත්හදා බැලීමෙන් නොනැවතී  මිනිස් හඬින් පවසන දෑ යතුරු ලියනය කිරීමේ හැකියාව පිළිබඳව සොයා බලන්නට විය. ඒ වන විටත් මිනිස් හඬින් පවසන දෑ යතුරු ලියනය කරන යන්ත්‍ර සහ මෘදුකාංග බොහොමයක් තිබුණු අතර බටහිර රටවල මෙය වඩාත් සාර්ථකව ක්‍රියාත්මක විණි.

ගූගල් සමාගම මිනිස් හඬ හඳුනා ගැනීමේ තාක්ෂණය සඳහා ලෝකයේ භාවිත වන ප්‍රධාන පෙළේ භාෂාවන් 119ක් සිය පරිගණකවලට ඇතුළත් කළේය. සිංහල බස ද ඒ අතර විය. කෙසේ නමුත් ගූගල් සමාගමේ මේ උත්සාහයේ වඩාත්ම සිත්ගන්නා සුළු කාර්යය ලෙස සඳහන් කළ හැක්කේ අප කතා කරන සිංහල බසින් පවසන යමක් හඳුනාගෙන එය වඩාත් නිවැරදි ලෙස යතුරු ලියනය කිරීමේ යාන්ත්‍රණයක් බිහිකිරීමය. මෙතෙක් කල් සිංහල බසින් යතුරු ලියනය කිරීමේ ගැටලුවලට මුහුණ දුන් බොහෝ දෙනෙකුට මෙය අස්වැසිල්ලක් විය. මෙය ඇන්ඩ්‍රොයිඩ් වර්ගයේ ජංගම දුරකතනවල ස්ථාපනය කළ හැකි Gboard - the Google Keyboard නම් යෙදුමක් හරහා ලබාගත හැකි අතර මිනිස් හඬ හඳුනාගැනීම සඳහා අන්තර්ජාල පහසුකම අවශ්‍ය වේ. මෙය භාවිතයෙන් සිංහල බසින් පවසන ඕනෑම දෙයක් ඉතාමත් නිවැරදි ආකාරයෙන් යතුරු ලියනය කරගැනීමේ හැකියාව පවතී. මේවා යතුරු ලියනය වන්නේ සිංහල යුනිකෝඩ් අක්ෂරවලින් වන අතර මුද්‍රණ කටයුත්තක් සඳහා එය භාවිත කරන්නේ නම්ඊට ගැළපෙන අක්ෂර වර්ගයක් බවට මෙම යුනිකෝඩ් අක්ෂර පෙරළා ගත යුතු  වේ.




මෙය අක්ෂර සංයෝජන කටයුතු සඳහා තවමත් වානිජමය වශයෙන් භාවිත කරනු දක්නට නැති අතර එසේ යොදාගැනීම කෙතරම් සාර්ථක ද යන්න පිළිබඳව මෙතෙක් නිවැරදි ඇගයීමක් ද සිදුකොට නොමැත. දැනට මෙය භාවිත වන්නේ සමාජ ජාල ආදියේ කොමෙන්ටු යතුරු ලියනය සඳහා පමණක් බැව් පෙනෙන්නට තිබේ. ඉන් ඔබ්බට කිසිවෙක් මෙයින් ප්‍රයෝජනය ගන්නා බවක් පෙනෙන්නට නැත. අනෙක මෙය තවමත් පරිගණක සඳහා ස්ථාපනය කළ නොහැකි වීමත් මෙය වානිජමය වශයෙන් අක්ෂර සංයෝජන කටයුතු සඳහා යොදා ගැනීම පසුබෑමට හේතුවක් විය හැකිය. අනෙක ජංගම දුරකතනවල ඇති උසස් තත්වයෙන් යුක්ත අධි සංවේදී මයික්‍රෆෝන තරම් පරිගණකවල භාවිත වන සාමාන්‍ය මයික්‍රෆෝන ප්‍රබල නොවීම නිසා මිනිස් හඬ නිවැරදි හඳුනා ගැනීමේ ගැටලු ද ඇති විය හැකිය. කෙසේ නමුත් නුදුරු අනාගතයේ දී මිනිස් හඬින් පවසන දෑ සිංහල බසින් යතුරු ලියන කිරීමේ තාක්ෂණය වඩ වඩාත් දියුණු තත්වයට පත්වන බව නම් ඉඳුරාම පැවසිය හැකිය. 


4 comments:

  1. එම දවස එනතුරු දෑස් දල්වා බලා සිටිමු. විජේසේකර යතුරු පුවරුව දැනට ඉතා නිවැරදිව සිංහල අක්ෂර ලිවිය හැකි යතුරු පුවරුව වේ.
    විචාරක දියණිය

    ReplyDelete
    Replies
    1. එම දිනය වැඩි ඈතක නොවන බව විශ්වාසයි.

      Delete
  2. Very good post.
    Sometime in late 80s/early 90s Grundig (Radio/TV/Electronics) and Friedrich Deckel(top class machinery builder) got together and experimenting an automated metal working machine called VNC (Verbal numerical control). I was studying CNC (computer numerical control) in Melbourne at that time and we all expect VNC will be the future of CNC. The controller had to type data to create a cnc programme, but VNC only needs verbal commands. But it did not work out well.
    Nowdays we have lots of computerised telephone answering systems(in Aus), which have 50/50 or more misunderstandings with the voice recognition technology.
    Since late nineties I cant use the automated toll payments for toll roads,because it does not recognize my pronunciation. So instead of wrestle the (telephone)computer for 5 minutes and then go to a human operator, I buy it through their website.
    I know, one day we will have a voice recognition technology with very few errors, but a language like Sinhala may take lot longer than English, because they still struggling with English.

    ReplyDelete
    Replies
    1. First of all, thanx for your comment.

      Yes you are correct. But comparing with the past, this google gboard technology has come vary fast and has done lot for Sinhalese language.

      Delete

මේ ලිපිය හොඳද? ප්‍රයෝජනවත්ද? වැඩක් නැත්ද? විකාරයක් වගේ පේනවද?
ඔබට ඒ ගැන සිතෙන ඕනම අදහසක් මෙහි සටහන් කරන්න.
ඒ ගැන දෙවරක් නොසිතන්න