આજે, હરારીને આરામ આપું. કેમ કે આજે મારે આપણ સૌ માટે સીધી ઉપયોગી વાતો કરવી છે.
એક દિવસ મને પ્રશ્ન થયેલો કે આ ‘એ.આઈ.’ આટલું બધું જાણતલ અને બાહોશ છે પણ શું એને ગુજરાતી ભાષા આવડે છે ખરી, ગુજરાતી સાહિત્ય ભણ્યું છે ખરું, કે પછી રામ રામ?
મેં નિષ્ણાતોને પૂછ્યું તો કહે, ખાસ નહીં. મેં પૂછ્યું, ખાસ નહીં એટલે કેટલું નહીં? તો કહે, થોડુંક. મેં પૂછ્યું, કારણ શું? તો કહે, ‘એ.આઈ.’ પાસે ગુજરાતી ભાષા કે સાહિત્યને પૂરા પ્રમાણમાં રજૂ કરી શકે એવો કદમાં વિશાળ અને વૈવિધ્યસભર ડેટાસૅટ નથી, છે એથી કામ ચાલે છે, પણ એ પર્યાપ્ત નથી. ડેટાસૅટ પૂરોશૂરો હોય તો જ ‘એ.આઈ.’ ઝટ અને ઘણું શીખી શકે, અને તો જ આપણે માગેલાં કામ બજાવી શકે, નહિતર વાર લાગે.
બીજું એ કે ભાષા અટપટી હોય, સંકુલ, કૉમ્પલેક્સ, તો પણ વાર લાગે. ગુજરાતી ભાષા સંકુલ છે, તેનાં વ્યાકરણવિષયક કેટલાંક લક્ષણો બીજી ભાષાઓમાં જોવા ન મળે એવાં વિશિષ્ટ છે, આગવાં. એ કારણે પણ ડેટાસૅટ વિસ્તરી શક્યો નથી.
બીજાં ત્રણ કારણો પણ મને જાણવા મળ્યાં :
’એ.આઈ.’-પાવર્ડ ગુજરાતી ભાષાપરક સેવાઓ માટેની માંગ પણ આમાં નિર્ણાયક ભાગ ભજવે છે. માંગ ન હોય તો ‘એ.આઈ.’ વિકસી શકે નહીં. માંગ વધે તો ‘એ.આઈ.’-સંશોધનો અને એને તાલીમ આપનારી મૅથડ્સમાં સુધારાવધારા થાય, નાણાં રોકનારા પણ હૉંશથી આગળ આવે. પરિણામે, એની બુદ્ધિમાં વધારો થાય, એ વિકસે.
આ મને બિલકુલ સાચું લાગેલું, આપણામાંથી કેટલાને આ સેવાઓની જરૂર પડે છે? અરે, કેટલાયને કમ્પ્યૂટરની જ જરૂર નથી વરતાતી ! ‘મને એ નથી આવડતું’ એવું કાલુંકાલું બોલતા હોય છે ! આપણે ત્યાં કમ્પ્યૂટર-ઇલ્લિટ્રસી એક વધારાની અબુધતા છે. આપણા મોટિવેશન સ્પીકર્સ જીવનોપયોગી અનેક બાબતોમાં તેમ આ પરત્વે પણ પ્રેરણો પૂરાં પાડતાં હશે, એમ ધારું છું. આપણી પ્રજાને જાતભાતની બાબતો માટે સંકોરવી કે ઢંઢોળવી પડે એ એક કાયમી જરૂરિયાત છે.
બીજું, કમ્પ્યુટેશનલ રીસોર્સિસ ન હોય તો પણ વાર લાગે – એટલે કે કમ્પ્યૂટરમાં સંચિત સ્રોતો અને આધારોનો અભાવ કે તેની અછત. જેમ કે, વિવિધ જોડણીકોશો, વ્યાકરણગ્રન્થો એવા આધારો છે. મેં કહ્યું, એ તો છે અમારે ત્યાં. તો પૂછે, કમ્પ્યૂટરાઇઝ્ડ છે? ઑનલાઇન છે? હું તરત જવાબ ન આપી શક્યો. પણ મને સમજાયું કે એવું લગભગ નિરાધાર ‘એ.આઈ.’ મૉડેલ પ્ર-ગતિ ન જ કરી શકે. એને તાલીમ આપનારા આધારો – ડેટા – જ અપર્યાપ્ત હોય તો થઈ થઈને કેટલું થઈ શકે?
ત્રીજું એ કે ગુજરાતી ભાષાની વ્યાકરણગત વિશેષતાઓ પણ અડચણ બની શકે, જેમ કે આ : ગુજરાતી ભાષા ‘એ આઇ ’ બાબતમાં ‘હાઇલિ ઇન્ફૅક્ટેડ’ મનાય છે. ગુજરાતી વાક્યમાં શબ્દો એના કાર્યની – ફન્કશનની – જરૂરત મુજબ રૂપ બદલે છે. આનો આપણને રોજિન્દો અનુભવ છે. ‘છોકરો નિશાળે જાય છે’-માં ‘છોકરો’ સિન્ગ્યુલર નૉમિનેટિવ કેસમાં છે, પણ ‘છોકરાઓ નિશાળે જાય છે’-માં એ, ‘છોકરાઓ’ થઈ જાય છે – એકવચન બહુવચન થઈ જાય છે. ‘ઇન્ફ્લેક્શન’ એક મૉર્ફોલૉજિકલ ટર્મ છે – ભાષાનું રૂપતન્ત્રીય પદ. એ પણ ‘એ.આઈ.’-ની તાલીમમાં બાધા બનતું હોય છે.
અને, ’એ.આઈ.’-ને ભાષા આવડે તે પછી જ એ ટૅક્સ્ટ, અને તે પછી જ સાહિત્ય સરજી શકે. આ મુદ્દો તો મને એકદમ ગળે ઊતરી ગયેલો કેમ કે આપણા કેટલાક સાહિત્યકારપદવાંછુઓનું એમ સ્તો છે ! તો, ‘એ.આઈ.’ ગુજરાતીમાં કાવ્ય પણ લખી આપી શકે, જરૂરી એ કે એ માટે એને કેટલાક નિયમો શીખવાડાયા હોય – સૅટ ઑફ રુલ્સ. બીજા જુદા સૅટ ઑફ રુલ્સથી એ અનુવાદો પણ કરી આપી શકે, ત્રીજાથી એ ટૂંકીવાર્તા પણ લખી આપી શકે.
++
આ બધી શરતી વાતો છે તેમછતાં તાજેતરનાં વરસોમાં ‘એ.આઈ.’-ને ગુજરાતી ભાષા અને સાહિત્ય ઠીકઠીક આવડી ગયાં છે. સાંભળો :
’એ.આઈ.’-પાવર્ડ ઑજારોની મદદ અને સેવાઓ વડે ગુજરાતી ટૅક્સ્ટ લખી શકાય છે, ગુજરાતી ઉક્તિનું – સ્પીચનું – સંસૃજન થઈ શકે છે. ગુજરાતી ટૅક્સ્ટનો બીજી અનેક ભાષાઓમાં અનુવાદ થઈ શકે છે. ગુજરાતી ભાષા અને સાહિત્ય વિશે પ્રશ્નોત્તરી કરી શકાય છે. સાહિત્યના વિદ્યાર્થીઓ અને શિક્ષકો તેમ જ સંશોધકો એનો લાભ લઈ શકે છે.
એક ‘ધ ગૂગલ એ.આઈ. લૅન્ગવેજ ટીમ’ છે. એણે ગુજરાતી સ્પૅલચૅક, ગુજરાતી ગ્રામરચૅક તેમ જ ‘ગુજરાતી ટૅક્સ્ટ-ટુ-સ્પીચ ઍન્જિન’ જેવાં ‘એ.આઈ.’-પાવર્ડ ઑજારો વિકસાવ્યાં છે.
‘એ.આઈ.’-પાવર્ડ ‘ગુજરાતી સ્પીચ સિન્થેસિસ’ ગુજરાતી ઉક્તિનું સંસૃજન કરી શકે છે. એને ટૅક્સ્ટના ઑડિયો રૅકૉર્ડિન્ગ માટે પ્રયોજી શકાય છે. ‘સ્ક્રૅચ’ એક શક્તિશાળી ઑજાર છે. એથી પણ ગુજરાતી ઉક્તિનું સંસૃજન થતું હોય છે.
વળી, એ ઑજારો ઉક્તિને ટૅકસ્ટમાં તેમ જ ટૅક્સ્ટને ઉક્તિમાં બદલી આપી શકે છે. દાખલા તરીકે, ‘ઍમેઝોન પૉલિ સર્વિસ’ ગુજરાતી ઉક્તિનું ટૅક્સ્ટમાં સંસૃજન કરી શકે છે અને ‘ગૂગલ ક્લાઉડ ટૅક્સ્ટ-ટુ-સ્પીચ’ ગુજરાતી ઉક્તિનું ટૅક્સ્ટમાં સંસૃજન કરી શકે છે.
‘ગુજરાતી બાર્ડ’ એક ‘એ.આઈ.’-પાવર્ડ ઑજાર છે. એ ગુજરાતી ટૅક્સ્ટ લખી શકે છે, કાવ્યો, વાર્તાઓ કે લેખો જેવી અનેક ટૅક્સ્ટ્સનું સંસૃજન કરી શકે છે. ગૂગલ ‘એ.આઈ.’-નું ‘બાર્ડ’ મૉડેલ એવી ગુજરાતી ટૅક્સ્ટનું સંસૃજન કરે છે કે એને માણસે લખેલી ટૅક્સ્ટથી બિલકુલ જુદી પાડવાનું અશક્ય થઈ પડે.
આ ‘બાર્ડ’-ને ગુજરાતી ટૅક્સ્ટ તેમ જ પુસ્તકો, લેખો અને વેબસાઈટોના સાહિત્યથી તૈયાર કરવામાં આવેલા મહા કદના ડેટાસૅટથી તાલીમ અપાઇ છે. ‘બાર્ડ’ ૪૦ ભાષાઓમાં ૨૩૦ દેશોમાં ઉપલબ્ધ છે.
મોટું કામ અનુવાદોનું છે. ’ગૂગલ ટ્રાન્સલેટ’ વડે ગુજરાતી ટૅક્સ્ટનો ૧૦૦-થી પણ વધુ ભાષાઓમાં અનુવાદ થઈ શકે છે.
‘ગ્રામરલિ’ ‘એ.આઈ.’-પાવર્ડ ઑજાર છે. આમ તો એ અંગ્રેજી ભાષા માટે વધુ ઉપયોગી છે. પણ કોઈ ગુજરાતી લેખક કશુંક લેખન અંગ્રેજીમાં કરવા માગતો હોય, તો એ એક નૉંધપાત્ર મદદનીશ પુરવાર થશે. સારું કોઈપણ લેખન ભૂલો વિનાનું હોય છે, એમાં વ્યાકરણશુદ્ધિ, સમુચિત વિરામચિહ્નો તેમ જ શૈલી જેવી બાબતો સચવાઈ હોય છે. ‘ગ્રામરલિ’ એ અંગે મદદો કરતું હોય છે. અંગ્રેજીમાં લેખન કરનારો ગુજરાતી લેખક એ પરથી શુદ્ધ ગુજરાતી લેખન શીખી શકે. ‘પોલિરાઇટિન્ગએઇડ’ પણ સારા લેખન માટે ફીડબેક પૂરા પાડતું હોય છે, એ પરથી પણ શીખી શકાય.
‘વિકિપીડીઆ’ ‘એ.આઈ.’ ઑજાર નથી પણ ‘એ.આઈ.’-નો બહુશ: વિનિયોગ કરે છે. એથી સરવાળે તો ઍન્સાયક્લોપીડીઆ સમૃદ્ધ થઈ શકે છે. પોતાના અનેક ‘બોટ્સ’-થી એ વિકિના મૂળ લેખની જોડણી અને વ્યાકરણવિષયક ભૂલો બતાવી શકે છે, સુધારી શકે છે. તથ્યો વિશે પણ ભુલસુધાર કરે છે. ઉપરાન્ત, મૂળ લેખની સમરી આપી શકે છે. મૂળ લેખનું વિશ્લેષણ કરીને તેમાં ઉપકારક ઉમેરણ થાય એવા નવા લેખો પણ સૂચવી શકે છે.
ધ્યાનપાત્ર બાબત એ છે કે આજની તારીખ સુધીમાં વિકિ વિશ્વની ૩૨૯ ભાષાઓમાં ઉપલબ્ધ છે. પોતાના અનેક ‘બોટ્સ’-થી મૂળ વિકિ-લેખના એ સંખ્યાબંધ અનુવાદ ક્ષણમાં જ આપી શકે છે. દાખલા તરીકે, સુમન શાહ નામના લેખક વિશેનો વિકિ-લેખ ક્લિક્ વારમાં જગતની અનેક ભાષાઓમાં વાંચી શકાય, ભલે એને એની જ ભાષાના લેખકે જોયો સુદ્ધાં ન હોય !
જેમ જેમ ‘એ.આઈ.’-પરક સંશોધનોનો વિકાસ થશે તેમ તેમ આ સગવડો વધશે.
એ જાણી રાખવું જરૂરી છે કે હજી આ ઑજારો એક સુજ્ઞ અને સમજદાર ગુજરાતી માણસ જેટલાં સુજ્ઞ અને સમજદાર નથી. ભૂલો પણ કરે છે.
‘એ.આઈ.’ ઑજાર ઘણી વાર લિન્ગભેદ નથી પામી શકતું – ‘એ ગયા’-નું ‘એ ગઇ’ કરી નાખે !
એની કેટલીક મર્યાદાઓ પણ છે. એનાથી ક્યારેક તળના કે દેશ્ય શબ્દો નથી પકડાતા, જેમ કે, ‘ઢેફું’. ‘એ ઢ છે’ -નો એ શું અનુવાદ કરી શકે?
એને ‘ચાંદલો’ જેવા સંસ્કૃતિ સાથે જોડાયેલા શબ્દોની પતીજ પણ નથી પડતી, એટલે હું ધારું છું કે એ આવો તરજૂમો કરી આપશે – અ રેડ સ્પોટ ઇન ધ સૅન્ટર ઑફ ફોરહેડ. ભલે, એમાં ખોટું શું? તળના રક્ષણહારો ખુશ થાય …
= = =
(08/12/23 : USA)
સૌજન્ય : સુમનભાઈ શાહની ફેઇસબૂક દીવાલેથી સાદર