ચાલો, હરારી પાસે – 22 : ડેટાસૅટ અને ગુજરાતી ભાષા

સુમન શાહ|Opinion - Opinion|17 September 2023

સુમન શાહ

‘એ.આઈ.’ સાથેની મારી વાતચીત પરથી મને ત્રણ મહત્ત્વના વિચાર આવ્યા છે, તે રજૂ કરું :

એક એ કે ‘એ.આઈ.’ દુ:ખ ભય ક્રોધ વગેરે ભાવો સમજીને જો માણસને સ્વસ્થ થવામાં મદદ કરે છે, તો સાહિત્યકૃતિઓ તો એ કામ સદીઓથી કરે છે. સાહિત્ય પણ માનવજાતના ભાવજગતને સાજું કરે છે અને શક્તિશાળી બનાવે છે.

બીજું એ કે ‘એ.આઈ.’ ભાષા પ્રયોજે છે, લાર્જ લૅન્ગ્વેજ મૉડેલ; તો સાહિત્ય પણ ભાષા જ પ્રયોજે છે, એ ભાષા પણ સર્જનાત્મક હોય છે, એને સાહિત્યિક ભાષા કહેવાય છે.

ત્રીજું મને એમ પણ થયું કે ‘એ.આઈ.’-ના એ મહાકાય ડેટાસૅટનો ખરો આધાર તો માણસે કરેલાં ભાષિક અને ભાવપરક સર્જનો છે. ‘એ.આઈ.’-ની ચોપાસ જો માણસે સરજેલી એ સમ્પદા છે, તો એ છે.

એટલે એમ ધારવાને કારણ મળે છે કે કૃત્રિમ બુદ્ધિ – ‘એ.આઈ.’- ભલે એક મહા શક્તિ છે, પણ એના મૂળમાં તો કુદરતી માનવબુદ્ધિ છે.

ટૂંકમાં, માનવબુદ્ધિએ કૃત્રિમ બુદ્ધિ સરજી પણ એનો સીધો-આડકતરો આધાર તો માનવબુદ્ધિ છે. એ અર્થમાં વિચારવર્તુળ પૂરું થાય છે.

+ +

અત્યાર સુધીની બધી જ વિચારણાઓ અને ચર્ચાઓ પછી એક વાત મને એ પકડાઈ છે કે કેન્દ્રમાં ડેટાસૅટ છે. ડેટાસૅટ ‘એ.આઈ.’-નું જાણે કે હૃદય છે. એથી જાણે કે ‘એ.આઈ.’ જીવે છે, એની સમગ્ર કાયામાં એથી જાણે કે રુધિરનું અભિસરણ થાય છે. સમજી શકાશે કે ‘જાણે કે’-થી મેં મારી એ કલ્પનાને અંકુશમાં રાખી છે અને આડકતરી રીતે વિજ્ઞાન અને ટૅક્નોલૉજિનું માન જાળવ્યું છે.

જુઓ, ‘એ.આઈ.’-ના ડેટાસૅટના આધારો મેં હમણાં કહ્યું એમ માણસે કરેલાં ભાષિક અને ભાવપરક સર્જનો છે – એટલે કે એની ચોપાસનો કશાપણ પક્ષપાત અને ભેદ રહિતનો સમસ્ત સંસાર. હવે, એ સંસારમાં સ્વચ્છતા ન હોય, અસ્વચ્છતા હોય, તો ડેટા પણ અસ્વચ્છ જ મળવાનો, અને ‘એ.આઈ.’-ને એની ખબર પણ નહીં પડવાની ! તો પછી ‘એ.આઈ.’-એ પેદા કરેલી પ્રોડક્ટ્સને શુદ્ધ અને શ્રદ્ધેય શી રીતે ગણી શકાય? નથી લાગતું કે આ પ્રશ્ન વિશે શાન્તચિત્તે વિચારવું જોઈએ?

‘એ.આઈ.’-ઑજારો બધે પ્હૉંચી વળે એ ખરું પણ નિ:શંક વાત એ છે કે એને સાંપડેલા ડેટાની ગુણવત્તા અને મર્યાદાઓ એને પ્રભાવિત કરે જ કરે. એટલે સ્વીકારવું જોઈશે કે ‘એ.આઈ.’-માં બાંધેભારે લગભગ દરેક પ્રોડક્ટને ‘ટૅક્સ્ટ’ કહેવાય છે તે દૂષિત હોઈ શકે છે.

હું આપણી ગુજરાતી ભાષા અને આપણા સાહિત્યનો જ દાખલો લઈને મારી દલીલ આગળ ચલાવું.

મુખ્ય વાત એ કે ‘એ.આઈ.’-ને ગુજરાતી ભાષા શીખવી અઘરી પડે છે. અનેક કારણો દર્શાવાયાં છે, જેમ કે —

ગુજરાતી ભાષા ‘એ.આઈ.’-ના સંદર્ભમાં ‘સંકુલ’ છે. જેમ કે —

કહે કે, ગુજરાતી ભાષાનું વ્યાકરણ highly inflected છે. એટલે? એટલે કે વાક્યોમાં નામો ક્રિયાપદો વિશેષણો કે ક્રિયાવિશેષણો પ્રયોજાય ત્યારે તેનાં રૂપ બદલાતાં હોય છે; જેમ કે, ‘છોકરો’ એકવચન છે, પણ જરૂરત મુજબ ‘છોકરાઓ’ થાય છે.

કહે કે, એમાં ત્રણ લિન્ગ છે. તેથી શું? એ કે નામો, સર્વનામો અને વિશેષણો સાથે લિન્ગ જોડાય ત્યારે એ જોડાણોને એકમેક સાથે સુસંગત રાખવાં પડે છે – agreeing.

કહે કે, એમાં cases છે, nominative, oblique, agentive-locative = નામકારક, વિભક્તિ, અને કારક. વાક્યના વિષય માટે, નામકારક; ક્રિયાપદના વસ્તુ માટે, વિભક્તિ; પરોક્ષ વસ્તુ માટે, કારક. દાખલા રૂપે, ‘ચિત્રકલા સારી કલા છે’ ‘હું ચિત્રકલા શીખું છું’ ‘હું ચિત્રકલા શીખવાડું છું’. એ ત્રણ વિનિયોગ આપણે તો બરાબર જાણીએ છીએ, પણ ‘એ.આઈ.’ માટે કઠિન છે.

કહે કે, એની ક્રિયાપદવિષયક એક વ્યવસ્થા છે, system of verb conjugations. એ પણ સંકુલ છે. મતલબ? મતલબ એ કે ક્રિયાપદોએ કાળ સૂચવવો પડે, મૂડ કે વૉઈસ પણ. Verbs must be conjugated to indicate tense, mood, aspect, and voice.

કહે કે, ગુજરાતીમાં system of honorifics પણ સંકુલ છે. honorifics એટલે, માનવાચકો. કોઈને ‘શ્રીમતી’ કોઈને ‘શ્રીમાન’ કે કોઈ અધ્યાપકના નામ આગળ ‘પ્રો.’ કે ‘ડૉ.’ લગાડીએ છીએ તે. એ માન કે આદરના ભાવનો વાતચીતમાં પણ વિનિયોગ થતો હોય છે. દાખલા તરીકે, ગુજરાતીમાં વાત કરતી વખતે સામે બેસીને સાંભળનાર અમથાભાઈનું તેમ જ વાત જેને વિશે કરતા હોઈએ તે કચરાલાલનું પણ માન જાળવીએ છીએ. આ શીખવું પણ ‘એ.આઈ.’ માટે મુશ્કેલ છે.

કહે કે, ગુજરાતીમાં ચાર ચાર પ્રકારના ટોન્સ, એટલે કે સૂર છે -high -low -rising -falling. આ સૂર પ્રયોજવાનું પણ સુગમ નથી. કહે કે શબ્દના અર્થને સૂર બદલી નાખે છે. એ જાણવું અને શીખવું પડે, પણ એ ય મુશ્કેલ છે.

કહે કે, ગુજરાતીમાં શબ્દો સન્ધિથી પણ રચાતા હોય છે. કેમ કે એમાં પણ સ્વર વ્યંજન વિસર્ગ અને અનુસ્વાર સન્ધિ એવું વૈવિધ્ય છે. એથી શીખનારની ઉચ્ચારોમાં ભૂલો થઈ શકે છે.

કહે કે, ગુજરાતીના શબ્દભંડોળમાં loanwords છે. અરબી ફારસી પોર્ચુગિઝ, અને અંગ્રેજી એમ અન્ય ભાષાના શબ્દો ઘણા છે. એટલે એ જાણવા પડે, એના અર્થ પણ સમજવા પડે.

આ તો ‘એ.આઈ.’-ને દેખાઇ એ બધી સંકુલતાઓ. પણ એમાં તત્સમ તદ્ભવ અને દેશ્ય તત્ત્વો શીખવાનું ઉમેરાય ત્યારે તો, દાખલો ઘણો અઘરો બની જવાનો !

એટલે એ સમજાય એવું છે કે ગુજરાતીનો ડેટાસૅટ રચાય કે વિસ્તરે એમાં ગુજરાતી ભાષાની ઉક્ત સંકુલ પ્રકૃતિ મોટું કારણ બની શકે છે.

પરન્તુ, એમાં મારે ભારપૂર્વક બીજું એક કારણ ઉમેરવું છે, જેને પરિણામે એ ડેટાસૅટ ખામીભર્યો અને જૂઠો પણ બનવાનો. કેવી રીતે?

આ રીતે :

ખાસ તો સામ્પ્રતમાં, મધ્યમ અને ઉપલા મધ્યમ વર્ગના ગુજરાતીઓ જે ગુજરાતી બોલે છે અને લખે છે, તે મહદંશે શુદ્ધ નથી. એટલે, એમની આસપાસની અશુદ્ધ ગુજરાતીની એમને ખબર જ નથી – ધે આર નૉટ ઍક્સ્પોઝ્ડ ટુ ધેટ લિન્ગ્વિસ્ટિક ઍનોમલીઝ.

અને એમની આસપાસ કેવી તો ભાષાપરક અસ્વચ્છતા છે, તે જુઓ :

છાપાં અને ટી.વી. માટે સમાચારો લખનારાંઓને કે બોલનારાંઓને ખબર પણ ન પડે એવી ભૂલો તેઓ અદાથી કરતાં હોય છે. એક છાપું તો ‘બાયડન’-ને બદલે ‘બાઈડન’ જ લખે છે ! આ તો થઈ મીડિયાની વાત.

પાટુડી અથવા ખાંડવી

જાતભાતની વાનગીઓ બનાવતાં શીખવનારી બહેનો અંગ્રેજી શબ્દોનો મસાલો બહુ ભભરાવે છે – રોલ કરીશું – ચણાનું બૅટર કોટ કરીશું – કલર ગોલ્ડન બ્રાઉન થવો જોઈએ – થિક ન થવું જોઈએ – હવે સર્વ કરો. વળી, આત્મવિશ્વાસ દર્શાવે છે કે – મારી આ પાટુડી (ખાંડવી) ઇન્સ્ટન્ટ અને ઇઝી છે. સબ્સ્ક્રાઇબ કરવાનું ભૂલતાં નહીં, એમ વગર ભૂલ્યે કહે છે. એમને એમાં રસ છે, ભાષામાં નહીં. એમનાં દર્શકો પણ ઘણુંખરું મધ્યમ કે ઉપલા મધ્યમ વર્ગનાં હોય છે. તેઓ પણ એવું જ બોલતાં હોય છે. વાનગીવાળી બહેનો એમની અશુદ્ધ ભાષાને દૃઢ કરી આપે છે.

એક તરફ છે, જીભના ચટકાવાળો ગુજરાતી અને એની સામે છે, ભાષાની ચિન્તામાં સૂકાઇને ભૂખડીબારસ દેખાતો ગુજરાતી !

ગુજરાતી ફિલ્મો નાટકો અને મને કહેતાં શરમ આવે છે કે કેટલુંક ગુજરાતી સાહિત્ય પણ ભાષાકીય ભ્રષ્ટતાથી રંજિત છે.

ભગવાને આપેલી બુદ્ધિવાળાં જ આમ કરે છે, તો આર્ટિફિશ્યલ ઇન્ટેલિજન્ટ તો શું ન કરે? એને તો જે જેવું મળશે તે તેવું લઈ લશે.

બે સવાલના ઉત્તર મેળવવા જોઈશે :

૧ : આવી ભ્રષ્ટ ગુજરાતીમાંથી ‘એ.આઈ.’-નો ડેટાસૅટ રચાયો હોય તો તેને ચોખ્ખો શી રીતે કરાય? ‘એ.આઈ.’ પાસે એની શી જોગવાઈ છે? Any cleansing algorithm?

૨ : ચીવટવાળા અને ઝીણવટવાળા અનેક ગુજરાતી સાહિત્યકારોનાં પુસ્તકોમાં કે તેમનાં વ્યાખ્યાનોમાં ખરેખરનો શુદ્ધ ડેટા પડ્યો છે તેની ‘એ.આઈ.’-ને આપમૅળે જાણ થાય ખરી? કે તે માટે માનવમદદની જરૂર પડે?

હવે પછીના લેખમાં ઉત્તર દર્શાવવાની કોશિશ કરીશ.

= = =

Number of visits: 9942413

ચાલો, હરારી પાસે – 22 : ડેટાસૅટ અને ગુજરાતી ભાષા

(09/16/23 : USA)

સૌજન્ય : સુમનભાઈ શાહની ફેઇસબૂક દીવાલેથી સાદર