ચાલો, હરારી પાસે -23 : ડેટા આપમૅળે

સુમન શાહ|Opinion - Opinion|19 September 2023

સુમન શાહ

’એ.આઈ.’ આપમૅળે ડેટા કલેક્ટ કરી શકે છે; અનેક રીતે કરી શકે છે :

એક તો, Web scraping -થી. વિવિધ વેબસાઇટો પરથી ડેટા ખૅંચી શકાય એવી પ્રક્રિયા ઊભી કરવા માટે ‘એ.આઈ.’-નો વિનિયોગ થાય છે. એ પ્રક્રિયાને ‘એ.આઈ.’ ઑટોમેટ કરી આપે, સ્વયંચાલિત; એથી એક વેબસ્ક્રૅપર સરજાય ને સ્ક્રૅપિન્ગનું કામ કરતું રહે. એ પ્રકારે ડેટા આપોઆપ મળ્યા કરે. માણસ માટે આ કામ કંટાળાભર્યું છે, સમય ખાનારું ય છે !

એક દાખલો જોડી કાઢવાની કોશિશ કરું : કોઈ એક ઍમેઝોન જેવી ઇ-કૉમર્સ વેબસાઈટ હોય, વેબસ્ક્રૅપર ત્યાંની પ્રોડક્ટનું નામ, તેની વીગતો, તેનો ભાવ તેમ જ ગ્રાહકોએ આપેલા રીવ્યૂઝ ખૅંચી લે. એ ડેટા ડેટાબેઝમાં સચવાય, એ ડેટાબેઝને સ્પ્રેડશીટ પણ કહેવાય છે. એના વપરાશથી ભાવતાલની સરખામણી કરી શકાય છે, ઑનલાઇન ગ્રાહકસેવાઓને લોકપ્રિય બનાવી શકાય છે. આપણે ઑનલાઇન ખરીદવા જઇએ છીએ ત્યારે આ બધું બનતું જ હોય છે.

‘એ.આઈ.’ Sensors-થી ડેટા એકત્ર કરી શકે છે. કૅમેરા, માઇક્રોફોન, જી.પી.ઍસ. વગેરે સૅન્સર્સ છે. એ ડેટા વડે ગતિવિધિઓ જાણી શકાય છે, વસ્તુઓની ઓળખ મેળવી શકાય છે, પર્યાવરણની સ્થિતિ-પરિસ્થિતિઓને માપી શકાય છે.

ડેટા કલેક્ટ કરવા માટેની એક પ્રક્રિયાને Image recognition કહે છે. વસ્તુઓને એમની છબિઓ – ફોટોઝ – પરથી ઓળખી લઈને અને એ રીતે ડેટા મેળવવાની પ્રક્રિયા. એ પ્રક્રિયાને ‘એ.આઈ.’ ઑટોમેટ કરી આપે, સ્વયંચાલિત, જેથી પછી આપણી આસપાસની દુનિયામાંથી ડેટા મળ્યા કરે.

એ કેવી રીતે તે સમજવા જેવું છે : એક ઇમેજ રૅકગ્નિશન મૉડેલ તૈયાર કરાય છે. પ્રાણીઓના, છોડવાઓના કે વાહનોના એમ વિવિધ વસ્તુઓના ફોટોઝ ઓળખી શકે તે માટે એને તાલીમ અપાય છે. મૉડેલ એ શીખી જાય એટલે પછી વસ્તુઓના નવા ફોટોઝને ઓળખી શકે છે અને એ રીતે પછી એને વપરાશમાં લેવાય છે.

દાખલા તરીકે, એક વનનો ફોટો લેવામાં આવે. એને ઇમેજ રૅકગ્નિશન મૉડેલ પર અપલોડ કરવામાં આવે. મૉડેલ વનનાં જુદાં જુદાં વૃક્ષોને ઓળખી બતાવે, અને એ દરેક જાતનાં વૃક્ષની સંખ્યા સાથેની યાદી રીટર્ન કરે. એટલે પછી સમયાન્તરે એ ડેટાનો વનનાં વૃક્ષપ્રકારો અને સંખ્યા જાણવા માટે કે વનની બાયોડાયવર્સિટીના અધ્યયનમાં વિનિયોગ કરી શકાય.

વિવિધ આધારસ્રોતોમાંથી ડેટા મેળવવા માટે પ્રયોજાતું એ એક સમર્થ ઑજાર છે. ટ્રાન્સપોર્ટેશનમાં અને હૅલ્થકેઅરમાં એનો વિનિયોગ ઘણો લાભદાયી પુરવાર થયો છે.

ટેસ્લા જેવી સૅલ્ફ-ડ્રાઇવિન્ગ કાર કે એવાં અન્ય વાહનો માટે આ ઇમેઝ રૅકગ્નિશનનો વિનિયોગ થાય છે. એ ફોટોઝનો ઉપયોગ કરીને એ વાહનો પોતાની આસપાસની કારોને, પદયાત્રીઓને અને ટ્રાફીક સિગ્નલ્સને ઓળખી લે છે. તે પછી એ માહિતી સલામત કારનૅવિગેશન માટે વપરાય છે.

MRI એટલે મૅગ્નેટિક રીઝોનન્સ ઇમેજિન્ગ. એ મશીન મૅડિકલ ઇમેજીસ બનાવી આપે. એ ઇમેજિસ વડે ઇમેજ રૅકગ્નિશન મૉડેલને વિવિધ પ્રકારના શારીરિક દોષ કે રોગચિહ્નો અંગે તાલીમ અપાઈ હોય છે. પછી એ માહિતી રોગનિદાન તેમ જ રોગનિવારણ માટે વપરાય છે.

વિચારો કે બ્રેઇન ટ્યુમર, કૅન્સર, હાર્ટ ડીસીઝ, લિવર ડીસીઝ, મલ્ટિપલ સ્ક્લેરોસિસ કે સ્ટ્રોક જેવી મહા ભયાનક બીમારીઓની આટલી સુવિશદ અને કાર્યકર માહિતી આ ‘એ.આઈ.’ વિના શી રીતે મળવાની હતી?

‘એ.આઈ.’ Natural language processing (NLP) વડે પણ ડેટા મેળવી શકે છે. માનવભાષાનું વિશ્લેષણ અને તેને વિશેની સમજ માટેની છે આ પ્રક્રિયા. એ પ્રક્રિયાને ‘એ.આઈ.’ ઑટોમેટ કરી આપે, સ્વયંચાલિત, જેથી ભાષિક ટૅક્સ્ટ ડૉક્યુમૅન્ટ્સમાંથી ડેટા મળતો થાય.

આ પ્રક્રિયા ગ્રાહકોએ કરેલા રીવ્યુઝમાં રહેલાં કડવાંમીઠાં સંવેદનોના વિશ્લેષણ માટે પણ પ્રયોજાય છે. પછી એ માહિતી ઉત્પાદનો અને ગ્રાહકસેવાઓની સુધારણા માટે અને સરવાળે ગ્રાહકના સંતોષ માટે વપરાતી હોય છે.

પણ આપણે સાહિત્યકારો સાહિત્યકૃતિઓ અને સાહિત્યકારોની સૃષ્ટિઓ સંદર્ભે NLP-નો સરસ વિનિયોગ કરી શકીએ.

યુનિવર્સિટી ઑફ કૅલિફોર્નિયા, બર્કલિના સંશોધકો શેક્સપીયરની સૃષ્ટિના વિશ્લેષણ માટે એનો વિનિયોગ કરી રહ્યા છે. આ ટૅક્નિકથી તેઓ શેક્સપીયરની ભાષામાં રહેલી પૅટર્ન્સ શોધી રહ્યા છે, જેમ કે, કયા શબ્દો શેક્સપીયરે વારંવાર વાપર્યા છે, કેવા કેવા પ્રકારનાં વાક્યો રચ્યાં છે, સંદર્ભ બદલાય ત્યારે શેક્સપીયર ભાષાને કેવી કેવી જુદી રીતે પ્રયોજે છે. વગેરે.

ધારો કે, પી.એચડી. પદવી માટે અધ્યયન કરવા આવેલા કોઈ વિદ્યાર્થીને હું “જનાન્તિકે”-માં સુરેશ જોષીએ પ્રયોજેલા અલંકારોની ભૂમિકાએ એમની શૈલી વિશે થીસીસ લખવા કહું, અને એ જો આ NLP-નો વિનોયોગ કરે, તો હું માનું છું કે એના શોધકાર્યનો પાયો ઘણો જ નક્કર બની આવે. એ પાયા પરથી એ આગળ ધપે અને જે વર્ગીકરણ, તારણ, વિવરણ અને મૂલ્યાંકન કરે તે શ્રદ્ધેય હોવાનો સંભવ વધી જાય. કેમ કે એ પાયો ‘એ.આઈ.’-સંલગ્ન ડેટાબેઝ હોય છે, જેમાં ભૂલ થવાની શક્યતા નહિવત્ હોય છે.

મને કલ્પના આવે છે કે ધડ-માથા વિનાના શોધનિબન્ધોના નાશની ઘડીઓ ગણાઈ રહી છે. મારી પાક્કી ધારણા છે કે નવી પેઢી ‘એ.આઈ.’-વિમુખ નહીં જ હોય.

= = =

Number of visits: 9968874

ચાલો, હરારી પાસે -23 : ડેટા આપમૅળે

(09/19/23 : USA)

સૌજન્ય : સુમનભાઈ શાહની ફેઇસબૂક દીવાલેથી સાદર