’એ.આઈ.’ આપમૅળે ડેટા કલેક્ટ કરી શકે છે; અનેક રીતે કરી શકે છે :
એક તો, Web scraping -થી. વિવિધ વેબસાઇટો પરથી ડેટા ખૅંચી શકાય એવી પ્રક્રિયા ઊભી કરવા માટે ‘એ.આઈ.’-નો વિનિયોગ થાય છે. એ પ્રક્રિયાને ‘એ.આઈ.’ ઑટોમેટ કરી આપે, સ્વયંચાલિત; એથી એક વેબસ્ક્રૅપર સરજાય ને સ્ક્રૅપિન્ગનું કામ કરતું રહે. એ પ્રકારે ડેટા આપોઆપ મળ્યા કરે. માણસ માટે આ કામ કંટાળાભર્યું છે, સમય ખાનારું ય છે !
એક દાખલો જોડી કાઢવાની કોશિશ કરું : કોઈ એક ઍમેઝોન જેવી ઇ-કૉમર્સ વેબસાઈટ હોય, વેબસ્ક્રૅપર ત્યાંની પ્રોડક્ટનું નામ, તેની વીગતો, તેનો ભાવ તેમ જ ગ્રાહકોએ આપેલા રીવ્યૂઝ ખૅંચી લે. એ ડેટા ડેટાબેઝમાં સચવાય, એ ડેટાબેઝને સ્પ્રેડશીટ પણ કહેવાય છે. એના વપરાશથી ભાવતાલની સરખામણી કરી શકાય છે, ઑનલાઇન ગ્રાહકસેવાઓને લોકપ્રિય બનાવી શકાય છે. આપણે ઑનલાઇન ખરીદવા જઇએ છીએ ત્યારે આ બધું બનતું જ હોય છે.
‘એ.આઈ.’ Sensors-થી ડેટા એકત્ર કરી શકે છે. કૅમેરા, માઇક્રોફોન, જી.પી.ઍસ. વગેરે સૅન્સર્સ છે. એ ડેટા વડે ગતિવિધિઓ જાણી શકાય છે, વસ્તુઓની ઓળખ મેળવી શકાય છે, પર્યાવરણની સ્થિતિ-પરિસ્થિતિઓને માપી શકાય છે.
ડેટા કલેક્ટ કરવા માટેની એક પ્રક્રિયાને Image recognition કહે છે. વસ્તુઓને એમની છબિઓ – ફોટોઝ – પરથી ઓળખી લઈને અને એ રીતે ડેટા મેળવવાની પ્રક્રિયા. એ પ્રક્રિયાને ‘એ.આઈ.’ ઑટોમેટ કરી આપે, સ્વયંચાલિત, જેથી પછી આપણી આસપાસની દુનિયામાંથી ડેટા મળ્યા કરે.
એ કેવી રીતે તે સમજવા જેવું છે : એક ઇમેજ રૅકગ્નિશન મૉડેલ તૈયાર કરાય છે. પ્રાણીઓના, છોડવાઓના કે વાહનોના એમ વિવિધ વસ્તુઓના ફોટોઝ ઓળખી શકે તે માટે એને તાલીમ અપાય છે. મૉડેલ એ શીખી જાય એટલે પછી વસ્તુઓના નવા ફોટોઝને ઓળખી શકે છે અને એ રીતે પછી એને વપરાશમાં લેવાય છે.
દાખલા તરીકે, એક વનનો ફોટો લેવામાં આવે. એને ઇમેજ રૅકગ્નિશન મૉડેલ પર અપલોડ કરવામાં આવે. મૉડેલ વનનાં જુદાં જુદાં વૃક્ષોને ઓળખી બતાવે, અને એ દરેક જાતનાં વૃક્ષની સંખ્યા સાથેની યાદી રીટર્ન કરે. એટલે પછી સમયાન્તરે એ ડેટાનો વનનાં વૃક્ષપ્રકારો અને સંખ્યા જાણવા માટે કે વનની બાયોડાયવર્સિટીના અધ્યયનમાં વિનિયોગ કરી શકાય.
વિવિધ આધારસ્રોતોમાંથી ડેટા મેળવવા માટે પ્રયોજાતું એ એક સમર્થ ઑજાર છે. ટ્રાન્સપોર્ટેશનમાં અને હૅલ્થકેઅરમાં એનો વિનિયોગ ઘણો લાભદાયી પુરવાર થયો છે.
ટેસ્લા જેવી સૅલ્ફ-ડ્રાઇવિન્ગ કાર કે એવાં અન્ય વાહનો માટે આ ઇમેઝ રૅકગ્નિશનનો વિનિયોગ થાય છે. એ ફોટોઝનો ઉપયોગ કરીને એ વાહનો પોતાની આસપાસની કારોને, પદયાત્રીઓને અને ટ્રાફીક સિગ્નલ્સને ઓળખી લે છે. તે પછી એ માહિતી સલામત કારનૅવિગેશન માટે વપરાય છે.
MRI એટલે મૅગ્નેટિક રીઝોનન્સ ઇમેજિન્ગ. એ મશીન મૅડિકલ ઇમેજીસ બનાવી આપે. એ ઇમેજિસ વડે ઇમેજ રૅકગ્નિશન મૉડેલને વિવિધ પ્રકારના શારીરિક દોષ કે રોગચિહ્નો અંગે તાલીમ અપાઈ હોય છે. પછી એ માહિતી રોગનિદાન તેમ જ રોગનિવારણ માટે વપરાય છે.
વિચારો કે બ્રેઇન ટ્યુમર, કૅન્સર, હાર્ટ ડીસીઝ, લિવર ડીસીઝ, મલ્ટિપલ સ્ક્લેરોસિસ કે સ્ટ્રોક જેવી મહા ભયાનક બીમારીઓની આટલી સુવિશદ અને કાર્યકર માહિતી આ ‘એ.આઈ.’ વિના શી રીતે મળવાની હતી?
‘એ.આઈ.’ Natural language processing (NLP) વડે પણ ડેટા મેળવી શકે છે. માનવભાષાનું વિશ્લેષણ અને તેને વિશેની સમજ માટેની છે આ પ્રક્રિયા. એ પ્રક્રિયાને ‘એ.આઈ.’ ઑટોમેટ કરી આપે, સ્વયંચાલિત, જેથી ભાષિક ટૅક્સ્ટ ડૉક્યુમૅન્ટ્સમાંથી ડેટા મળતો થાય.
આ પ્રક્રિયા ગ્રાહકોએ કરેલા રીવ્યુઝમાં રહેલાં કડવાંમીઠાં સંવેદનોના વિશ્લેષણ માટે પણ પ્રયોજાય છે. પછી એ માહિતી ઉત્પાદનો અને ગ્રાહકસેવાઓની સુધારણા માટે અને સરવાળે ગ્રાહકના સંતોષ માટે વપરાતી હોય છે.
પણ આપણે સાહિત્યકારો સાહિત્યકૃતિઓ અને સાહિત્યકારોની સૃષ્ટિઓ સંદર્ભે NLP-નો સરસ વિનિયોગ કરી શકીએ.
યુનિવર્સિટી ઑફ કૅલિફોર્નિયા, બર્કલિના સંશોધકો શેક્સપીયરની સૃષ્ટિના વિશ્લેષણ માટે એનો વિનિયોગ કરી રહ્યા છે. આ ટૅક્નિકથી તેઓ શેક્સપીયરની ભાષામાં રહેલી પૅટર્ન્સ શોધી રહ્યા છે, જેમ કે, કયા શબ્દો શેક્સપીયરે વારંવાર વાપર્યા છે, કેવા કેવા પ્રકારનાં વાક્યો રચ્યાં છે, સંદર્ભ બદલાય ત્યારે શેક્સપીયર ભાષાને કેવી કેવી જુદી રીતે પ્રયોજે છે. વગેરે.
ધારો કે, પી.એચડી. પદવી માટે અધ્યયન કરવા આવેલા કોઈ વિદ્યાર્થીને હું “જનાન્તિકે”-માં સુરેશ જોષીએ પ્રયોજેલા અલંકારોની ભૂમિકાએ એમની શૈલી વિશે થીસીસ લખવા કહું, અને એ જો આ NLP-નો વિનોયોગ કરે, તો હું માનું છું કે એના શોધકાર્યનો પાયો ઘણો જ નક્કર બની આવે. એ પાયા પરથી એ આગળ ધપે અને જે વર્ગીકરણ, તારણ, વિવરણ અને મૂલ્યાંકન કરે તે શ્રદ્ધેય હોવાનો સંભવ વધી જાય. કેમ કે એ પાયો ‘એ.આઈ.’-સંલગ્ન ડેટાબેઝ હોય છે, જેમાં ભૂલ થવાની શક્યતા નહિવત્ હોય છે.
મને કલ્પના આવે છે કે ધડ-માથા વિનાના શોધનિબન્ધોના નાશની ઘડીઓ ગણાઈ રહી છે. મારી પાક્કી ધારણા છે કે નવી પેઢી ‘એ.આઈ.’-વિમુખ નહીં જ હોય.
= = =
(09/19/23 : USA)
સૌજન્ય : સુમનભાઈ શાહની ફેઇસબૂક દીવાલેથી સાદર