એક વર્ષ પહેલાં, ભારતમાં એક નવો મંત્ર બોલતો થયો હતો, "ડેટા ઈઝ ન્યૂ ઓઈલ.' માણસે પૃથ્વીના પેટાળમાંથી તેલના ભંડારો શોધી કાઢીને જેવી રીતે પૃથ્વી પરનું જીવન ક્રાંતિકારી રીતે બદલી નાખ્યું, તેમ ૨૧મી સદીમાં ડેટાની ઉપયોગીતા જગતની અર્થવ્યવસ્થા અને ટેકનોલોજીને નવાં શિખરો પર લઇ જશે, એવી આપણને સમજ પડી હતી. ૨૦૧૭માં ‘ધ ઇકોનોમિસ્ટ’ નામની આંતરરાષ્ટ્રીય આર્થિક પત્રિકાએ એક સ્ટોરી પ્રગટ કરી હતી : ધ વર્લ્ડ્સ મોસ્ટ વેલ્યુએબલ રિસોર્સ ઈઝ નો લોંગર ઓઈલ, બટ ડેટા (દુનિયાનું સૌથી કીમતી સંશાધન ઓઈલ નહીં, પણ ડેટા છે).
ભારતમાં ઘણા બિઝનેસમેન, ઉદ્યોગપતિઓ અને સરકાર ખુદ આ મંત્રોજાપ કરતી થઇ ગઈ હતી, પરંતુ ડેટાનો અર્થ માત્ર પૈસા કમાવાનો નથી, ડેટાનો અર્થ જીવનને બહેતર બનાવાનો છે. દાખલા તરીકે, નોકરી લેવી હોય કે રોગની સારવાર કરાવવી હોય, તો તેનો સંલગ્ન ડેટા જરૂરી છે.
ડેટા એટલે શું? સરળ ભાષામાં માહિતી કે જાણકારીને ડેટા કહેવાય. એ માહિતીમાં સંખ્યા હોય, અક્ષરો હોય, શબ્દો હોય, નિરીક્ષણો હોય, પ્રમાણ હોય. આજની તારીખે ડેટા મહત્ત્વનો એટલા માટે છે કારણ કે આપણે માહિતીના વિસ્ફોટમાં જીવીએ છીએ. ટેકનોલોજીના કારણે આપણી પાસે ચારે તરફથી વિપુલ માત્રામાં માહિતીઓ આવે છે. આપણું મગજ અમુક મર્યાદામાં જ માહિતીઓને પ્રોસેસ કરવા સક્ષમ છે, એટલે જ્યારે ખૂબ બધી માહિતીઓ આવતી હોય, ત્યારે કઈ માહિતી કામની છે અને કઈ માહિતી નકામી છે, તેનો ફર્ક કરવો અનિવાર્ય હોય છે.
ડેટા સાયન્સનું કામ માહિતીઓને પ્રોસેસ કરીને આપણને કામની માહિતીઓ જુદી તારવી આપવાનું છે, જેના આધારે આપણે નિર્ણયો લઇ શકીએ. માહિતીના મૂળમાં ડેટા હોય છે. દાખલા તરીકે, 'ભારત સૌથી યુવાન દેશ છે' એ વાક્ય માહિતી છે અથવા જાણકારી છે, પરંતુ એ માહિતીનો વ્યવહારુ ઉપયોગ કરવો હોય (દાખલા તરીકે કોઈ કંપનીને નવી મોટરસાઇકલ બનાવવી હોય), તો દેશના યુવાનોનોની ઉંમર, આવક, શહેરમાં કેટલા છે, ગ્રામીણ કેટલા છે, ભણતર કેટલું છે, રોજગારી કેવી છે વગેરે અગંત ડેટા જોઈએ.
કોઈ પણ વૈજ્ઞાનિક અનુમાન કરવા માટે ડેટા સૌથી અગત્યની બાબત છે. આ વર્ષે કેટલો વરસાદ પડશે તેની સફળ આગાહી કરવાનો આધાર દાયકાઓથી કોમ્પ્યુટરમાં એકઠો થતો વરસાદની પેટર્નનો ડેટા છે. રેમડેસિવિર ઇન્જેક્શનનો કેટલો સ્ટોક રાખવો તેનો નિર્યણ મહામારીના કેસ કેટલા વધે છે તેના ડેટા પરથી નક્કી થાય. ડેટાથી બેઝલાઈન (આધાર), બેન્ચમાર્ક અને લક્ષ્ય નક્કી થાય.
આટલી વાત સમજ્યા પછી, હવે પાયાનો પ્રશ્ન. ભારતમાં ડેટા સાયન્સને ગંભીરતાથી લેવામાં આવે છે? આપણે જે રીતે મહામારી સામે લડી રહ્યા છે, તે જોતાં તો એવું લાગે છે કે આપણે લાકડાની તલવાર લઈને કોરોનાનો ખાત્મો કરવાનો પ્રયાસ કરી રહ્યા છીએ. કોરોનાની પહેલી લહેર આવી, ત્યારે જ ડેટામાં ઘાલમેલ થઈ હતી, જેથી બીજી લહેરનું અનુમાન થઈ ન શક્યું. અથવા, ડેટા હતો પણ યોગ્ય વિશ્લેષણ ન થયું અથવા વિશ્લેષણ હતું પણ તેને નજર અંદાજ કરવામાં આવ્યું. જે હોય તે ખરું, ડેટા પ્રત્યેની આપણી વૈજ્ઞાનિક ગંભીરતાના અભાવમાં પૂરી મેડિકલ સિસ્ટમ તૂટી પડી અને લોકો કમોતે મરી ગયા.
ટ્રેજેડી એ છે કે બીજી લહેરમાં પણ ટેસ્ટિંગથી લઈને કેસો અને મૃત્યુનાં આંકડાઓમાં ઘાલમેલ થઈ હતી. સરકાર હવે એવું કહે છે કે ઓક્સિજનના અભાવમાં એક પણ મોત થયું નથી, કારણ કે અમારી પાસે એવો કોઈ ડેટા નથી. ડેટા નથી એટલે મોત પણ થયું નથી, સો સિમ્પલ. આપણી પાસે કોવિડ-19ની મહામારીનો સટીક ડેટા નહીં હોય, તો મેડિકલ સમુદાય ભવિષ્ય માટે બેઝલાઈન, બેન્ચમાર્ક અને લક્ષ્યનું મોડેલ કેવી રીતે બનાવશે? અને બનાવશે તો કેવું હશે?
૩૦મી એપ્રિલે દેશના વૈજ્ઞાનિકોના એક સમૂહે સરકારને પત્ર લખીને ઈન્ડિયન કાઉન્સિલ ઓફ મેડિકલ રિસર્ચ દ્વારા એકત્ર કરાયેલા કોરોના સંબંધી ડેટા સાર્વજનિક કરવાની વિનંતી કરી હતી. તેમણે કહ્યું હતું કે કોરોના સામે લડવા માટે દેશમાં શું મેડિકલ જરૂરિયાતો છે તે નક્કી કરવા માટે ડેટા અગત્યનો છે. વૈજ્ઞાનિકોએ લખ્યું હતું કે મહામારી શરૂ થઇ ત્યારથી એકત્ર કરાયેલા આ ડેટાની સરકાર સિવાય કોઈને ખબર નથી, ત્યાં સુધી કે મહામારીનાં અનુમાનનાં મોડેલ બનાવવાનું જેમનું કામ છે તે ડિપાર્ટમેન્ટ ઓફ સાયન્સ એન્ડ ટેકનોલોજી તેમ જ નીતિ આયોગને પણ અ ડેટા મળતો નથી."
બેંગ્લોર સ્થિત પબ્લિક હેલ્થ ફાઉન્ડેશન ઓફ ઇન્ડિયામાં એપીડેમિઓલોજીના પ્રોફેસર ગિરિધર બાબુ એક ઇન્ટરવ્યૂમાં ડેટાની સરળ વ્યાખ્યા કરતાં કહે છે, “આપણે એક્શન માટે ડેટાનો ઉપયોગ કરીએ છીએ. દાખલા તરીકે, એક રાજ્ય પાસે દર દસ લાખે કેટલા કોરોના કેસ છે તેનો મજબૂત ડેટા છે અને બીજા રાજ્ય પાસે નથી, તો એના અર્થ એ થયો કે બીજું રાજ્ય તેની પ્રજાને સમયસર સારવાર આપીને મૃત્યુ રોકવા માટે એક્શન નહીં લે. સમુદાયોમાં ઘણી અસમાનતાઓ હોય છે, અને તમે જો ઈમાનદારીથી ડેટા ભેગો ન કરો, વિશ્લેષણ ન કરો અને તારણો ન કાઢો, તો તમે પ્રજાનું વધુ નુકશાન કરો છો.”
લંડનની મિડલેસેક્સ યુનિવર્સિટીમાંથી ગણિતમાં ડોક્ટરેટ કરનાર અને ત્યાં સિનિયર લેકચરર મુરાદ બાનાજી આ વાતનું સમર્થન કરતાં એ જ ઇન્ટરવ્યૂમાં કહે છે, “તમારી પાસે ગુણવત્તાવાળો ડેટા હોય, તો તમે શું થયું છે અને શું થઇ શકે છે તેનું સટીક અનુમાન કરતુ મોડેલ બનાવી શકો છો. દાખલા તરીકે, અલગ-અલગ વિસ્તારોમાં કોરોના કેટલો ફેલાયો છે તેનો જો ડેટા હોય, તો આપણે એ વિસ્તારોમાં બીજી લહેરની અસર કેવી હશે તેનું અનુમાન કરી શકીએ. આપણને જો એ ખબર હોય કે વાઇરસનો કયો વેરિયન્ટ ફેલાઈ રહ્યો છે, તો આપણે તે કેટલી તેજ ગતિએ તે ફેલાશે તેનું અનુમાન કરી શકીએ. આપણને જો એ ખબર હોય કે કેટલા લોકોનાં મૃત્યુ થયાં છે, તો આપણે તેના આધારે એ જાણી શકીએ કે તેનો ફેલાવો કેટલો વ્યાપક હતો.”
કોરોનાની બીજી લહેરે ભારતના ડેટા સિસ્ટમની પોલ ખોલી નાખી. એમાં હજારો લોકો કમોતે મર્યા, એટલું જ નહીં, જનતા તેના સ્વાસ્થ્યને લઈને નિરુત્સાહ અને નિરાશ થઇ ગઈ. એવું નથી કે દેશને ડેટા કલેક્શનનો અનુભવ નથી. ભારતનો નેશનલ સેમ્પલ સર્વે દુનિયાનો સૌથી મોટો ડેટા કલેક્શન સર્વે હતો, અને તેની તાકાતથી જ ભારત પોલીઓ, લેપ્રસી અને એચ.આઈ.વી. જેવી મહામારીઓ સામે જંગ જીતી શક્યું હતું.
છતાં, કોરોનાની મહામારીમાં આપણી આજે જે હાલત છે, તેનું એક માત્ર દેખીતું કારણ એ છે દેશમાં ઉત્તરોત્તર વૈજ્ઞાનિકો હાંસિયામાં ધકેલતા ગયા છે અને રાજકારણીઓ તેમની જગ્યાએ નિર્ણયો લેતા થઇ ગયા છે. ડેટા ન્યૂ ઓઈલ છે, પરંતુ રાજકારણીઓએ તેને દોહવા માટે તેના કલેક્શન અને વિશ્લેષણમાં રાજકારણ ઘુસાડી દીધું છે. આપણે ભલે ટેસ્ટ ઓછા કરીએ, આપણે ભલે મોતના આંકડા છુપાવીએ, આપણે ભલે રોગને નજરઅંદાજ કરીએ, દેશનાં હજારો સ્મશાનોમાં બળતી લાખો ચિતાઓ એ વાતની હતી કે ભારતે તેના સ્યુડો-સાયન્સ અને એન્ટી-ઇન્ટલેક્ચુઅલ અભિગમની કિંમત ચૂકવી છે, અને ભવિષ્યમાં પણ ચૂકવશે.
પ્રગટ : ‘બ્રેકીંગ વ્યૂઝ’ નામક લેખકની સાપ્તાહિક કોલમ, ‘સંસ્કાર’ પૂર્તિ, :સંદેશ”, 05 સપ્ટેમ્બર 2021