Government   of   lndia  Ministry   of   Finance  Department   of   Economic   Affairs  New   Delhi­110001    Dear   Honorable   Finance   Minister,    RE:   Pre­Budget   Consultation   with   M inistry   of   Finance   ­  IT   G roup    Thank   you   for   inviting   DataMeet   to   the   Pre   Budget   Consultation   with   the   IT   Group.   DataMeet   is   a  community   data   enthusiasts   from   all   over   the   India   who   c ome   together   to   discuss   data   issues,   s hare  solutions,   learn   new   s kills,   and   encourage   open   data.   W e   believe   that   a  s trong   dedication   to   open   data  can   m ake   a  huge   c ontribution   to   the   economy   in   India.   The   s uggestions   put   forth   here   represent   the  collective   opinions   of   m any   of   us   working   in   the   private   s ector   as   well   as   researchers.   W e   ask   that   for   the  2017­2018   budget   you   take   the   following   into   c onsideration.    Data   is   the   new   oil.   The   new   economy   is   based   on   the   flow   of   real­time   accurate   data   that   c an   fuel  startups,   business   s trategy,   c reate   new   m arkets,   and   higher   quality   s ervices.   Data   c an   also   be   an  incredibly   powerful   tool   for   implementing   development   s chemes   and   m onitoring   local   and   nationwide  progress.   Data   is   just   as   valuable   as   any   natural   resource   India   has,   and   it   has   to   be   viewed   as   an   asset,  in   terms   of   c ollection,   m anagement,   and   usability.   W hen   the  U   S   government   c reated   their   open   data  policy   they   opened   with   this   value:    “ Data   is   a  valuable   national   resource   and   a  s trategic   asset   to   the   U.S.   Government,   its   partners,  and   the   public.   Managing   this   data   as   an   asset   and   m aking   it   available,   discoverable,   and   usable   –  in   a  word,   open   –  not   only   s trengthens   our   democracy   and   promotes   efficiency   and   effectiveness  in   government,   but   also   has   the   potential   to   c reate   economic   opportunity   and   improve   c itizens’  quality   of   life.    For   example,   when   the   U.S.   Government   released   weather   and   GPS   data   to   the   public,   it   fueled   an  industry   that   today   is   valued   at   tens   of   billions   of   dollars   per   year.   Now,   weather   and   m apping   tools  are   ubiquitous   and   help   everyday   Americans   navigate   their   lives .  Assessments   were   m ade   regarding   the   potential   economic   impact   of   the   opening   that   data   has   been.:    Open   weather   data   s upports   an   estimated   $1.5   billion   in   applications   in   the   s econdary   insurance  market   –  but   m uch   greater   value   c omes   from   accurate   weather   predictions,   which   s ave   the   U.S.  more   than   $30   billion   annually .  The   value   of   GPS   data   has   been   estimated   at   $90   billion ,  but   that  number   c omes   from   an   industry   s tudy   and   m ay   be   too   high.    Mckinsey   reports   open   data   c an   help   c reate   $3   trillion   a  year   in   global   economy.   European   Union’s  study   on   “ Creating   Value   through   O pen   Data ”  describes   EU’s   intention   of   c reating   200,000   jobs   in  the   open   data   s ector   by   2020.        DataMeet   Trust,  ­ ­   ℅  CIS,   No.   194,   2nd   Cross,   Domlur,   2nd   Stage,   Bengaluru  –     560   071.   DataMeet.org      These   values   helped   fuel   the   m ove   for   data   to   be   m ore   c onsumable   in   order   to   reach   the   m ost   economic  actors.   For   India’s   data   to   have   this   type   of   value   a  hard   look   at   what   data   exists,   what   data   is   useful,   what  improvements   to   c ollection   and   m anagement   have   to   be   done,   and   ultimately   the   release   of   this   data   in  open   and   m achine   readable   formats   m ust   be   a  priority.   For   a  vibrant   IT   m arket   to   function   m ultiple  datasets   m ust   be   available   to   pull   from,   c urrently   private   c ompanies   are   functioning   by   c ollecting   this   data  themselves,   however,   if   the   government   m ade   them   available   the   need   for   s ilos   of   data   c ollection   would  decrease   and   a  data   c ommons   would   be   c reated   for   everyone   to   pull   from   and   c reate   m ore   options.   Policies preventing the full economic impact of Government of India Data    India   has   been   m oving   forward   in   achieving   the   aspirations   of   Digital   India   and   development   goals  set   forth.   W e   are   asking   that   the   2017/2018   budget   c ommit   to   building   a  s ustainable   data  ecosystem   to   c reate   a  s trong   and   s ustainable   data   economy   based   on   open   principles.    The   first   policy   to   s upport   is   the   National   Data   Sharing   and   Accessibility   Policy   (NDSAP)   that   the  government   approved   in   2012.   This   promotes   the   use   fo   open   data   as   defined   as   data   that   is   free  to   be   “used,   re­used,   and   redistributed   to   anyone.”This   initiative   allowed   for   the   6th   Pillar   of   Digital  India   ­  Data.Gov.in   ­­   to   be   c reated   to   jump   s tart   data   based   s tart   ups   and   transparency   initiatives  across   the   c ountry.   This   needs   to   be   extended   to   provide   s upport   for   s tate   and   c ity   initiatives.    W ith  the   increase   in   Smart   Cities   m ore   useful   and   dynamic   datasets   will   be   c reated   in   the   c oming   years  that   c an   c reate   whole   new   industries   for   people   at   every   level,   this   policy   and   its   implementation   is  the   foundation   for   that.   The   Ministry   of   Finance   c an   c reate   a  fund   for   Ministries   and   s tates   who   are  actively   fueling   the   data   economy   with   open   data   initiatives,   like   Sikkim   and   Surat,   Gujarat.    This   is   also   essential   to   c urb   c orruption   and   inefficiency.   For   example   the   Ministry   of   Finance   has  requested   access   to   PNR   data   to   avoid   fraud   by   Government   O fficials,   but   if   this   is   done  proactively   with   workflows   already   built   into   the   Ministry   of   Railways   then   the   Government   of   India  doesn’t   have   to   request   access   and   wait   for   the   data   to   be   released.    This   allows   for   dynamic   real  time   turnaround   of   data   s o   that   implementation   of   s chemes   and   policies   c an   be   m onitored   and  evaluated   in   real   time.     Initiatives   of   raw   and   real   time   data   s haring   have   already   s tarted   and   have   s een   s uccess   at  supporting   the   economy.    The  C   ustoms   Department   publishes   raw   Export   Import   Trade   data  under   Notification   No.   18/2012­Customs   (N.T)   dated:   5th   Mar,   2012.   This   portal   has   been   used   and  when   it   was   recently   down   due   to   m aintenance   it   affected   m any   businesses.    Similarly   the   Ministry  of   Railways,   while   the   data   is   not   open   (as   defined   above)   but   available   for   people   to   use   in   a  limited   fashion,   it   has   c reated   an   ecosystem   of   private   players   using   it   to   c reate   jobs   and   s ervices  based   economy.   Players   like   Ixigo,   Travelyaari,   Travel   Khaana   are   improving   s ervices   to   c itizens  apart   from   railways.   W e   are   c oncerned   that   the   intention   to   m onetize   this   data   assets   in   the  upcoming   financial   year   will   have   c onsequences   to   these   s tartups   which   c an’t   afford   to   pay   will.  We   request   the   Finance   Ministry   to   offer   other   Ministries   s upport   to   m ake   their   data   available   in   real  time   and   open   in   order   to   promote   job   and   economic   growth   under   Digital   India   and   m ake   doing  business   in   India   easier.       DataMeet   Trust,  ­ ­   ℅  CIS,   No.   194,   2nd   Cross,   Domlur,   2nd   Stage,   Bengaluru  –     560   071.   DataMeet.org      When   introducing   new   legislation,   relevant   data   s hould   be   m ade   public   as   part   of   the   s tatutory  process.   The   purpose   is   to   ensure   that   there   are   ways   to   identify   the   efficacy   of   the   legislation,   and  no   s eparate   s ystem   is   required.    This   had   been   proposed   as   part   of   the   Indian   Financial   Code  (Chap   14,   78).    Similar   disclosures   were   also   required   under   the   Public   Procurement   Bill,   2012.  Public   infrastructure   related   expenditure   by   c entral   government   s hould   have   m easurable  performance   s tandards   prescribed   and   placed   on   the   authority   website.   At   the   s ite   of   s uch  infrastructure   activity,   a  board   providing   the   link   to   the   works   s hould   be   listed.   (Like   for   MNREGA,  details   have   to   be   painted   on   the   wall,   and   lists   m ade   available   publicly).   As   well   as   all   RTI  responses   s hould   be   placed   in   the   public   domain.    This   will   also   allow   fast   turnaround   of   data  needed   to   m onitor   s cheme   implementation   to   c ourse   c orrect   quickly.     In   the   c ase   data   has   to   be   m onetized   and   c annot   be   m ade   open.   W e   s uggest   a  s ingle   point   of   s ale  for   data   throught   Data.Gov.in   instead   of   each   department   briniging   up   s eparate   portals.   This   is   to  ensure   data   c ontinuity   and   reliability   by   the   departments.      A   c omprehensive   policy   on   privacy   of   c itizen   with   regards   to   open   data   is   very   important.   Such   a  policy   c an   help   officials   open   up   the   data   without   exposing   private   individuals   information.   This   will  make   any   s ervices   c reated   with   these   datasets   m ore   s ecure.    We   are   asking   that   these   policies   be   implemented   according   to   the   guidelines   s pecified   in   NDSAP  and   by   the   Data.Gov.in   implementation   s tandards.   This   will   allow   for   m ore   c omplete   data   to   be  available   m ore   efficiently   and   accessible   to   a  wide   variety   of   actors   to   use   to   improve   governance  and   economic   opportunities.      The   Mapping   Policy   of   India   is   preventing   m apping   initiatives   taken   up   by   the   Survey   of   India   to  meet   the   growing   need   for   georeferenced   and   geographic   data.    New   IT   c ompanies   like   Zomato,  OLA,   Flipkart   and   hundreds   of   others   are   m apping   routes   and   infrastructure   in   the   absence   of  detailed   Government   m apping   data.   These   c ompanies   are   fueling   economic   growth   however   the  lack   of   s upport   from   a  policy   puts   these   types   of   s ervices   and   c ompanies   at   risk.   Updating   the  mapping   policy   to   allow   for   input   from   c rowdsourcing   or   c ompany   m apping   data,   that   is   required   to  be   reported   to   the   Survey   of   India   and   then   m ade   available   to   the   public   in   electronic   formats   would  make   the   Government   of   India   the   public   c ommon   for   all   the   m apping   information   and   allow   for  faster,   c heaper   m ore   efficient   updates   to   geospatial   information   for   all   actors   including   the  government.     Incentives   for   businesses   through   tax   breaks   or   the   CSR   protocol,   who   c ollect   public   good  datasets,   to   m ake   it   open   and   accessible   through   the   Data.Gov.In   platform.   For   instance,   Infosys  has   a  lot   of   water   use   and   weather   data   that   c ould   be   very   helpful   to   local   bodies   as   well   as   c an  contribute   to   the   Central   Ground   W ater   Board   and   India   Meteorological   Department   who   are   in  charge   of   m onitoring   and   evaluation.   These   types   of   datasets   c an   s upplement   government   data  and   c reate   better   m onitoring   and   evaluation   of   s cheme   implementation.       DataMeet   Trust,  ­ ­   ℅  CIS,   No.   194,   2nd   Cross,   Domlur,   2nd   Stage,   Bengaluru  –     560   071.   DataMeet.org      Copyright   for   data   has   to   be   open   data   license   by   default   when   s haring   to   allow   for   use   by  commercial   projects.   Copyright   Policy   m ust   be   c larified   in   order   to   m ake   s ure   data   is   being   used  rightfully   and   legally   by   parties.     Vendors   and   3rd   party   data   c ollector   agreements   m ust   s pecify   that   the   data   c ollected   on   behalf   of  the   public   or   with   public   funds   m ust   be   owned   by   the   Government   of   India   and   opened   (taking   into  account   privacy   c oncerns)   on   the   Data.Gov.in   platform.    Sustainable   Development   Goals   c alls   for   “for   increased   s upport   for   s trengthening   data   c ollection  and   c apacity   building   in   Member   States,   to   develop   national   and   global   baselines   where   they   do   not  yet   exist.   W e   c ommit   to   addressing   this   gap   in   data   c ollection   s o   as   to   better   inform   the  measurement   of   progress,   in   particular   for   those   targets   below   which   do   not   have   c lear   numerical  targets.”   in   their   declaration.   It   is   important   for   India   to   c reate   m ore   data   around   their   development  goals   and   s chemes   and   by   m aking   this   data   open,   c orruption   and   inefficiencies   c an   be   kept   low   for  instance   the   Census   highlighting   the   issues   around   Swachh   Bharat   Mission   numbers   in   2011.       Where opening data has worked    Since   2012   the   NIC   has   been   publishing   data   through   the   Data.Gov.in   platform,   also   s everal   Ministries  have   been   using   data   and   presenting   it   to   the   public   for   use   for   planning   and   implementation.     One   of   the   important   and   not   recognized   areas   where   open   data   has   worked   is   in   trade,   both  exports   and   imports   trade   data   being   open   has   c reated   s everal   s mall   s cale   data   businesses   which  are   providing   insights   to   export   traders   to   improve   business.   Some   of   these   firms   include  InfoDriveIndia ,  Trade   Intelligence ,  Cybex ,  ExIm   Pulse .     Swachh   Bharat   Mission   has   been   putting   live   data   up   for   years   and   people   have   used   the   data   to  keep   track   of   s pending   and   toilet   building,   when   the   Census   c ame   out   it   was   able   to   c ompare  numbers   and   assess   an   issue   with   implementation,   s o   that   the   s cheme   c an   be   reexamined.    Mandi   Prices   was   m ade   available   on   Data.Gov.in   and   s purred   a  s uccessful   app   that   people   use   to  buy   produce.   This   data   is   being   used   by   a  larger   population   than   the   intended   and   is   reaching   m ore  people   who   are   interested   in   agricultural   work.    A   few   Census   datasets   are   m ade   available   (though   the   full   Census   isn’t   available   publicly)   this   has  allowed   for   m any   s tartups   to   take   the   data   and   m ake   it   usable   and   available.   (I.e.   HowIndiaLives )  This   is   a  prime   example   of   building   m arkets   on   Government   datasets.    BHUVAN   is   the   premier   geospatial   data   run   by   ISRO.   There   are   a  dozen   portals   with   heaps   of  government   data   to   be   used   for   natural   disaster,   resource   m anagement,   and   local   planning.  However   because   of   the   Mapping   Policy,   high   resolution   and   s treet   level   resolution   is   not   available  which   hinders   use.    DataMeet   Trust,  ­ ­   ℅  CIS,   No.   194,   2nd   Cross,   Domlur,   2nd   Stage,   Bengaluru  –     560   071.   DataMeet.org        Sikkim   adopted   an   open   data   policy,   implemented   it   through   their   portal  S   ikkim.Data.Gov.in   as   a  way   to   improve   access   to   their   own   data,   not   just   for   economic   purposes   but   m ore   s pecifically   to  improve   the   access   to   s tate   and   local   level   information   by   government   officials.    Surat,   Gujarat   and   Pune,   Maharashtra   have   launched   local   open   data   portals   for   their   c ities   and  Smart   City   initiatives.   Local   open   data   that   is   realtime   and   c omplete   has   the   m ost   potential   for  transformation,   these   s ites   c an   be   the   foundation   for   apps,   s ervice   providers,   and   s tartups   to   the  get   the   data   they   need   to   launch   their   products   instead   of   s pending   resources   and   m oney   on   data  collection   which   is   time   c onsuming,   expensive,   and   repetitive   to   what   the   government   already   has.       Priority Datasets    GIven   our   experience   the   following   data   s ets   are   the   m ost   s ought   after   for   s tartups   and   businesses.    1. Geographic   data   that   is   granular   and   always   up   to   date   ­  districts,   villages,   towns,   c ity  wards,   locations   of   assets   (schools,   hospitals,),   infrastructure   (roads,   bridges,  settlements)  2. All   c ensus   data   from   2001,1991   in   the   s ame   open   formats   that   the   2011   data   that   has   been  published.  3. Raw   Export   Import   trade   data   m ust   be   m ade   and   kept   public   to   s upport   the   businesses  who   rely   on   it.   4. Pincodes   ­  areas   s erved   by   each   pincode   has   to   be   m apped   and   m ade   official.   Currently  Pincodes   are   being   used   for   s ervice   delivery   and   the   lack   of   c larity   is   c ausing   m ultiple  versions   of   Pincode   m aps   to   exist   without   really   knowing   what   the   area   looks   like.   5. Transport   ­  real   time,   c omplete   and   accurate   data   across   India   that   c an   c ommunicate   with  each   other   to   c reate   m ulti   m odal   s olutions.  6. Health   ­  anonymized   health   data   (to   protect   privacy)   ­  assets,   personnel,   drugs   prescribed,  diagnosis,   outbreak   reports,   deaths   with   due   c auses.    7. Water   and   s anitation   ­  what   is   the   s tatus   water   at   a  local   village   level,   s tatus   of   drinking  water   s chemes,   quality   information,   groundwater   and   s urface   water,   s anitation   s tatus   of  villages   and   urban   localities.  8. Agriculture   related   ­  live   s tatus   of   s chemes   for   irrigation,   s eeds,   fertilizers,   pesticides,cattle  9. Rural   livelihoods   ­  live   s tatus   of   s chemes   e.g.   MGNREGA   10. Resources   ­  natural   resources   and   the   s tatus   of   the   resource   and   its   c ontribution   to   the  economy  11. Weather   ­  real­time   m eteorological   readings   from   s tations   from   all   over   the   c ountry   at   a  local   level.  12. All   Bureau   of   Indian   Statistics   s tandards  13. All   budgetary   accounts   in   a  m achine   readable   format    DataMeet   Trust,  ­ ­   ℅  CIS,   No.   194,   2nd   Cross,   Domlur,   2nd   Stage,   Bengaluru  –     560   071.   DataMeet.org      14. Real­time   expenditure   data.   Geo­locating   expenditures   wherever   possible.   Assigning  census   village   and   town   c odes   (or   district   /  s ub­district   /  s tate   c odes)   to  expenditures/disbursals.  15. State   and   local   government   bodies,   all   s hould   have   all   their   decisions,   documents,  resolutions,   and   m inutes   s hould   be   available   automatically   in   s earchable   databases.  16. Doing   Business   Ranking   related   data   in   order   to   promote   those   principles   at   the   local   and  state   level.   In order to maximize the economic impact of this data:    Data   m ust   be   s tandardized,   names,   assets,   and   locations   have   to   be   given   unique   IDs   that   c an   be  mapped   from   one   dataset   to   the   other.    Machine   readable   and   open   formats   m ust   be   the   default   for   the   data   to   disseminated.  Demystified   data   c ollected   for   administrative   purposes   by   the   Government   m ust   be   explained   and  given   proper   m eta   data.    Bulk   download   of   data   m ust   be   available,   through   open   APIs,   past   and   c urrent   data   is   necessary  for   analysis   and   building   tools   of   that   work.    Not   only   will   these   m easures   bring   a  huge   economic   impact,   they   will   also   be   applauded   as   a  way   to   bring  more   accountability   and   transparency   to   the   s ystem,   as   well   as,   c reate   innovative   ways   to   include   c itizens  in   the   workings   of   Government.    Thank   you   again   for   your   time   and   attention   to   these   recommendations.   W e   hope   to   s ee   the   next   budget  as   a  first   s tep   to   really   exploring   the   huge   potential   Government   of   India   has   for   a  wider   audience.    Sincerely,    DataMeet    Represented    by    Nisha    Thompson        DataMeet   Trust,  ­ ­   ℅  CIS,   No.   194,   2nd   Cross,   Domlur,   2nd   Stage,   Bengaluru  –     560   071.   DataMeet.org