Gaur egun enpresen erronka handiena, egunero gero eta datu gehiago daudela da.
Enpresek erronka zail bat dute: egunero datuak haziten dira ikaragarri eta datu asko egitura gabeko informazioa da, %80 (testuak, bideoak) eta gutxienez, %50 enpresen kanpo gordetzen da, babesik gabe eta segurtasun etenak sortuz.
Data lake datu-biltegien multzo zentralizatu bat da, datu gordinak (prozesatu gabeak), bai egituratuak (datu base konbentzionalak) eta baita egituratu gabekoak, metadatuez deskribatuta. Data lake batek biltegiratze-ahalmena modu errazean eskalatu daiteke (besteak beste, Hadoop edo Apache Spark bezalako plataformak erabiliz). Data lake batek biltzen dituen datuen txostenak ezagutu, aztertu eta sor ditzake.
Datawarehouse eta Datu Marts-ekin konparatuta, data lake batek ez du datuen formatua deskribatzen (ez dago eskema erabilgarririk) erabiltzen diren arte.
Informazio-iturria: itainnova.es