Hva er en datainnsjø i Hadoop?
Hva er en datainnsjø i Hadoop?

Video: Hva er en datainnsjø i Hadoop?

Video: Hva er en datainnsjø i Hadoop?
Video: Digitale anskaffelser – mer enn EHF 2024, November
Anonim

EN Hadoop datainnsjø er en data administrasjonsplattform bestående av en eller flere Hadoop klynger. Den brukes hovedsakelig til å behandle og lagre ikke-relasjonelle data , for eksempel loggfiler, internettklikkstrømposter, sensor data , JSON-objekter, bilder og innlegg på sosiale medier.

I denne forbindelse, hva er forskjellen mellom et datavarehus og en datainnsjø?

Datainnsjøer og data varehus er begge mye brukt til å lagre store data , men de er ikke utskiftbare termer. EN datainnsjø er en stor pool av rå data , formålet som ikke er definert ennå. EN datavarehus er et depot for strukturert, filtrert data som allerede er behandlet for et bestemt formål.

I tillegg, hva er en datainnsjø-arkitektur? EN Data Lake er et lagringssted som kan lagre store mengder strukturert, semi-strukturert og ustrukturert data . I motsetning til et hierarkisk Dataware-hus hvor data er lagret i filer og mappe, Datainnsjø har en leilighet arkitektur.

I forhold til dette, hva menes med datainnsjø?

EN datainnsjø er et lagringssted som inneholder en enorm mengde rå data i sitt opprinnelige format til det trengs. Mens en hierarkisk data lagerbutikker data i filer eller mapper, a datainnsjø bruker en flat arkitektur til å lagre data . Begrepet datainnsjø er ofte assosiert med Hadoop-orientert objektlagring.

Er Elasticsearch en datainnsjø?

EN datainnsjø er rett og slett et sted å parkere data til du trenger det, og det kan omfatte HDFS (mest vanlig), objektlagring, NAS-bokser eller noe annet. I bunn og grunn, Elasticsearch er et verktøy for indeksering data , ikke for oppbevaring av data seg selv.

Anbefalt: