Hva er databehandlingsmotoren bak Amazon Elastic MapReduce?
Hva er databehandlingsmotoren bak Amazon Elastic MapReduce?

Video: Hva er databehandlingsmotoren bak Amazon Elastic MapReduce?

Video: Hva er databehandlingsmotoren bak Amazon Elastic MapReduce?
Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2024, November
Anonim

Amazon EMR bruker Apache Hadoop som distribuert databehandlingsmotor . Hadoop er en åpen kildekode, Java-programvareramme som støtter data -intensive distribuerte applikasjoner som kjører på store klynger av råvare maskinvare.

Dessuten, hva er Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) er en Amazon Web Services ( AWS ) verktøy for stordatabehandling og -analyse. Amazon EMR behandler store data på tvers av en Hadoop-klynge av virtuelle servere på Amazon Elastic Compute Cloud ( EC2 ) og Amazon Enkel lagringstjeneste ( S3 ).

Videre, er Amazon EMR fullt administrert? Det er en fullt administrert datainnsjø-tjeneste som kan koble fra datalagring fra dataressurser og i stedet gjør databehandlingsklynger skalerbare, tilgjengelige for bruk på forespørsel, og inkluderer muligheten for flere klynger for å få tilgang til de samme datasettene samtidig.

Man kan også spørre, hvordan fungerer AWS EMR?

Vanligvis når du behandler data i Amazon EMR , er inngangen data lagret som filer i ditt valgte underliggende filsystem, som f.eks Amazon S3 eller HDFS. Disse dataene går fra ett trinn til det neste i behandlingssekvensen. Det siste trinnet skriver utdataene til et spesifisert sted, for eksempel en Amazon S3 bøtte.

Hva er forskjellen mellom ec2 og EMR?

I motsetning til EMR , EC2 kategoriserer ikke slavenoder i kjerne- og oppgavenoder. Dette øker risikoen for å miste HDFS-data i tilfelle en node blir fjernet/tapt. EC2 bruker Apache-biblioteker (s3a) for å få tilgang til data på s3. På den andre siden, EMR bruker AWS proprietær kode for å få raskere tilgang til s3.

Anbefalt: