Hva er AWS MapReduce?
Hva er AWS MapReduce?

Video: Hva er AWS MapReduce?

Video: Hva er AWS MapReduce?
Video: ЧТО ЭТО!?!? | WEIRD AMAZON ITEMS | Мы - Дэвисы 2024, November
Anonim

Amazon Elastic Kart reduksjon (EMR) er en Amazon Web Services ( AWS ) verktøy for stordatabehandling og -analyse. Amazon EMR behandler store data på tvers av en Hadoop-klynge av virtuelle servere på Amazon Elastic Compute Cloud (EC2) og Amazon Simple Storage Service (S3).

Hvordan fungerer AWS EMR på denne måten?

Tjenesten starter et kundespesifisert antall Amazon EC2-forekomster, bestående av én master og flere andre noder. Amazon EMR kjører Hadoop-programvare på disse forekomstene. Masternoden deler inngangsdata inn i blokker, og distribuerer behandlingen av blokkene til de andre nodene.

Foruten ovenfor, hva er forskjellen mellom ec2 og EMR? I motsetning til EMR , EC2 kategoriserer ikke slavenoder i kjerne- og oppgavenoder. Dette øker risikoen for å miste HDFS-data i tilfelle en node blir fjernet/tapt. EC2 bruker Apache-biblioteker (s3a) for å få tilgang til data på s3. På den andre siden, EMR bruker AWS proprietær kode for å få raskere tilgang til s3.

Dessuten, er AWS EMR fullt administrert?

Amazon Elastisk kartreduser ( EMR ) er en fullt administrert Hadoop og Spark plattform fra Amazon Nettjeneste ( AWS ). Med EMR , AWS kunder kan raskt spinne opp Hadoop-klynger med flere noder for å behandle store dataarbeidsmengder.

Bruker AWS Hadoop?

Amazon Nettjenester bruker åpen kildekode Apache Hadoop distribuert datateknologi for å gjøre det lettere å få tilgang til store mengder datakraft for å kjøre dataintensive oppgaver. Hadoop , åpen kildekode-versjonen av Googles MapReduce, brukes allerede av selskaper som Yahoo og Facebook.

Anbefalt: