Innholdsfortegnelse:

Kan jeg kjøre Python på Hadoop?
Kan jeg kjøre Python på Hadoop?

Video: Kan jeg kjøre Python på Hadoop?

Video: Kan jeg kjøre Python på Hadoop?
Video: Hadoop with Python I Python Hadoop Tutorial 2024, April
Anonim

Med et valg mellom programmeringsspråk som Java, Scala og Python til Hadoop økosystem, de fleste utviklere bruker Python på grunn av støttebibliotekene for dataanalyseoppgaver. Hadoop streaming lar brukeren lage og henrette Kartlegg/reduser jobber med et hvilket som helst skript eller kjørbar fil som kartlegger eller/og redusering.

På samme måte spørs det hvordan Python kobles til Hadoop?

Koble Hadoop HDFS til Python

  1. Trinn 1: Kontroller at Hadoop HDFS fungerer som den skal. Åpne Terminal/kommandoprompt, sjekk om HDFS fungerer ved å bruke følgende kommandoer: start-dfs.sh.
  2. Trinn 2: Installer libhdfs3-biblioteket.
  3. Trinn 3: Installer hdfs3-biblioteket.
  4. Trinn 4: Sjekk om tilkoblingen med HDFS er vellykket.

På samme måte, hva er Hadoop i Python? Python er et komplett programmeringsspråk for generell bruk som kan brukes til å gjøre nesten alt i programmeringsverdenen. Hadoop er et rammeverk for store data skrevet i Java for å håndtere store datamengder. Det er mange online institutter som Hadoop med Python kurs som: Analytixlabs. Edureka.

Deretter er spørsmålet, hvordan kjører jeg et Python MapReduce-program i Hadoop?

Å skrive et Hadoop MapReduce-program i Python

  1. Motivasjon.
  2. Hva vi ønsker å gjøre.
  3. Forutsetninger.
  4. Python MapReduce-kode. Karttrinn: mapper.py. Reduser trinn: reducer.py.
  5. Kjører Python-koden på Hadoop. Last ned eksempel på inndata. Kopier lokale eksempeldata til HDFS.
  6. Forbedret Mapper og Reducer-kode: ved hjelp av Python-iteratorer og generatorer. mapper.py. redusering.py.

Hva er Hadoop Streaming jar?

Hadoop distribusjon gir et Java-verktøy kalt Hadoop Streaming . Den er pakket i en krukke fil. Med Hadoop Streaming , kan vi opprette og kjøre Map Reduce-jobber med et kjørbart skript. Hadoop Streaming er et verktøy som følger med Hadoop fordeling. Den kan brukes til å utføre programmer for big data-analyse.

Anbefalt: