Innholdsfortegnelse:

Hvordan planlegger jeg en hive-jobb i oozie?
Hvordan planlegger jeg en hive-jobb i oozie?

Video: Hvordan planlegger jeg en hive-jobb i oozie?

Video: Hvordan planlegger jeg en hive-jobb i oozie?
Video: ОТПУСТИ ЖЕЛАНИЕ ВО ВСЕЛЕННУЮ И ОНО ОБЯЗАТЕЛЬНО ИСПОЛНИТСЯ!🧚‍♂️🪄 нейрографика 🤩 2024, Kan
Anonim

Til planlegge Hive-jobben ved hjelp av Oozie , må du skrive en Hive -handling.

hql) i den.

  1. Opprett en katalog i HDFS ved å skyte under kommandoen.
  2. hadoop fs -mkdir -p /user/ oozie /arbeidsflyt/
  3. Sett arbeidsflyt. xml, Hive script (create_table. hql) og bikube -nettstedet. xml i katalogen som ble opprettet i trinn 2. Du kan bruke kommandoen nedenfor.

Bare så, hvordan kjører jeg Hive-skriptet i oozie?

Kjør Hive Jobs med Oozie

  1. Spesifiser bikubestedet. xml i jobb-xml-parameteren.
  2. Angi navnet på skriptet (for eksempel script. q) som inneholder hive-spørringen i script-parameteren.
  3. Du kan eventuelt legge til egenskaper som brukes av Oozie-oppstartsjobben. Legg til prefikset oozie. launcher til eiendomsnavnene.

Videre, hvordan kjører jeg oozie arbeidsflyt? Kjører Oozie Workflow fra kommandolinjen

  1. Logg på nettkonsoll.
  2. Kopier oozie-eksempler til hjemmekatalogen din i nettkonsollen: cp /usr/hdp/current/oozie-client/doc/oozie-examples. tjære. gz.
  3. Pakk ut filer fra tar tar -zxvf oozie-examples.tar.gz.
  4. Kopier eksempelkatalogen til HDFS hadoop fs -copyFromLocal eksempler.

I denne forbindelse, hvordan planlegger jeg en Hadoop-jobb?

hvordan planlegge jobber i hadoop - Quora. Den enkleste måten er å pakke inn koden din i et shell-skript og rute det som en cron jobb på kantnoden (noden der du vanligvis sender inn din arbeidsplasser ). Men pakker vanligvis koden i et skript og kjører det som en jobb er vanskelig å feilsøke. teste og vedlikeholde.

Hva er oozie arbeidsflyt?

Oozie er en arbeidsflyt planleggingssystem for å administrere Apache Hadoop-jobber. Oozie arbeidsflyt jobber er rettet asykliske grafer (DAGs) av handlinger. Oozie Koordinatorjobber er tilbakevendende Oozie arbeidsflyt jobber utløst av tid (frekvens) og datatilgjengelighet. Oozie er et skalerbart, pålitelig og utvidbart system.

Anbefalt: