Hva er DistCp i Hadoop?
Hva er DistCp i Hadoop?

Video: Hva er DistCp i Hadoop?

Video: Hva er DistCp i Hadoop?
Video: Hva er best av iskrem og trening? 2024, November
Anonim

DistCp (distribuert kopi) er et verktøy som brukes for stor inter/intra-cluster kopiering. Det bruker Kart reduksjon for å utføre distribusjon, feilhåndtering og gjenoppretting og rapportering. Den utvider en liste over filer og kataloger til input for kartoppgaver, som hver vil kopiere en partisjon av filene som er spesifisert i kildelisten.

På samme måte kan man spørre seg om Distcp overskriver?

Jeg bør også utdype litt og forklare det distcp - overskrive vil overskrive filen uansett om størrelsen stemmer overens eller ikke. Dette vil oppdatere alle filer i hdfs-nn2 som ikke samsvarer i størrelse fra hdfs-nn1, samt slette eventuelle overflødige filer.

På samme måte, hva er Hadoop FS-kommandoen? Filsystemet ( FS ) skall inkluderer forskjellige skjelllignende kommandoer som direkte samhandler med Hadoop Distribuert filsystem ( HDFS ) så vel som andre filsystemer som Hadoop støtter, for eksempel Local FS , HFTP FS , S3 FS , og andre.

På denne måten, hvordan overfører jeg data fra en hdfs til en annen hdfs?

Hadoop fs cp – Enkleste måte å kopiere data fra en kildekatalog til en annen . Bruke hadoop fs -cp [kilde] [destinasjon]. Hadoop fs copyFromLocal – Må kopiere data fra lokalt filsystem til HDFS ? Bruke hadoop fs -copyFromLocal [kilde] [destinasjon].

Hvordan kopierer jeg en klynge fra en klynge til en annen?

Kopierer filer mellom klynger . Du kan kopiere filer eller kataloger mellom ulike klynger ved å bruke hadoop distcp-kommandoen. Du må inkludere legitimasjon fil i din kopiere be så kilden klynge kan bekrefte at du er autentisert til kilden klynge og målet klynge.

Anbefalt: