Hva er gnistsending?
Hva er gnistsending?

Video: Hva er gnistsending?

Video: Hva er gnistsending?
Video: Hva er best av iskrem og trening? 2024, November
Anonim

Kringkaste variabler i Apache Gnist er en mekanisme for å dele variabler på tvers av utførere som er ment å være skrivebeskyttet. Uten kringkaste variabler disse variablene vil bli sendt til hver utfører for hver transformasjon og handling, og dette kan forårsake nettverksoverhead.

På samme måte spør folk, når skal jeg kringkaste gnist?

Kringkaste variabler brukes for det meste når oppgavene på tvers av flere stadier krever samme data eller når det kreves bufring av dataene i deserialisert form. Kringkaste variabler opprettes ved å bruke en variabel v ved å kalle SparkContext.

Dessuten, hva er akkumulatorer og kringkastingsvariabler i gnist? Gnist støtter to typer delt variabler : kringkastingsvariabler , som kan brukes til å bufre en verdi i minnet på alle noder, og akkumulatorer , som er variabler som bare «legges til», som tellere og summer.

Med tanke på dette, hva er gnistakkumulator?

Akkumulatorer er variabler som bare "legges til" gjennom en assosiativ operasjon og kan derfor effektivt støttes parallelt. De kan brukes til å implementere tellere (som i MapReduce) eller summer. Gnist støtter naturlig akkumulatorer av numeriske typer, og programmerere kan legge til støtte for nye typer.

Hvordan oppdaterer jeg kringkastingsvariabelen min i spark?

  1. Flytt referansedataoppslaget til en forEachPartition eller forEachRdd slik at den ligger utelukkende på arbeiderne.
  2. Start Spark Context på nytt hver gang refdata endres, med en ny kringkastingsvariabel.

Anbefalt: