Buffer Presto data?
Buffer Presto data?

Video: Buffer Presto data?

Video: Buffer Presto data?
Video: Optimizing Presto for Uber scale 2024, November
Anonim

Presto lagrer mellomliggende data i perioden med oppgaver i bufferen cache . Det er imidlertid ikke ment å tjene som en caching løsning eller et vedvarende lagringslag.

Er Presto i denne forbindelse en database?

Presto er et distribuert system som kjører på Hadoop, og bruker en arkitektur som ligner på en klassisk massivt parallell prosessering (MPP) database styringssystem. Å lage Presto kan utvides til enhver datakilde, den ble designet med lagringsabstraksjon for å gjøre det enkelt å bygge pluggbare kontakter.

Bruker presto også MapReduce? Presto er en åpen kildekode parallell SQL-kjøringsmotor. I motsetning til Hive, Presto ikke bruk de kart reduksjon rammeverket for gjennomføringen. I stedet, Presto får direkte tilgang til dataene gjennom en spesialisert distribuert søkemotor som er veldig lik de som finnes i kommersielle parallelle RDBMS-er.

Derfor, hvorfor er Presto rask?

Årsak #1: Presto er Plenty Fort MapReduce opererer på en "pull"-modell og henter data fra de foregående oppgavene. Et oppstrømstrinn mottar data fra sine nedstrømstrinn, slik at mellomdataene kan sendes direkte, og dermed gjøre spørringen betydelig raskere.

Hvordan fungerer Apache Presto?

Presto er et distribuert system som kjører på en klynge av noder. Prestos distribuert spørringsmotor er optimalisert for interaktiv analyse og støtter standard ANSI SQL, inkludert komplekse spørringer, aggregeringer, sammenføyninger og vindusfunksjoner. Presto arkitektur er enkel og utvidbar.

Anbefalt: