Innholdsfortegnelse:

Hva er uteliggere i dataanalyse?
Hva er uteliggere i dataanalyse?

Video: Hva er uteliggere i dataanalyse?

Video: Hva er uteliggere i dataanalyse?
Video: По следам древней цивилизации? 🗿 Что, если мы ошиблись в своем прошлом? 2024, Kan
Anonim

I statistikk, an uteligger er en data poeng som skiller seg vesentlig fra andre observasjoner. An uteligger kan skyldes variasjon i målingen eller det kan indikere eksperimentell feil; sistnevnte er noen ganger ekskludert fra data sett. An uteligger kan forårsake alvorlige problemer i statistiske analyser.

Med tanke på dette, hvordan finner du uteliggere i data?

Et punkt som faller utenfor data settets innerfenser er klassifisert som en mindreårig uteligger , mens en som faller utenfor de ytre gjerdene er klassifisert som en større uteligger . For å finne de indre gjerdene til din data sett først, multipliser interkvartilområdet med 1,5. Legg deretter resultatet til Q3 og trekk det fra Q1.

Bortsett fra ovenfor, bør jeg fjerne uteliggere fra dataene mine? Til de mesteparten, hvis dataene dine er påvirket av disse ekstreme tilfellene, du kan bundet de innspill til en historisk representant for dataene dine som utelukker uteliggere . Bestem fra sak til sak hva de effekten av uteliggere var. Og derfra bestemmer du om du vil ta bort , endre eller beholde den ytterste verdier.

I forhold til dette, hvordan håndterer dataanalyse uteliggere?

Her er fire tilnærminger:

  1. Slipp de ekstreme postene. Når det gjelder Bill Gates, eller en annen sann avviker, er det noen ganger best å fjerne den posten fullstendig fra datasettet for å forhindre at personen eller hendelsen forvrider analysen din.
  2. Sett grense for uteliggere data.
  3. Tilordne en ny verdi.
  4. Prøv en transformasjon.

Hva er et eksempel på en uteligger?

Outlier . mer En verdi som "ligger utenfor" (som er mye mindre eller større enn) de fleste av de andre verdiene i et sett med data. Til eksempel i poengsummene 25, 29, 3, 32, 85, 33, 27, 28 er både3 og 85 " uteliggere ".

Anbefalt: