Innholdsfortegnelse:

Hvordan takler du NA-verdier i R?
Hvordan takler du NA-verdier i R?

Video: Hvordan takler du NA-verdier i R?

Video: Hvordan takler du NA-verdier i R?
Video: СБОРКА И ЗАПУСК 12 ЛИТРОВГО ДВИГАТЕЛЯ ГРУЗОВИКА SCANIA / ПРОБЕГ 1,4 МЛН КМ. / DC12 HPi 2024, November
Anonim

Når du importerer datasett fra andre statistiske applikasjoner manglende verdier kan være kodet med et tall, for eksempel 99. For å la R vet at det er en manglende verdi du må kode den om. En annen nyttig funksjon i R til håndtere manglende verdier er na . utelate() som sletter ufullstendige observasjoner.

Bare så, hvordan takler du NA i R?

NA-alternativer i R

  1. utelate og na. ekskluder: returnerer objektet med observasjoner fjernet hvis de inneholder manglende verdier; forskjeller mellom å utelate og ekskludere NA-er kan sees i noen prediksjons- og restfunksjoner.
  2. pass: returnerer objektet uendret.
  3. fail: returnerer objektet bare hvis det ikke inneholder noen manglende verdier.

På samme måte, hvordan håndterer du manglende kategoriske data i R? Det er ulike måter å håndtere manglende verdier på kategoriske måter.

  1. Ignorer observasjoner av manglende verdier hvis vi har å gjøre med store datasett og mindre antall poster har manglende verdier.
  2. Ignorer variabel hvis den ikke er signifikant.
  3. Utvikle modell for å forutsi manglende verdier.
  4. Behandle manglende data som bare en annen kategori.

På samme måte kan man spørre seg, hvordan setter du manglende verdier i R?

I R , manglende verdier representeres av symbolet NA (ikke tilgjengelig). Umulig verdier (f.eks. å dele på null) er representert med symbolet NaN (ikke et tall). I motsetning til SAS, R bruker samme symbol for tegn og tall data . For mer trening på å jobbe med manglende data , prøv dette kurset om rengjøring data i R.

Hva betyr Na Rm i R?

Når du bruker en datarammefunksjon na . rm i r refererer til den logiske parameteren som forteller funksjonen om den skal fjernes eller ikke NA verdier fra beregningen. Det bokstavelig talt betyr NA ta bort. Det er verken en funksjon eller en operasjon. Det er ganske enkelt en parameter som brukes av flere datarammefunksjoner.

Anbefalt: