Min virksomhet er franchising. Vurderinger. Suksesshistorier. Ideer. Arbeid og utdanning
Nettstedsøk

Estimert spredning, standardavvik.

X i - tilfeldige (gjeldende) verdier;

gjennomsnittsverdien av tilfeldige variabler i utvalget beregnes med formelen:

Så, varians er middelkvadrat for avvikene . Det vil si at gjennomsnittsverdien først beregnes og deretter tas forskjellen mellom hver opprinnelige verdi og gjennomsnittsverdi, i annen , legges til og deretter divideres med antall verdier i den gitte populasjonen.

Forskjellen mellom den individuelle verdien og gjennomsnittet gjenspeiler målet på avviket. Den kvadreres for å sikre at alle avvik utelukkende blir positive tall og for å unngå gjensidig kansellering av positive og negative avvik når de summeres. Så, gitt de kvadrerte avvikene, beregner vi ganske enkelt det aritmetiske gjennomsnittet.

Ledetråden til det magiske ordet "spredning" ligger i bare disse tre ordene: gjennomsnitt - kvadrat - avvik.

Standardavvik (RMS)

Ved å ta kvadratroten av dispersjonen får vi den såkalte " standardavvik". Det er navn "standardavvik" eller "sigma" (fra navnet på den greske bokstaven σ .). Formelen for standardavviket er:

Så, variansen er sigma i annen, eller - standardavvik i andre.

Standardavviket karakteriserer selvsagt også målet for dataspredning, men nå (i motsetning til spredning) kan det sammenlignes med de opprinnelige dataene, siden de har samme måleenheter (dette fremgår tydelig av beregningsformelen). Variasjonsområdet er forskjellen mellom ekstremverdiene. Standardavvik, som et mål på usikkerhet, er også involvert i mange statistiske beregninger. Med dens hjelp etableres graden av nøyaktighet av ulike estimater og prognoser. Hvis variasjonen er veldig stor, vil standardavviket også vise seg å være stort, derfor vil prognosen være unøyaktig, noe som for eksempel kommer til uttrykk i svært brede konfidensintervaller.

Derfor, i metodene for statistisk databehandling i eiendomsvurderinger, avhengig av den nødvendige nøyaktigheten av oppgaven, brukes regelen om to eller tre sigmas.

For å sammenligne to sigma-regelen og tre sigma-regelen bruker vi Laplace-formelen:

F - F,

hvor Ф(x) er Laplace-funksjonen;



Minimumsverdi

β = maksimal verdi

s = sigmaverdi (standardavvik)

a = middelverdi

I dette tilfellet brukes en bestemt form av Laplace-formelen når grensene α og β til verdiene til den tilfeldige variabelen X er like fordelt fra distribusjonssenteret a = M(X) med en verdi d: a = a-d , b = a+d. Eller (1) Formel (1) bestemmer sannsynligheten for et gitt avvik d for en tilfeldig variabel X med en normalfordelingslov fra dens matematiske forventning М(X) = a. Hvis vi i formel (1) tar suksessivt d = 2s og d = 3s, får vi: (2), (3).

To sigma regel

Nesten pålitelig (med en konfidenssannsynlighet på 0,954) kan det hevdes at alle verdier av en tilfeldig variabel X med en normalfordelingslov avviker fra dens matematiske forventning M(X) = a med et beløp som ikke er større enn 2s (to standard). avvik). Konfidenssannsynlighet (Pd) er sannsynligheten for hendelser som er betinget akseptert som pålitelige (deres sannsynlighet er nær 1).

La oss illustrere regelen om to sigma geometrisk. På fig. 6 viser en gaussisk kurve med et distribusjonssenter a. Området avgrenset av hele kurven og okseaksen er 1 (100%), og arealet av den krumlinjede trapesen mellom abscissene a–2s og a+2s, i henhold til to sigma-regelen, er 0,954 (95,4 %) av det totale arealet). Arealet til de skraverte områdene er lik 1-0,954 = 0,046 (>5% av det totale arealet). Disse seksjonene kalles det kritiske området til den tilfeldige variabelen. Verdiene til en tilfeldig variabel som faller inn i det kritiske området er usannsynlig og blir i praksis betinget tatt som umulig.

Sannsynligheten for betinget umulige verdier kalles signifikansnivået til en tilfeldig variabel. Signifikansnivået er relatert til konfidensnivået med formelen:

hvor q er signifikansnivået, uttrykt i prosent.

Tre sigma regel

Når man løser problemer som krever større pålitelighet, når konfidenssannsynligheten (Pd) tas lik 0,997 (mer presist, 0,9973), i stedet for to-sigma-regelen, i henhold til formel (3), brukes regelen tre sigma.



I følge tre sigma regel med et konfidensnivå på 0,9973, vil det kritiske området være området for attributtverdiene utenfor intervallet (a-3s, a+3s). Signifikansnivået er 0,27 %.

Sannsynligheten for at den absolutte verdien av avviket vil overstige tre ganger standardavviket er med andre ord svært liten, nemlig 0,0027=1-0,9973. Dette betyr at bare i 0,27 % av tilfellene kan dette skje. Slike hendelser, basert på prinsippet om umuligheten av usannsynlige hendelser, kan anses som praktisk umulig. De. prøvetaking med høy presisjon.

Dette er essensen av tre sigma-regelen:

Hvis en tilfeldig variabel er normalfordelt, overstiger ikke den absolutte verdien av dens avvik fra den matematiske forventningen tre ganger standardavviket (RMS).

I praksis brukes tre-sigma-regelen som følger: hvis fordelingen av den tilfeldige variabelen som studeres er ukjent, men betingelsen spesifisert i regelen ovenfor er oppfylt, er det grunn til å anta at den studerte variabelen er normalfordelt; ellers er den ikke normalfordelt.

Nivået av betydning tas avhengig av tillatt grad av risiko og oppgaven. For eiendomsvurderinger tas vanligvis en mindre nøyaktig prøve, etter to sigma-regelen.