Kako izračunati srednjo vrednost podatkov v gruči

Avtor: Peter Berry
Datum Ustvarjanja: 15 Avgust 2021
Datum Posodobitve: 21 November 2024
Anonim
StatQuest: K-means clustering
Video.: StatQuest: K-means clustering

Vsebina

Mediana je sredina niza urejenih podatkov. Na primer, množica (2,4,7,9,10) ima mediano 7. Urejeni podatki se združijo v kategorije z natančno podrobnostjo vsake točke izgube podatkov. Torej natančne mediane ni mogoče poznati iz samih podatkov iz gruče. Če pa poznate število podatkov v vsakem intervalu, lahko ugotovite, kaj je "srednje območje", to je tisto, kar vsebuje točko, ki je mediana. Oceno mediane točke lahko dodatno izpopolnimo s formulo, ki temelji na predpostavki, da so podatkovne točke v sredini točko enakomerno porazdeljene.


Navodila

Učenje, kako izračunati srednjo vrednost podatkovne skupine, je preprosta naloga (Hemera Technologies / AbleStock.com / Getty Images)
  1. Vrednosti razvrstite v intervalih, če še niso. Določite, kateri interval naj vsebuje sredino.

    Za didaktične namene upoštevajte podatkovni niz (1,2,4,5,6,7,7,7,9). Tu je srednja vrednost 6. Set lahko razvrstite v širine, ki so enake 4, na primer. Njihova frekvenčna porazdelitev je lahko taka, na primer: 1-4: 3 5-8: 5 9-12: 1 V nebazovanih podatkih je mediana očitno v kategoriji 5-8. To lahko celo rečete, ne da bi videli izvirni nabor podatkov.

  2. Izračunajte razliko v številu podatkovnih točk nad srednjim in polovičnim številom podatkovnih točk.

    Po navedenem je to 9/2 - 3 = 1.5. Ta izračun ocenjuje, kako daleč od srednjega območja najti srednjo vrednost.

  3. Delite s številom točk v srednjem območju.


    Nadaljevanje z zgledom, 1.5 / 5 = 0.3. To daje razmerje med srednjim območjem in srednjo vrednostjo mediane.

  4. Dobljeno vrednost pomnožite s širino srednjega območja.

    Nadaljevanje z zgledom 0,3 x 4 = 1,2. To pretvori razmerje znotraj območja v dejansko povečanje podatkov.

  5. Dodajte zgornji rezultat vrednosti med srednjim in nižjim območjem.

    Ker je rez med srednjim in nižjim razponom 4,5, dobimo enačbo 4,5 + 1,2 = 5,7, ki ima lahko svoj rezultat zaokrožena na 6, pravilen odgovor.

Kako

  • Dejansko je zgornji izračun enak kot v formuli "L + (n / 2 - c) / fxw", kjer je L število med srednjim in naslednjim spodnjim intervalom, n skupno število podatkovnih točk, c je skupno število pik pod srednjim območjem, f število podatkovnih točk v srednjem območju, w pa širina.