- Mått på central tendens sammanfattar data genom att ange dess typiska värde.
- De tre huvudmåtten är det aritmetiska medelvärdet, medianen och läget.
- Att välja rätt mått beror på dataens egenskaper.
- De är avgörande för datadrivna beslut inom olika områden.
I våra dagliga liv fattar vi ofta datadrivna beslut: hur mycket vi spenderar per månad, våra barns genomsnittliga betyg eller genomsnittslönen på ett företag. Men att korrekt tolka denna information kräver organisation och statistiska verktyg. Det är där statistisk analys kommer in i bilden. mått på central tendens, en uppsättning parametrar som hjälper oss att förstå mest representativa värdet av en datamängd.
I den här artikeln kommer vi att gå igenom allt du behöver veta om dessa statistiska koncept: vad de är, hur de beräknas, deras fördelar och nackdelar, när det är bäst att använda det ena eller det andra, och några praktiska exempel. All information är baserad på pedagogiska och specialiserade källor, organiserad på ett tydligt och engagerande sätt så att du kan förstå den utan svårighet.
Vad är mått på central tendens?
den mått på central tendens, även kallad centraliseringsåtgärder eller central positionDessa är numeriska värden som sammanfattar en datamängd genom att ange var värdena tenderar att koncentreras. Med andra ord, de berättar för oss vad det "typiska" eller centrala värdet är i en serie observationer.
Dessa mått är mycket användbara för att analysera statistiska data eftersom de möjliggör att förstå hur en variabel beter sig, om det finns symmetri i värdena, om det finns extremer som påverkar resultaten, eller vad det vanligaste elementet är.
De viktigaste måtten på central tendens är tre:
- Aritmetiskt medelvärde
- median
- fashion
Var och en av dessa åtgärder har sina egna egenskaper, ideala användningsscenarier och begränsningar. Vi kommer att undersöka var och en av dem i detalj senare.
Aritmetiskt medelvärde
La aritmetiskt medelvärde Det är förmodligen det mest kända och mest använda måttet på central tendens. Det beräknas genom att addera alla värden i datamängden och dividera med det totala antalet datapunkter.
Om till exempel betygen för fem elever på ett prov är: 6.0, 5.4, 3.1, 7.0 och 6.1, blir medelvärdet:
- Tillägg: 6.0 + 5.4 + 3.1 + 7.0 + 6.1 = 27.6
- Antal datapunkter: 5
- Genomsnitt = 27.6 / 5 = 5.52
Detta värde av 5.52 Den representerar datamängdens jämviktspunkt. Den är också känd som genomsnitt o mellanvärde.
Förutom det enkla medelvärdet finns det variationer som:
- Vägt genomsnitt: när varje värde tilldelas en annan vikt eller betydelse.
- Urvalsmedelvärde: när medelvärdet beräknas på ett urval och inte på hela populationen.
Medelvärdet kan också utvidgas till data grupperade i intervall. I dessa fall används klassmarkeringar och absoluta frekvenser för beräkningen.
Egenskaper hos det aritmetiska medelvärdet
- Använd all datavilket gör den mycket informativ.
- bara för varje dataset.
- Idealisk för homogena fördelningar.
- Matematiskt användbar, låter dig utföra algebraiska beräkningar.
Begränsningar av genomsnittet
- Känslig för extrema värden: ett extremvärde kan avsevärt snedvrida resultatet.
- Det är inte så användbart för heterogena fördelningar eller med extrema värden.
- För kontinuerliga eller grupperade data kan det vara ungefärlig och beror på intervallens bredd.
median
La median är det värde som intar den centrala positionen När datamängden är ordnad från minsta till största, dela upp datamängden i två lika delar: hälften med lägre värden och den andra hälften med högre värden.
Exempel med ett udda antal datapunkter:
Uppgifter: 1, 1, 2, 2, 2, 3, 3
Medianen är det fjärde värdet, vilket är 2.
Exempel med ett jämnt antal datapunkter:
Uppgifter: 1, 1, 2, 2, 2, 3, 3, 4
Medianen blir medelvärdet av de två centrala värdena, 2 och 2.5 = 2
När data grupperas i klasser, medianintervall med hjälp av kumulativa frekvenser och interpolerade för att få ett mer exakt värde.
Fördelar med medianen
- Den påverkas inte av extrema värden., vilket gör det till ett mer robust mått.
- Det representerar bättre heterogena populationer, såsom löner i företag med stora ojämlikheter.
- Du kan beräkna det för grupperade dataäven med öppna intervaller.
Nackdelar med medianen
- Mindre användbart för algebraiska beräkningar.
- Det beror på beställningenDet kräver att man organiserar all data.
- I grupper beror dess värde på storlek och antal intervall.
fashion
La fashion är det vanligaste värdet i en datamängd, det vill säga det som oftare upprepas detDen har ingen specifik formel: du letar helt enkelt efter det vanligaste värdet.
Exempelvis:
Uppgifter: 5, 7, 4, 6, 9, 5, 6, 1, 5, 3, 7
Mode är 5, eftersom den förekommer tre gånger.
En distribution kan ha:
- Ett enda mode: unimodal
- Två trenderbimodal
- Mer än två trendermultimodal
- Modern: när alla värden har samma frekvens
För grupperade data beräknas den genom att identifiera modalt intervall, och en interpoleringsformel tillämpas som tar hänsyn till frekvenserna för den modala, föregående och efterföljande klasser, samt intervallets bredd.
Fördelar med mode
- Lätt att beräknasärskilt för individuella uppgifter.
- Den kan användas med kvalitativa variabler.
- Idealisk för beskriv typiska egenskaper (till exempel den bäst säljande bilfärgen).
Nackdelar med mode
- Det finns inte alltid.
- Använder ofullständig information: den tittar bara på det mest upprepade värdet och ignorerar resten.
- Inte särskilt användbar i likformiga fördelningar.
- Det beror mycket på hur vi grupperar informationen om de ligger i intervaller.
När ska varje mått användas?
Att välja rätt mått beror på dataens egenskaper:
- Media: idealisk för kvantitativa, symmetriska data utan extremvärden.
- median: användbart när det finns extremvärden eller sneda fördelningar.
- fashion: föredras för kvalitativa variabler eller för att identifiera mer populära värden.
Ibland kan det vara intressant använda flera åtgärder tillsammans för att få en bättre förståelse av datafördelningen. Till exempel, när man jämför löner, kan medelvärdet vara högt på grund av ett fåtal höga löner, medan medianen skulle ge en mer realistisk bild av den "typiska" anställda.
Varför är de viktiga?
Mått på central tendens har praktiska tillämpningar i en mängd olika situationer:
- Utbildningberäkna medelbetyget för en grupp elever.
- Ekonomi: att analysera en befolknings genomsnittsinkomst.
- Medicinstudera patienters genomsnittliga blodtryck.
- Sociologi: undersök de vanligaste svaren i en undersökning.
De låter dig också jämföra olika datamängder, utvärdera förändringar över tid eller fastställa kvalitetsstandarder.
Dessutom kombineras de ofta med spridningsmått såsom varians, standardavvikelse eller variationskoefficient för att få en fullständig bild: inte bara spelar medelvärdet någon roll, utan också hur resten av värdena är fördelade.
Även om de kan verka som grundläggande koncept, kan det göra hela skillnaden när man fattar datadrivna beslut att förstå hur de beräknas och när man ska använda vart och ett.
den mått på central tendens De erbjuder ett effektivt sätt att sammanfatta den statistiska informationen Att använda ett, två eller flera representativa värden och välja korrekt mellan medelvärde, median eller mod – beroende på datatyp och analysens syfte – är nyckeln till att korrekt tolka verkligheten. Oavsett om man studerar en grupps beteende, jämför resultat eller helt enkelt bättre förstår världen omkring oss, är dessa statistiska verktyg fortfarande viktiga för all rigorös dataanalys.