Hogyan hazudjunk a statisztikákkal

Hogyan hazudjunk a statisztikákkal
Szerző Darell Huff
Eredeti nyelv angol
Az eredeti megjelent 1954
Dekoráció Irving Geis
Kiadó W. W. Norton & Company Inc.
Oldalak 142
ISBN 0-393-31072-8

Darell Huff  könyve a Hogyan hazudjunk a statisztikákkal .1954-ben. Arról beszél, hogy a statisztikákat hogyan lehet visszaélni a közönség megtévesztésére és véleményük manipulálására. Számos konkrét példát veszünk figyelembe, főleg az amerikai életből (reklám, politika, propaganda és agitáció).

A könyv első epigráfusa egy idézet Beaconsfield gróftól (B. Disraeli) a statisztikáról: "Háromféle hazugság létezik: hazugság, kirívó hazugság és statisztika."

A könyv a nem szakember olvasóknak szól, és élénk illusztrációkkal látták el. Az anyag szemléletesen és közérthető formában került bemutatásra, ami biztosította a könyv nagy népszerűségét - a 20. század második felének egyik legszélesebb körben terjesztett statisztikai kiadványa [1] .

Tartalom

A minta eredendően torzított

Magyarázat arról, hogy mi a mintavétel , hogyan választják ki öntudatlanul a kérdezők az interjúalanyokat, és hogyan befolyásolják válaszaikat.

Egy jól megválasztott átlag

Az átlagok típusait vesszük figyelembe:

A példák bemutatják, hogy az átlagérték típusának megválasztása hogyan befolyásolja az értékét ugyanazon minták esetében. Felhívjuk a figyelmet arra a lehetőségre, hogy egy „kényelmes” (a manipulátor számára) típusú átlagot választva manipuláljunk egy felkészületlen olvasót.

A szerényen hallgatag árnyalatok

Ebben a fejezetben a szerző a statisztikai kutatás olyan fontos árnyalatait veszi figyelembe, amelyek gyakran szándékosan vagy öntudatlanul kimaradnak a nagyközönségnek szánt cikkekből.

Kifejti a mintanagyság fontosságát és kapcsolatát a sokaság típusával. Példák a mintaméret-manipulációra:

A fogalmak bemutatása:

A Hesseli fejlesztési skála példájánaz átlagérték pontszerű (intervallumon kívüli) értékelésének észlelésének veszélyéről beszél - a szülők pánikba kezdenek, ha gyermekük nem teljesíti a normát (átlagértéket).

Felhívják a figyelmet a szóhasználat fontosságára a statisztikákon alapuló cikkekben. Példaként vegyük a villamosenergia-szolgáltató cégek kijelentését (1948): "Az Egyesült Államokban a gazdaságok több mint 3/4-e elektromos energiával rendelkezik ." Az alkalmazásban semmilyen módon nem definiált „hozzáférhető” szó értelmetlenné teszi - ez általában azt jelenti, hogy az elektromos vezeték 16-160 km-re van a gazdaságtól, de valami másként hozzáférhetőségként fogható fel. A szerző azt is megjegyzi, hogy ugyanezen adatok értelmezésekor fordítva is lehetne hangsúlyozni: "Az amerikai gazdaságok negyede számára nem elérhető az elektromos áram."

A fejezet azzal zárul, hogy emlékeztetni kell a számok grafikonokon való feltüntetésének fontosságára – a vállalat több éven át tartó nyereségnövekedését ábrázoló diagram (amely a Fortune magazinban jelent meg) nem mond semmit az olvasónak, mert az y tengelyen nincsenek numerikus címkék. Egy ilyen grafikonról nem lehet megmondani, hogy a nyereség növekedése jelentős, átlagos vagy nullához közeli volt.

Sok háborgás a semmiért

A konfidenciaintervallum és a konfidenciaszint fogalmát valós példák illusztrálják:

A menetrend olyan jó, amennyire csak lehet

A fejezetek közül az első a grafikus információk segítségével történő manipuláció módozatainak mérlegelésére irányult.

Megfontolja a grafikonok észlelésének torzításának módjait:

Sematikus kép

A közönség megtévesztésének módjainak megértése infografikák segítségével .

A bemutatott információkhoz társított grafikus objektumok használata széles körű visszaélési lehetőségeket nyit meg. Ezt az állítást számos példa illusztrálja:

Az alábbi ábra egy példát mutat az infografikával való visszaélésre – a második objektum vizuálisan nyolcszor nagyobb:

Ál-igazított ábra

A fejezet egy éles ajánlással kezdődik: „Ha nem tudod bizonyítani, amit akarsz, akkor mutass be valami mást, és tegyél úgy, mintha ezek a dolgok ugyanazok lennének.”

Sok példa van az ilyen csalásokra. Különösen:

Ismét az „after is due to”

Ez a fejezet a korreláció fogalmáról és az ok és okozat között gyakran felmerülő zavarról beszél . Ha A és B jelenség együtt fordul elő, akkor ez háromféleképpen magyarázható:

  1. Az A jelenség a B jelenség következménye
  2. A B jelenség az A jelenség következménye
  3. Az A és B jelenségek egy másik/más jelenség(ek) következményei

Számos példát adunk az ok-okozati összefüggésekkel kapcsolatos téves ítéletekre. Különösen:

A fejezet egy szinte anekdotikus (de valós) példával zárul az ok és okozat Új-Hebridák őslakosai általi összekeverésére . Úgy gondolták, hogy a tetvek jelenléte egészséghez vezet. Ezt a következtetést az alapján állítottuk le, hogy a tetvek elhagyták a beteget (mert a megemelkedett testhőmérséklet miatt kényelmetlenné váltak számukra az életkörülmények), míg minden egészséges embernél előfordultak (azaz pozitív összefüggés mutatható ki egészség és a tetvek jelenléte).

Hogyan készítsünk statisztikákat

A statisztikai adatok statisztikai manipulációk. Ebben a fejezetben a szerző konkrét példákon keresztül ismét bemutatja a statisztikai adatok manipulálását. Arra kér azonban, hogy ne válogatás nélkül utasítsák el a statisztikai adatokat, hanem figyelmesen, alaposan, óvatos hitetlenséggel tanulmányozzák azokat, mielőtt tudomásul vennék.

Hogyan helyezzük el a statisztikákat

A szerző a statisztikai adatok ellenőrzését öt egyszerű kérdés segítségével javasolja:

Más nyelvű kiadások

Oroszul

Jegyzetek

  1. "Az elmúlt ötven évben a Hogyan hazudjunk a statisztikákkal több példányban kelt el, mint bármely más statisztikai szöveg." JM Steele. " Darrell Huff és a Fifty Years of How to Lie with Statistics Archiválva : 2021. február 23. a Wayback Machine -nél . Statisztikai tudomány , 20(3), 2005, 205-209.

Linkek