Hogyan hazudjunk a statisztikákkal
Hogyan hazudjunk a statisztikákkal |
Szerző |
Darell Huff |
Eredeti nyelv |
angol |
Az eredeti megjelent |
1954 |
Dekoráció |
Irving Geis |
Kiadó |
W. W. Norton & Company Inc. |
Oldalak |
142 |
ISBN |
0-393-31072-8 |
Darell Huff könyve a Hogyan hazudjunk a statisztikákkal .1954-ben. Arról beszél, hogy a statisztikákat hogyan lehet visszaélni a közönség megtévesztésére és véleményük manipulálására. Számos konkrét példát veszünk figyelembe, főleg az amerikai életből (reklám, politika, propaganda és agitáció).
A könyv első epigráfusa egy idézet Beaconsfield gróftól (B. Disraeli) a statisztikáról: "Háromféle hazugság létezik: hazugság, kirívó hazugság és statisztika."
A könyv a nem szakember olvasóknak szól, és élénk illusztrációkkal látták el. Az anyag szemléletesen és közérthető formában került bemutatásra, ami biztosította a könyv nagy népszerűségét - a 20. század második felének egyik legszélesebb körben terjesztett statisztikai kiadványa [1] .
Tartalom
A minta eredendően torzított
Magyarázat arról, hogy mi a mintavétel , hogyan választják ki öntudatlanul a kérdezők az interjúalanyokat, és hogyan befolyásolják válaszaikat.
Egy jól megválasztott átlag
Az átlagok típusait vesszük figyelembe:
A példák bemutatják, hogy az átlagérték típusának megválasztása hogyan befolyásolja az értékét ugyanazon minták esetében. Felhívjuk a figyelmet arra a lehetőségre, hogy egy „kényelmes” (a manipulátor számára) típusú átlagot választva manipuláljunk egy felkészületlen olvasót.
A szerényen hallgatag árnyalatok
Ebben a fejezetben a szerző a statisztikai kutatás olyan fontos árnyalatait veszi figyelembe, amelyek gyakran szándékosan vagy öntudatlanul kimaradnak a nagyközönségnek szánt cikkekből.
Kifejti a mintanagyság fontosságát és kapcsolatát a sokaság típusával. Példák a mintaméret-manipulációra:
- A fogkrém hatékonyságának tesztelése. Laboratóriumi vizsgálatokat végeznek a fogkrém használatának hatásáról hat alanyon. Néha számos ilyen vizsgálatot végeznek, és azt a vizsgálatot, amely a vásárló (pasztagyártó) számára előnyös eredményt mutatott, reklámkampányokban használják fel.
- Polio vakcina teszt. 450 gyermeket oltottak be, 680-at nem oltottak be (kontrollcsoport). Nem sokkal ezután járvány tört ki a környéken, a beoltott gyerekeknél egyetlen esetben sem volt gyermekbénulás. A kontrollcsoport egyik tagja sem. A kísérletet a résztvevők számának helytelen megválasztása miatt a kezdetektől hiábavalóvá tették, ugyanis egy ekkora csoportban legfeljebb két fertőzéses eset várható.
A fogalmak bemutatása:
A Hesseli fejlesztési skála példájánaz átlagérték pontszerű (intervallumon kívüli) értékelésének észlelésének veszélyéről beszél - a szülők pánikba kezdenek, ha gyermekük nem teljesíti a normát (átlagértéket).
Felhívják a figyelmet a szóhasználat fontosságára a statisztikákon alapuló cikkekben. Példaként vegyük a villamosenergia-szolgáltató cégek kijelentését (1948): "Az Egyesült Államokban a gazdaságok több mint 3/4-e elektromos energiával rendelkezik ." Az alkalmazásban semmilyen módon nem definiált „hozzáférhető” szó értelmetlenné teszi - ez általában azt jelenti, hogy az elektromos vezeték 16-160 km-re van a gazdaságtól, de valami másként hozzáférhetőségként fogható fel. A szerző azt is megjegyzi, hogy ugyanezen adatok értelmezésekor fordítva is lehetne hangsúlyozni: "Az amerikai gazdaságok negyede számára nem elérhető az elektromos áram."
A fejezet azzal zárul, hogy emlékeztetni kell a számok grafikonokon való feltüntetésének fontosságára – a vállalat több éven át tartó nyereségnövekedését ábrázoló diagram (amely a Fortune magazinban jelent meg) nem mond semmit az olvasónak, mert az y tengelyen nincsenek numerikus címkék. Egy ilyen grafikonról nem lehet megmondani, hogy a nyereség növekedése jelentős, átlagos vagy nullához közeli volt.
Sok háborgás a semmiért
A konfidenciaintervallum és a konfidenciaszint fogalmát valós példák illusztrálják:
- Az IQ-teszt 98 és 101 közötti különbsége lehetetlenné teszi annak megállapítását, hogy melyik alany magasabb IQ-val rendelkezik, amint az a teszteredmények teljes nyilvántartásából is látható: 98 ± 3, illetve 101 ± 3.
- A különböző márkájú cigaretták károsanyag-tartalmának mérése kimutatta, hogy ezek között nincs jelentős különbség. Ennek ellenére az egyik márka az utolsó helyen állt a károsanyag-tartalom tekintetében (igaz, eleve elhanyagolható különbséggel!). Ezeknek a cigarettáknak a gyártója (Old Gold) reklámkampányt indított, amelyben azt állították, hogy egy független laboratórium szerint az Old Gold cigaretták tartalmazzák a legkevésbé káros anyagokat.
A menetrend olyan jó, amennyire csak lehet
A fejezetek közül az első a grafikus információk segítségével történő manipuláció módozatainak mérlegelésére irányult.
Megfontolja a grafikonok észlelésének torzításának módjait:
- A koordináta rács egy részének „tömörítése”, látszólag a helytakarékosság érdekében. A valóságban ez nehézségekhez vezet a lépték észlelésében
- Skálaváltozás az abszcissza és az ordináta tengelye mentén. Ez a módszer lehetővé teszi, hogy a növekedést (vizuálisan) a nullához közeli, határozottan fenntartható módon "fordítsa". Példaként adjuk meg az egyik közleményben szereplő állami támogatás növekedési diagramját. A növekedés mindössze 4%-os volt, de vizuálisan majdnem 400%-nak tűnt az y tengely mentén lévő skála növekedése miatt.
Sematikus kép
A közönség megtévesztésének módjainak megértése infografikák segítségével .
A bemutatott információkhoz társított grafikus objektumok használata széles körű visszaélési lehetőségeket nyit meg. Ezt az állítást számos példa illusztrálja:
- Két fizetés összehasonlításához használhat infografikát, és rajzolhat két zsák pénzt. Ha a második bér kétszer olyan magas, mint az első, akkor a második táska nemcsak magasabb, hanem kétszer szélesebb is lesz (ami az arány megtartásához szükséges). És mivel a táska egy háromdimenziós tárgy, a második táska kontúrja kétszer vastagabb lesz, mint az elsőé. Ennek eredményeként látásunk a második zacskót 8-szor (nem 2-szer!) nagyobb zacskónak érzékeli, mint az elsőt. Ezt a technikát a Newsweek magazin használta.
- Az American Institute of Steel and Alloys hirdetésében egy infografika segítségével mutatták be, hogy 1930 és 1940 között 4,25 millió tonnával (10 millióról 14,25 millióra) nőtt az acéltermelés. Az infografikus technika (a korábban tárgyalt módszerekhez az arányok szándékos torzítása is hozzáadódott) oda vezetett, hogy a jelzett olvasztási növekedést vizuálisan 1500%-ban érzékelték. A szerző megjegyzi, hogy ez a helyzet akkor, amikor "az aritmetika fantáziává változik".
- Különböző méretű tehenek képeinek felhasználása a különböző tejhozamok bemutatására az évek során. A már tárgyalt hatások mellett ez a módszer újabb félreértéshez vezet - az olvasó azt gondolhatja, hogy nemcsak a tejhozamok lettek magasabbak, hanem a tehenek is.
Az alábbi ábra egy példát mutat az infografikával való visszaélésre – a második objektum vizuálisan nyolcszor nagyobb:
Ál-igazított ábra
A fejezet egy éles ajánlással kezdődik: „Ha nem tudod bizonyítani, amit akarsz, akkor mutass be valami mást, és tegyél úgy, mintha ezek a dolgok ugyanazok lennének.”
Sok példa van az ilyen csalásokra. Különösen:
- A valós munkaerő-piaci helyzethez a fehérek és az afroamerikaiak elhelyezkedési esélyegyenlőségéről szóló felmérés kiadása . Ez a felmérés annál jobb eredményeket mutathat, minél többen vesznek részt benne az afroamerikaiakkal szembeni faji előítélettel rendelkezők, mivel az ilyen válaszadók hajlamosak azt hinni, hogy a munkaerőpiacon nincs faji megkülönböztetés.
- A cigarettareklámok a következő érvelést alkalmazták: "A jól ismert orvosok nagy mintájának több mint 27%-a dohányzik Throaties-val, ami a legmagasabb arány a cigarettamárkák közül." A reklám implicit módon azt sugallta, hogy az orvosok valami különlegeset, a többiek számára ismeretlent tudtak a különböző márkájú cigaretták által okozott károkról. De nem az.
- Egy gyümölcscentrifuga reklámja azt állította, hogy a laboratóriumi vizsgálatok kimutatták, hogy 26%-kal több gyümölcslevet présel ki. Amikor feltették a kérdést - "minél?", A válasz érkezett - "mint egy kézi kúpos facsaró." Még ha az eredeti állítás igaz is, nem teszi lehetővé a hirdetett termék összehasonlítását a versenytársak termékeivel. Lehet, hogy ez a legrosszabb a piacon, de így is 26%-kal felülmúlja a kézi facsarót az extrakciós hatékonyságban.
- A haditengerészet halálozása a spanyol-amerikai háború alatt 0,09% volt. A New York-i civilek esetében ugyanebben az időszakban ez 0,16% volt. A haditengerészet ezeket a számokat használta a katonai szolgálatért folytatott kampányra. De helytelen összehasonlítani ezeket a mutatókat - fiatal és egészséges embereket toboroznak a flottába, és csecsemőket, időseket, betegeket a civil lakosságba.
Ismét az „after is due to”
Ez a fejezet a korreláció fogalmáról és az ok és okozat között gyakran felmerülő zavarról beszél . Ha A és B jelenség együtt fordul elő, akkor ez háromféleképpen magyarázható:
- Az A jelenség a B jelenség következménye
- A B jelenség az A jelenség következménye
- Az A és B jelenségek egy másik/más jelenség(ek) következményei
Számos példát adunk az ok-okozati összefüggésekkel kapcsolatos téves ítéletekre. Különösen:
- Tanulmányok kimutatták, hogy a dohányzó diákok között több a gyengébb teljesítmény, mint a nemdohányzók között. Ezt a tényt felhasználták a dohányzás elleni kampányban. De ebből az eredményből nem lehet azt a következtetést levonni, hogy a dohányzás negatív hatással lenne a tanulók képességeire. Előfordulhat, hogy a tanulók rossz tanulmányi teljesítmény miatt kezdtek dohányozni, vagy nem tanulnak jól, és valamilyen harmadik ok (például nehéz életkörülmények) miatt dohányoznak.
- A kutatások pozitív összefüggést mutatnak az iskolai végzettség és a jövedelem között. Ebből a tényből nem lehet azt a következtetést levonni, hogy ha Ön (fia, lánya stb.) felsőfokú végzettséget szerez, akkor biztosan és szükségszerűen magasabb jövedelme lesz, mint ha nem kapta meg. Sőt, ez az összefüggés nem engedi meg általános szabályként azt a következtetést levonni, hogy a felsőfokú végzettség az, ami magasabb jövedelemhez vezet – esetleg jómódú családból származnak azok, akik ezt kapták, és ezért kapnak magasabb jövedelmet felnőtt korukban is. Íme egy példa a post hoc hibáraLásd még: Logikai hibák .
- Egy 1500 tipikus középkorú egyetemi végzettséggel végzett vizsgálat kimutatta, hogy a férfiak 93%-a házas (szemben a teljes népesség 83%-ával), míg a nőknek csak 65%-a volt házas. Ebből az a következtetés vonható le, hogy egy tanult nő kisebb eséllyel megy férjhez, mint egy tanulatlan. De a tanulmány nem mutat ok-okozati összefüggést e jelenségek között. Talán ezek a hajadon nők akkor is hajadonok maradtak volna, ha nem végezték volna el az egyetemet.
A fejezet egy szinte anekdotikus (de valós) példával zárul az ok és okozat Új-Hebridák őslakosai általi összekeverésére . Úgy gondolták, hogy a tetvek jelenléte egészséghez vezet. Ezt a következtetést az alapján állítottuk le, hogy a tetvek elhagyták a beteget (mert a megemelkedett testhőmérséklet miatt kényelmetlenné váltak számukra az életkörülmények), míg minden egészséges embernél előfordultak (azaz pozitív összefüggés mutatható ki egészség és a tetvek jelenléte).
Hogyan készítsünk statisztikákat
A statisztikai adatok statisztikai manipulációk. Ebben a fejezetben a szerző konkrét példákon keresztül ismét bemutatja a statisztikai adatok manipulálását. Arra kér azonban, hogy ne válogatás nélkül utasítsák el a statisztikai adatokat, hanem figyelmesen, alaposan, óvatos hitetlenséggel tanulmányozzák azokat, mielőtt tudomásul vennék.
Hogyan helyezzük el a statisztikákat
A szerző a statisztikai adatok ellenőrzését öt egyszerű kérdés segítségével javasolja:
- Ki beszél?
- Ő honnan tudja ezt?
- Mi hiányzik?
- Változott a vizsgálat tárgya?
- Számít ez?
Más nyelvű kiadások
Oroszul
- Darell Huff. Hogyan hazudjunk statisztikákkal = How to Lie with Statistics. — M .: Alpina Kiadó , 2015. — 163 p. — ISBN 978-5-9614-5212-9 .
Jegyzetek
- ↑ "Az elmúlt ötven évben a Hogyan hazudjunk a statisztikákkal több példányban kelt el, mint bármely más statisztikai szöveg." JM Steele. " Darrell Huff és a Fifty Years of How to Lie with Statistics Archiválva : 2021. február 23. a Wayback Machine -nél . Statisztikai tudomány , 20(3), 2005, 205-209.
Linkek