Az adatújságírás az újságírás egyik iránya , amely az adatok feldolgozására és azok újságírói anyagok létrehozására való felhasználására épül. Az adatok egyrészt eszközként szolgálhatnak egy adott újságírói történet, másrészt annak forrásának feltárásához. Az adatújságírás fejlődése a nagy mennyiségű adat tárolását és feldolgozását lehetővé tevő technológiák fejlődésével, az információk nagyobb nyitottsága felé való elmozdulással függ össze.
Az adatújságírás olyan területekhez kapcsolódik, mint a számítástechnika , a tervezés és a statisztika .
Az adatújságírást bemutató első teljes értékű anyag a The Guardian 1821 -es tanulmánya [1] , amely Nagy- Britannia különböző egyetemein folyó felsőoktatás költségeiről szól . Az anyag készítői összefoglaló táblázatokat készítettek, amelyekben az egyes oktatási intézményekben feltüntették az oktatás árát. A mű pozitív kritikákat kapott amiatt, hogy az újságírói gyakorlatban először minden adatot ilyen nyíltan az olvasóközönség elé tártak.
1858-ban Florence Nightingale tanulmányt készített, amelyben elemezte a brit hadsereg állapotát és éves veszteségeit [2] . Egy 54 oldalas anyagban a szerző hatalmas mennyiségű adatot közöl táblázatos formába és diagramokba lefordítva . Az anyag alapját az akkor rendelkezésre álló forrásokból nyert "nyers" adatok képezték. Nightingale munkája egy teljes értékű újságírói vizsgálatot alkot , amiből az a következtetés vonható le, hogy a hadsereg halálozási aránya még békeidőben is közel kétszerese a vele egyidős civilek halálozási arányának (az ellenségeskedéssel teljesen össze nem függő problémák miatt) . Munkásságának újítása nem a grafikonok és diagramok használatában volt (ezeket már Nightingale munkája előtt is használták az újságírói anyagokban), hanem a "nyers" adatok megközelítésében. Segítségükkel a szerző egy teljesen átlátható (a felhasznált források és adatok értelmében) anyagot készített, amelyet kívánság szerint a cikkben közölt adatok felhasználásával minden olvasó önállóan elemezhet.
Az adatújságírás modern formájában való megjelenése 1952-hez köthető – ekkor használták először a számítógépet újságírói munkában [3] . A CBS tévécsatorna bérelte az UNIVAC I számítógép számítási teljesítményét az elnökválasztás eredményére vonatkozó előrejelzések kiszámításához és az egyes jelöltek eredményeinek értékeléséhez. Ez a számítógépes újságírási gyakorlat a „számítógéppel segített riportkészítés” ( Computer-assisted reporting, CAR) fogalmát viseli .
A hatvanas évek vége óta egyre elterjedtebbé vált a számítógépes adatelemzés alkalmazása újságírói anyagok készítésére. 1967-ben Philip Meyer, a Detroit Free Press újságírója számítógépes adatok segítségével készített egy történetet a városban zajló tiltakozásokról [3] . Egy másik újságíró, Bill Dedman az 1980-as években készítette el a Color of Money című történetsorozatot, amely a vezető pénzintézetek hitelpolitikájának szisztematikus faji előítéleteit tárta fel [3] . Az 1990-es évek elején Steve Doig a What Went Wrong című munkájában az Andrew hurrikán által okozott károk elemzésére törekedett, hogy megértse, milyen mértékben befolyásolták a városfejlesztési politikák és gyakorlatok hiányosságai a károk nagyságát. Az adatvezérelt tudósítás értékes közösségi szolgáltatássá vált, és elismert újságírói díjakat nyert [3] .
Az 1980-as évek végén az adatújságírásban számos jelentős fejlődés következett be. 1989-ben a The Atlanta Journal-Constitution elnyerte a Pulitzer-díjat számítógépes adatfeldolgozást használó riportok sorozatáért. A National Institute for Computer Assisted Reporting (NICAR) [4] a Missouri Egyetem Újságírói Iskolájában jött létre . 1990-ben ez az intézet szervezte meg az első számítógéppel segített újságírási konferenciát az Indiana Egyetemen . Azóta is évente megrendezik ezeket a konferenciákat, amelyek az adatújságírók legnagyobb összejövetelei.
Maga az adatújságírás fogalma először 2010-ben fogalmazódott meg egy amszterdami nemzetközi konferencián [5] , amely után az újságírásnak ezt az irányát hivatalosan kialakultnak tekintik. 2010 második fele óta az adatújságírás fogalmát mind konferenciákon, mind tudományos folyóiratokban aktívan alkalmazzák.
Az első médium , amely folyamatosan foglalkozott adatújságírással, a The Guardian volt, amely 2009-ben indította el a Datablog rovatot [6] , amelyben minden anyag az adatok feldolgozásával és bemutatásával készül.
Más médiák is nagy mennyiségű adattal való munka alapján hoznak létre projekteket. Például a Las Vegas Sun újság szerkesztői két évet töltöttek a „Do No Harm” projekt létrehozásával [7] , amelynek keretében a weboldalon egy teljes részt terveztek a Las Vegas -i orvostudomány problémáinak szentelve . A szerkesztők a projekt keretében cikksorozatot, fotóriportot, videóriportot, olvasói történeteket, valamint az újságírói cikkek alapjává vált forrásdokumentumokat, tanulmányokat megjelölő és publikáló interaktív infografikákat jelentettek meg. A Las Vegas Sun 2,9 millió kórházi nyilvántartással dolgozott, és több mint 3500 olyan sérülést és szövődményt tudott azonosítani, amelyek a város kórházaiban dolgozó egészségügyi személyzet hibájából következtek be a betegeknél (beleértve a halállal végződő incidenseket is). A projekt nagy visszhangot váltott ki mind az olvasók, mind a városi önkormányzat és a szakértő orvostársadalom körében.
2009-ben a The New York Times Toxic Waters [8] projektje elnyerte a Pulitzer-díjat. Az adatújságírás és a riportújságírás metszéspontjában az újságírói anyagok egyik legfontosabb példájává vált . A projekt részeként egy újságírócsapat infografikákat, interaktív térképeket, felméréseket és adatokat készített az Egyesült Államok különböző államaiban tapasztalható ivóvíz-szennyezettségi szint vizsgálatáról szóló szakmai dokumentumok elemzése alapján . A projekten dolgozó újságírókból álló csapat a vízszennyezési problémák elemzése mellett azt is tanulmányozta, hogy bizonyos anyagok nagy dózisai milyen egészségügyi kockázatokat okozhatnak, így a projekt egy tudományos újságírói tanulmánynak tűnik.
Az adatújságírás fejlődésének új fordulója a Wikileaksnek köszönhetően elérhetővé tett információk megjelenítése . Az Associated Press újságírói , Jonathan Stray és Julian Burgess a The Overview Project és a Gephi nyílt forráskódú vizualizációs eszközöket használták 391 832 dokumentum feldolgozására, és az iraki háborúról szóló számos, egymástól eltérő jelentés megjelenítésére [9] . A projekt részeként az újságírók olyan címkefelhőt hoztak létre, amely a Wikileaks projekttől kapott iraki katonai műveletekről szóló teljes dokumentumcsomagban megtalálható. Az így létrejött vizualizáció lehetővé tette a dokumentumok kulcsszavainak kiemelését: „letartóztatott”, „megölt”, „robbanékony”, „megkínozták”. A vizualizáció megjegyzésében [10] az újságírók megjegyezték, hogy a rendelkezésre álló adatok szerint körülbelül 4000 amerikai katona és körülbelül 100.000 civil vesztette életét az iraki műveletek során. Több tízezer bejelentett lövöldözés és kínzás tette lehetővé az újságírók számára, hogy bizonyossággal kijelenthessék, hogy a kormány sok tényt elfedett az iraki hadművelettel kapcsolatban.
2012-ben a Global Editors Network megszervezte a Data Journalism Awards díját [11] . Azóta minden évben több kategóriában osztanak ki díjakat, köztük a legjobb adatvizualizációt, az év nyomozását, a legjobb személyes portfóliót, a legjobb médiawebhelyet és egyebeket.