Tudomány

10 millió adatigénylés: Hogyan követte nyomon Covidot a Times csapat

Times Insider elmagyarázza, kik vagyunk és mit csinálunk, és betekintést enged a kulisszák mögé, hogyan áll össze újságírásunk.

Ma reggelig a New York Times fejlesztői által írt programok több mint 10 millió kérelmet nyújtottak be a Covid-19 adatokra a világ minden részéről. Az általunk gyűjtött adatok napi felvételek a vírus apadásáról, beleértve az egyes amerikai államokat és az Egyesült Államok ezer megyéjét, városát és irányítószámát.

Lehet, hogy ezen adatok szeleteit látta a napi térképek és grafikák közzétesszük a The Times-ban. Ezek az oldalak együttesen, amelyekben több mint 100 újságíró és mérnök vett részt a szervezet egészéből, a legnézettebb gyűjtemény a nytimes.com és kulcsfontosságú elemei a a Covid-jelentések csomagja amely elnyerte a The Times-nak a közszolgálatért 2021-es Pulitzer-díjat.

A Times koronavírus-követési projektje egyike azon számos erőfeszítésnek, amelyek segítettek kitölteni a lakosság megértésének hiányát a világjárvány miatt, amelyet a koordinált kormányzati válasz hiánya okozott. A Johns Hopkins Egyetem Coronavirus Resource Center hazai és nemzetközi esetadatokat gyűjtött. És a Covid nyomkövető projekt az atlanti térségben önkéntesek seregét bonyolította le az Egyesült Államok állami adatainak összegyűjtésére a tesztelés, a demográfiai adatok és az egészségügyi intézmények adatai mellett.

A The Times-nál munkánk egyetlen táblázattal kezdődött.

2020 január végén Monica Davey, a National pult szerkesztője felkérte Mitch Smith-et, chicagói székhelyű tudósítót, hogy kezdjen információkat gyűjteni az egyes egyesült államokbeli Covid-19 esetekről. Esetenként egy sor, amelyet a nyilvános bejelentések alapján gondosan jelentenek, és kézzel adják meg, részletekkel, mint az életkor, a hely, a nem és az állapot.

Március közepére a vírus robbanásszerű növekedése túl soknak bizonyult a munkafolyamatunk számára. A táblázat olyan nagyra nőtt, hogy válaszképtelenné vált, és az újságíróknak nem volt elegendő idejük kézi jelentésre és adatok beírására az amerikai államok és megyék folyamatosan növekvő listájáról, amelyek nyomon követésére szükségünk volt.

Ekkor számos hazai egészségügyi osztály kezdte meg a Covid-19 jelentési erőfeszítéseinek és webhelyeinek bevezetését, hogy tájékoztassa alkotóit a helyi elterjedésről. A szövetségi kormány korai kihívásokkal szembesült az ellátás terén egyetlen, megbízható szövetségi adatkészlet.

A rendelkezésre álló helyi adatok szó szerint és átvitt értelemben a térképen voltak. A formázás és a módszertan helyenként változó.

A The Times-on belül egy újságterületen működő szoftverfejlesztők csoportját gyorsan arra bízták, hogy készítsen eszközöket az adatgyűjtési munka minél nagyobb kiterjesztése érdekében. Mi ketten – Tiff újságtermi fejlesztő, Josh pedig grafikai szerkesztő – végül megformálnánk ezt az egyre növekvő csapatot.

Március 16-án az alapalkalmazás jórészt működött, de segítségre volt szükségünk sokkal több forrás leküzdésében. Ennek a kolosszális projektnek a megoldására a vállalat egész területéről fejlesztőket toboroztunk, akiknek sok volt a sajtószolgáltatás nélküli tapasztalata, hogy átmenetileg felvegyék a kaparókat.

Április végére programszerűen gyűjtöttük a számokat mind az 50 államból és közel 200 megyéből. De úgy tűnt, hogy a pandémia és az adatbázisunk is exponenciálisan bővül.

Néhány figyelemre méltó webhely néhány hét alatt többször megváltozott, ami azt jelentette, hogy többször is át kellett írnunk a kódunkat. Újságtermi mérnökeink úgy alakultak, hogy egyszerűsítették egyedi eszközeinket – miközben mindennapi használatban voltak.

A kaparócsoporton kívül 50 ember vett részt aktívan az általunk gyűjtött adatok napi kezelésében és ellenőrzésében. Bizonyos adatokat továbbra is kézzel írnak be, és az újságírók és kutatók mindezt manuálisan ellenőrzik, a hét minden napján végzett műveletet. A jelentési szigor és a tárgyi folyékonyság elengedhetetlen része volt minden szerepünknek, az újságíróktól az adatellenőrökön át a mérnökökig.

Amellett, hogy adatokat közöltünk a The Times weboldalán, elkészítettük az adatsort nyilvánosan elérhető a GitHub oldalon 2020 március végén bárki számára.

Oltásokként megfékezni a vírus díját országszerte – összességében 33,5 millió esetet jelentettek – számos egészségügyi osztály és más forrás ritkábban frissíti adatait. Ezzel szemben a szövetségi betegségmegelőzési és -megelőzési központok kibővítették jelentését olyan átfogó adatokkal, amelyek 2020-ban csak részben voltak elérhetőek.

Mindez azt jelenti, hogy néhány saját egyéni adatgyűjtésünk képes le kell állítani. 2021 áprilisa óta az automatizált források száma közel 44 százalékkal csökkent.

Célunk, hogy nyár végéig vagy kora őszig körülbelül 100 aktív kaparóba kerüljünk, elsősorban a potenciális forró pontok nyomon követésére.

Az álom természetesen az, hogy befejezzük erőfeszítéseinket, mivel a vírus veszélye lényegesen alábbhagy.

A változat E cikk eredetileg a NYT Open, A The New York Times blogja a termékek tervezéséről és építéséről a hírekhez.