„Pastebėjome, kad atvirų duomenų rinkiniai yra naudojami ne pagal paskirtį. Kokia yra atvirų duomenų paskirtis? Bendroms tendencijoms, reiškiniams stebėti, paplitimui, vidurkiams, dinamikai vertinti, bendrinėms išvadoms daryti, statistinėms analizėms, įžvalgoms, prognozėms, edukacijai, – rašoma feisbuko paskyroje „Valstybės duomenų analitika“ – Kokia nėra atvirų duomenų paskirtis? Sensacingų istorijų apie pavienius atvejus paieškai, detektyviniam tyrinėjimui, potencialių aplinkkelių, galimai palengvinančių netiesioginį asmens identifikavimą, ieškojimui ir išnaudojimui.“
Kaip praneša Statistikos departamentas, nuo šiol COVID-19 atvirų duomenų rinkiniuose nebeliks jokių papildomų duomenų apie jaunesnius nei 20 metų amžiaus asmenis.
„Pavyzdžiui, nuo COVID-19 mirus 0-19 metų amžiaus asmeniui, nebus įmanoma nustatyti, kokia to asmens lytis, koks tikslus amžius, kokioje savivaldybėje asmuo gyveno; paskiepijus 0-19 metų amžiaus asmenį, nebus įmanoma nustatyti, kur asmuo buvo skiepytas, kokioje asmens sveikatos priežiūros įstaigoje registruotas, ar kuri įstaiga skiepijo“, – rašoma feisbuko paskyroje.
Valstybės duomenų analitikos informacija.
Jau dabar cenzūruoti duomenų rinkiniai – čia.
Statistikos departamentas teigia, kad dėl tokio veiksmo apgailestauja.
Valstybės duomenų analitikos informacija.
Pirmadienio popietę Statistikos departamentas išplatino pranešimą, kad nuo gruodžio 28 d. neteikia detalių COVID-19 duomenų apie jaunesnius nei 20 metų amžiaus asmenis – taip buvo nuspręsta siekiant apsaugoti asmenis nuo piktnaudžiavimo duomenimis, kuomet bandoma identifikuoti konkrečius asmenis.
„Šiuo metu pastebime nerimą keliančią tendenciją, kai atviri duomenys yra panaudojami ne tik analizėms, bet ir detektyvinėms konkrečių žmonių paieškoms, kuriamos sensacingos istorijos“, – skelbia Statistikos departamentas.
„Patiksliname, kad mirties, skiepijimo ar užsikrėtimo faktai iš duomenų rinkinių niekur nedingsta, tiesiog yra nerodomi papildomi požymiai (savivaldybė ir lytis). Stengiamės rasti balansą tarp privatumo apsaugojimo ir visuomenės informavimo, – skelbia Statistikos departamentas. – Tai taikoma atvirų duomenų rinkiniams, kuriuose įprastai skelbiama informacija detaliausiu įmanomu lygmeniu. Švieslentėse skelbiamus apibendrintus COVID-19 pandemijos rodiklius galimos asmens identifikacijos atžvilgiu vertiname atskirai.“
Dėl tokio sprendimo kritikos neslėpė duomenų mokslininkas Vaidotas Zemlys-Balevičius. Anot jo, praėjusieji metai duomenų atžvilgiu buvo visai neblogi. Statistikos departamentui perėmus duomenų skelbimą iš Nacionalinio visuomenės sveikatos centro (NVSC), Lietuvos COVID-19 duomenys tapo vieni detaliausių pasaulyje.
„Atvejų duomenys pagal vakcinaciją, mirčių duomenys po vakcinacijos ir po užsikrėtimo COVID-19 buvo vieni iš geriausių atvirų duomenų pavyzdžių. Todėl ypatingai liūdna, kad metų pabaigoje dėl nelabai suprantamų priežasčių iš atvirų duomenų buvo sugadinti visi 0-18 metų amžiaus grupių duomenys. Tiek atvejų, tiek mirčių, tiek vakcinacijos duomenys tapo cenzūruoti. Nesimato lyties ir savivaldybės. Tai gana informatyvios amžiaus piramidės prarado savo pagrindą bei visiškai neaišku, kurioje Lietuvos vietoje vaikų sergamumas yra didžiausias. Prisimenant, kad būtent vaikų atvejai sudarė ženklią dalį delta bangos atvejų, ateinant omikron bangai tai žinoti yra labai svarbu, – feisbuke rašė matematikas. – Vaikų duomenys yra jautrūs ir turėjome nemalonių incidentų, kurie gana plačiai nuskambėjo (turiu omenyje antivakserių šlykščiai išviešintas jaunų žmonių mirtis). Jautrius duomenis reikia cenzūruoti, bet tai reikia daryti taip, kad nebūtų pažeidžiamas visuomenės interesas žinoti, kokia yra objektyvi epidemiologinė situacija Lietuvoje. Tam tikras cenzūravimas duomenyse anksčiau jau buvo, nes visados buvo tam tikras mažas atvejų (susirgimų, vakcinacijų ir mirčių) skaičius, kuriam dėl duomenų suvedimo klaidos nebuvo galima nustatyti savivaldybės, amžiaus ar lyties.“
Jautrius duomenis galima „slėpti“ triukšme. Aišku, taip darant svarbu pasirūpinti, kad bendras vaizdas nėra iškreipiamas, bet tai ir yra statistikos kaip mokslo esmė: eliminuoti triukšmą neiškraipant signalo. Tai pasirinktas 0-18 amžiaus grupių duomenų cenzūravimas prieštarauja pačiai statistikos esmei.
Anot V. Zemlio-Balevičiaus, tokių atvejų buvo mažiau nei procentas. Anot jo, jautrius atvejus galima labai paprastai priskirti prie neišaiškintų atvejų, trumpai nurodant, kodėl jie ten atsidūrė.
„Su statistiniais duomenimis tai yra visiškai normali praktika. Triukšmas juose yra neišvengiamas, tai jautrius duomenis galima „slėpti“ triukšme. Aišku, taip darant svarbu pasirūpinti, kad bendras vaizdas nėra iškreipiamas, bet tai ir yra statistikos kaip mokslo esmė: eliminuoti triukšmą neiškraipant signalo. Tai pasirinktas 0-18 amžiaus grupių duomenų cenzūravimas prieštarauja pačiai statistikos esmei. Tikiuosi, kad šis sprendimas bus peržiūrėtas ir pasirinktas toks, kuris leis vėl matyti pilną vaizdą tuo pačiu neatveriant jautrių duomenų“, – rašė matematikas.
Anot jo, nors epidemija, tikėtina, 2022 metais pasibaigs, tai nereiškia, kad su COVID-19 duomenimis nieko papildomai daryti nereikia. Jis teigė nemanąs, kad COVID-19 yra paskutinė pandemija, tad labai svarbu išmokti pamokas tam, kad kitą kartą būtume pasiruošę tinkamai.
„Iš paprastų darbų, tai pirmiausia norėtųsi matyti detalesnius hospitalizacijos duomenis. Kol kas neturime jokio pasiskirstymo pagal amžių. Kiek žinau, tokie duomenys vėluoja mėnesį ir ilgiau, bet tai nėra priežastis neskelbti istorinių duomenų. Vienas iš gajų mitų visuomenėje yra tai, kad vaikai COVID-19 suserga be pasekmių. Tai nėra tiesa ir hospitalizacijos duomenys pagal amžiaus grupes leistų tiksliai įsivertinti, kokia vis dėlto yra rizika“, – rašė V. Zemlys-Balevičius.
Anot jo, kitas paprastas darbas – tai kas savaitinė duomenų apžvalga. „Dabar yra skelbiami dienos duomenys ir tai yra gerai, bet turi būti kas savaitę skelbiama detalesnė epidemiologinių duomenų apžvalga. Pavyzdys gali būti Vyriausybės daromos apžvalgos, bet jos turi būti daromos nuolatos. Savaitines apžvalgas daro kitos šalys ir jose paprastai būna ženkliai daugiau naudingos informacijos negu dienos duomenyse. Padarius jas Lietuvoje bendras visuomenės supratimas tikrai pagerėtų. Jau dabar iš esamų Vyriausybės apžvalgų galima surinkti geriausias vizualizacijas ir jas publikuoti kas savaitę. Jeigu neišeina kas savaitę, tai bent kas dvi, arba kas mėnesį. Epidemiologinių apžvalgų vakuumą dabar užpildo antivakseriai, kurie prisivyšniauja sau palankių faktų iš kitų šalių. Deja, jų propagandą sunku atremti, nes tiesiog nėra ką jiems pastatyti prieš“, – sakė specialistas.
Jo teigimu, laukia trys sudėtingi darbai.
Epidemiologinių apžvalgų vakuumą dabar užpildo antivakseriai, kurie prisivyšniauja sau palankių faktų iš kitų šalių. Deja, jų propagandą sunku atremti, nes tiesiog nėra ką jiems pastatyti prieš.
Pirmasis – NVSC reforma. „NVSC dabar yra tapęs Nacionaliniu atvejų neatsekamumo centru ir yra Lietuvos epidemiologinių duomenų gėda. Lietuva stebuklingai gerai tvarkosi su tokia neįgalia institucija. Neįsivaizduoju, kaip tai padaryti. Vienas iš pavyzdžių yra JK, kur tvarkymuisi su COVID-19 buvo sukurta atskira agentūra“, – rašė matematikas.
Antras sudėtingas darbas – e.sveikatos reforma. „E.sveikata čia vadinsiu visus sveikatos duomenų IT sistemas. Tai, kad mes neturime aktualių hospitalizacijos duomenų, yra viena iš mažesnių e.sveikatos problemų. Kita didžiulė problema – jos nuolatinis striginėjimas ir tai, kad suvedamos formos neturi absoliučiai jokios duomenų validacijos galimybės. Dabar plačiai nuskambėjusį antikūnų klausimą būtų galima išspręsti su e.sveikatos duomenimis, jeigu antikūnų tyrimai būtų suvedami pagal vienodą standartą. Deja, dabar ten yra mišrainė iš skirtingų laboratorijų suvedamų duomenų“, – aiškino duomenų mokslininkas.
Duomenų validavimas, anot jo, yra sudėtinga problema, bet neužsitikrinant duomenų suvedimo kokybės, patys duomenys praranda savo vertę.
„Tai, kad leidžiama suvesti prastus duomenis, kurių po to neįmanoma normaliai panaudoti, yra skandalas, dėl kurio Registrų centro direktorius turėtų lėkti iš kėdės, o ne gauti solidžią premiją“, – dėstė V. Zemlys-Balevičius.
Trečias sudėtingas darbas – akademinių institucijų įgalinimas. Anot mokslininko, epidemija parodė, kad akademinės institucijos labiausiai atsiperka krizės metu.
„Nes būtent tada praverčia tos žinios, kurias per visą gyveimą sukaupė akademikai, nagrinėdami problemas, kurios įprastai niekam nėra įdomios. Lietuvoje per du epidemijos metus akademinės institucijos suvaidino periferinį vaidmenį. Antivakseriai, prisidengdami akademinėmis institucijomis, sėkmingai stumia savo propagandą ir nors ją bando atremti sveikatos ekspertų tarybų nariai, jie gaišta tam laiką vietoje to, kad darytų tyrimus, kurie vienareikšmiškai parodytų, kokia yra reali situacija, o ne antivakserių sukurta įsivaizduojama fantazija. Kitose šalyse susiformavo ne viena akademikų grupė, kurių vykdomų tyrimų išvados dabar yra naudojamos kaip argumentai epidemijos valdymo krypties pasirinkimui, bet Lietuvoje tokių tyrimų buvo tik keli. Deja, tai išspręsti bus sunku, nes tai susiję su finansavimu, o mokslo Lietuvoje nė viena vyriausybė normaliai nefinansavo. Tai yra strateginė klaida, nes silpnas mokslas tampa nacionalinio saugumo problema. Antivakserių propaganda tikrai nebūtų tokia efektyvi, jeigu akademinė bendruomenė būtų ženkliai stipresnė ir turėtų didesnį visuomenės pasitikėjimą negu jis dabar yra Lietuvoje“, – rašė duomenų mokslininkas.
Naujausi komentarai