Začátkem prosince se v Ostravě uskutečnil další ročník Národní konference EOSC CZ s podtitulem Long Live Research Data. Dvoudenní setkání propojilo více než 100 odborníků z univerzit, výzkumných organizací, datových center, knihoven, grantových agentur i státních institucí. Program nabídl plenární přednášky, panelové diskuse i praktické workshopy zaměřené na aktuální výzvy v oblasti správy, sdílení a opětovného využívání vědeckých dat.

IT4Innovations, jakožto školicí centrum EOSC CZ, se aktivně podílelo na organizaci konference. Vědecký ředitel Tomáš Kozubek byl jedním ze zvaných hostů a představil nové služby a infrastrukturu národního superpočítačového centra.

Od správy dat po rozvoj dovedností

První den konference byl věnován třem hlavním tematickým okruhům – Nástroje pro správu dat, Příběhy (opětovného) využití dat a Rozvoj datových dovedností.

Nástroje pro správu dat

Hlavní přednášku zahájil Petr Knoth (The Open University, UK), který zdůraznil roli institucí při správě vědeckých výstupů: „Instituce by měly převzít odpovědnost za správu a uchování výsledků výzkumu, které vznikají díky jejich akademikům. Zároveň by měly alespoň metadata těchto výstupů zpřístupnit veřejnosti ve strojově čitelné podobě prostřednictvím svých repozitářů. Tím lze zajistit dlouhodobou otevřenost a FAIR přístup k výzkumným datům a zároveň udržet otevřený vědecký ekosystém decentralizovaný a odolný vůči monopolům třetích stran,“ uvedl Knoth.

Navazující příspěvky představily konkrétní řešení z českých výzkumných organizací. Petra Černohlávková (Národní technická knihovna) upozornila na zásadní význam perzistentních identifikátorů (PID): „Bez PID a přidružených metadat se ztrácí dohledatelnost a viditelnost výzkumu. Je to drobný, ale klíčový krok k férovému a efektivnímu sdílení výzkumných dat,“ shrnula.

Jan Fousek z CEITEC MU přiblížil budování multimodálních repozitářů pro obrazová a fyziologická data, Antonín Fejfar (Fyzikální ústav AV ČR) se věnoval platformě OneData a Illyria Brejchová (ÚVT MU) popsala zkušenosti s integrací repozitářů do uživatelských systémů.

Příběhy (opětovného) využití dat

Ve druhém tematickém bloku se Martin Komenda (ÚZIS ČR) zaměřil na příběhy dat z Národního zdravotnického informačního systému, formáty jejich sdílení a společenský dopad: „Data jsou příběhy o zdraví společnosti. Jejich zodpovědné sdílení a správná interpretace umožňují lépe chápat veřejné zdraví, podporují orientaci v celém zdravotním systému a zvyšují důvěru ve vědu a výzkum.“

Panel následně představil příklady opětovného využití dat napříč obory – od biomedicíny až po informatiku. Jaroslav Oľha (LF MU) ukázal možnosti sdílení dat z RNA sekvenování, Monika Čechová (FI MU) sdílela zkušenosti z informatiky a Marek Cebecauer (ÚFCH JH AV ČR) představil automatizované nástroje pro zrychlení datového sdílení.

Rozvoj datových dovedností

Závěrečný odborný blok otevřel Ladislav Krištoufek, prorektor Univerzity Karlovy pro výzkum. Ve své přednášce Data Matters – and Data Matter hovořil o proměně výzkumného prostředí a potřebě nových kompetencí: „Dnešní výzkum vyžaduje nejen data, ale i schopnost s nimi pracovat – v týmu, napříč disciplínami a s respektem k principům reprodukovatelnosti. Ne každý musí umět všechno, ale každý musí chápat, že výzkum je týmová činnost,“ upozornil Ladislav Krištoufek.

V navazujících příspěvcích zazněly zkušenosti s výukou a certifikací data stewarek a stewardů z univerzit ve Vídni a Praze. Michael Feichtinger (University of Vienna) a Jan Dvořák (FF UK) představili nové vzdělávací programy zaměřené na rozvoj kompetencí v oblasti správy výzkumných dat. Jan Vališ (Národní technická knihovna) ve svém příspěvku ukázal, jak lze systematicky posilovat dovednosti v oblasti výzkumných dat a otevřené vědy. Georgia Koutentaki (FIT ČVUT) pak upozornila na roli data stewardek a stewardů v akademickém vzdělávání.

Diskuze o dovednostech i generacích výzkumníků

V panelové diskuzi, kterou moderoval Matej Antol, hlavní manažer EOSC CZ, účastníci rozpoutali debatu o tom, že úspěšná správa výzkumných dat vyžaduje nejen nové nástroje, ale především změnu přístupu samotných výzkumníků. „Mnoho problémů v práci s daty pramení z toho, že výzkumníci často ani přesně nevědí, s jakými daty pracují. Základem je naučit se data chápat a popisovat,“ zaznělo během diskuze.

Panelisté se také shodli, že technické nástroje samy o sobě nestačí. Budoucnost výzkumné práce podle nich stojí na systematickém myšlení, precizní dokumentaci a otevřené komunikaci. Právě data stewardky a stewardi podle diskutujících ukazují, že úspěch v této oblasti nestojí jen na technických znalostech, ale především na měkkých dovednostech – umění komunikace, empatii a schopnosti naslouchat.

Závěr panelu se nesl ve znamení apelu na institucionální podporu. „Data stewardky a stewardi mohou nabízet pomoc, ale pokud instituce sama neprojeví závazek a nenastaví vhodné prostředí, zůstane jejich práce bez efektu,“ shrnula Georgia Koutentaki.

Praktické workshopy a poster session

Druhý den konference patřil praktickým workshopům. Účastníci v sekci Young Researchers se zaměřili na FAIR principy, práci s metadaty a využívání služeb národní datové infrastruktury. Paralelně probíhal blok Repo Builders, který se věnoval budování repozitářů, právním a licenčním otázkám a praktickému využití nástrojů jako Dataspecer či Persistent Identifiers (PID).

V rámci Poster Session odborná porota ocenila tři nejlepší projekty. Hlavní cenu za nejlepší poster získal poster autorů Radovana Tomášika, Ivana Mahúta a Simony Menšíkové s názvem Privacy-Preserving Data Quality Assessment for Federated Health Data Networks. Vítězný příspěvek zaujal inovativním přístupem k hodnocení kvality zdravotnických dat v decentralizovaných datových sítích při zachování ochrany soukromí.

Další fotografie: www.eosc.cz