Mezinárodní tým vědců, mezi nimiž je i Vladimír Ulman z IT4Innovations, představil doporučení MIFA (Metadata, Incentives, Formats, Accessibility). Ta mají urychlit rozvoj umělé inteligence (AI) při analýze biologických obrazů. Cílem je zpřístupnit rozsáhlé a kvalitně anotované datasety, aby se AI mohla lépe učit a mohla potom rychleji a přesněji analyzovat mikroskopické snímky buněk, molekul a tkání.
Analýza biologických obrazů pomocí AI je dnes nezbytná – umožňuje například segmentovat buňky či molekulární struktury a zpracovávat obrovské objemy dat, které moderní mikroskopy generují. Pro rozvoj takových metod jsou ale nutná rozsáhlá, různorodá a kvalitně anotovaná data, která jsou zatím často roztříštěná, různě formátovaná a obtížně dostupná.
Právě tento problém řeší doporučení MIFA, která se opírají o čtyři hlavní zásady:
- snížení rozmanitosti formátů – používání otevřených a snadno dostupných formátů, například OME-Zarr, GeoJSON, EMDB-SFF nebo COCO;
- standardizace metadat – jednotné popisy dat a anotací umožní lepší porozumění a efektivnější využití datasetů;
- zvýšení přístupnosti dat – podpora otevřených repozitářů, jako je například BioImage Archive nebo v rámci EOSC nově budovaný archiv pro Czech Bioimaging, usnadní vyhledávání a sdílení dat;
- motivace k tvorbě datových sad – systematické sdílení a anotace dat.
Jedním ze spoluautorů MIFA je Vladimír Ulman z IT4Innovations, který doporučení MIFA představil i na konferenci EOSC National Tripartite Event v Brně. Zdůraznil význam výpočetní infrastruktury: „Abychom mohli vyvíjet AI pro bioobrazovou analýzu, potřebujeme rozsáhlé a kvalitně anotované datasety. To vyžaduje čas, úsilí i investice. Bez FAIR repozitářů a výkonných výpočetních zdrojů, dostupných například přes EOSC, se tyto metody těžko vytvářejí.“
Na doporučeních MIFA, publikovaných v prestižním časopise Nature Methods, spolupracovali vědci z Česka, Velké Británie, Itálie, Německa, Španělska, Francie, Švédska a USA. Tento společný výsledek představuje důležitý krok k otevřenějším, dostupnějším a efektivnějším AI nástrojům pro biomedicínský výzkum.
Odborný článek:
MIFA: Metadata, Incentives, Formats, and Accessibility guidelines to improve the reuse of AI datasets for bioimage analysis
https://www.nature.com/articles/s41592-025-02835-8
* Ilustrační obrázek převzat z článku: Zulueta-Coarasa, T., Jug, F., Mathur, A. et al. MIFA: Metadata, Incentives, Formats and Accessibility guidelines to improve the reuse of AI datasets for bioimage analysis. Nat Methods (2025). https://doi.org/10.1038/s41592-025-02835-8, Fig. 1.