Mezinárodní tým vědců, mezi nimiž je i Vladimír Ulman z IT4Innovations, představil doporučení MIFA (Metadata, Incentives, Formats, Accessibility). Ta mají urychlit rozvoj umělé inteligence (AI) při analýze biologických obrazů. Cílem je zpřístupnit rozsáhlé a kvalitně anotované datasety, aby se AI mohla lépe učit a mohla potom rychleji a přesněji analyzovat mikroskopické snímky buněk, molekul a tkání.

Analýza biologických obrazů pomocí AI je dnes nezbytná – umožňuje například segmentovat buňky či molekulární struktury a zpracovávat obrovské objemy dat, které moderní mikroskopy generují. Pro rozvoj takových metod jsou ale nutná rozsáhlá, různorodá a kvalitně anotovaná data, která jsou zatím často roztříštěná, různě formátovaná a obtížně dostupná.

Právě tento problém řeší doporučení MIFA, která se opírají o čtyři hlavní zásady:

  • snížení rozmanitosti formátů – používání otevřených a snadno dostupných formátů, například OME-Zarr, GeoJSON, EMDB-SFF nebo COCO;
  • standardizace metadat – jednotné popisy dat a anotací umožní lepší porozumění a efektivnější využití datasetů;
  • zvýšení přístupnosti dat – podpora otevřených repozitářů, jako je například BioImage Archive nebo v rámci EOSC nově budovaný archiv pro Czech Bioimaging, usnadní vyhledávání a sdílení dat;
  • motivace k tvorbě datových sad – systematické sdílení a anotace dat.

Jedním ze spoluautorů MIFA je Vladimír Ulman z IT4Innovations, který doporučení MIFA představil i na konferenci EOSC National Tripartite Event v Brně. Zdůraznil význam výpočetní infrastruktury: „Abychom mohli vyvíjet AI pro bioobrazovou analýzu, potřebujeme rozsáhlé a kvalitně anotované datasety. To vyžaduje čas, úsilí i investice. Bez FAIR repozitářů a výkonných výpočetních zdrojů, dostupných například přes EOSC, se tyto metody těžko vytvářejí.

Na doporučeních MIFA, publikovaných v prestižním časopise Nature Methods, spolupracovali vědci z Česka, Velké Británie, Itálie, Německa, Španělska, Francie, Švédska a USA. Tento společný výsledek představuje důležitý krok k otevřenějším, dostupnějším a efektivnějším AI nástrojům pro biomedicínský výzkum.

 

Odborný článek:
MIFA: Metadata, Incentives, Formats, and Accessibility guidelines to improve the reuse of AI datasets for bioimage analysis 
https://www.nature.com/articles/s41592-025-02835-8 

* Ilustrační obrázek převzat z článku: Zulueta-Coarasa, T., Jug, F., Mathur, A. et al. MIFA: Metadata, Incentives, Formats and Accessibility guidelines to improve the reuse of AI datasets for bioimage analysis. Nat Methods (2025). https://doi.org/10.1038/s41592-025-02835-8, Fig. 1.