Siirry pääsisältöön Siirry hakuun
Sivu päivitetty 29.12.2023

PHASE IV AI – Privacy compliant health data as a service for AI development

Datapohjaiset työkalut (esp. AI) tarvitsevat yleensä suuren määrän dataa relevanssin ja tarkkuuden saavuttamiseksi. Siksi tällaisten työkalujen kehittäminen terveydenhuollon ratkaisuja varten edellyttää, että validoituja, kooltaan sopivia tietokokonaisuuksia voidaan soveltaa laaja-alaisesti suuriin populaatioihin. Tietojen soveltaminen terveydenhuollossa on kuitenkin nykyään hankalaa terveystietojen arkaluonteisuuden ja korkean yksityisyyden suojan vuoksi. 
 
Datalähtöiset lähestymistavat eivät välttämättä toimi pienen paikallisen väestön sairauksissa. De-identifikaatio ei useinkaan ole tarpeeksi vahvaa tai nykypäivän de-identifiointistrategiat eivät johda vaadittuun tilastolliseen voimaan. Näin ollen tällaisia sairauksia ei aina voida optimaalisella tavalla tutkia tekoälypohjaisella tekniikalla olemassa olevien anonymisointi- tai syntetisointitekniikoiden rajoitusten vuoksi. Synteettinen data ja federoitu oppiminen auttavat tässä, koska ne helpottavat tietojen jakamista vaarantamatta tietoturvaa.  
Synteettiset tiedot voidaan validoida taustalla olevien reaalimaailman tietojen avulla. Synteettisen tiedon tuottamisen kriteerit ovat tällä hetkellä tutkimuksen kohteena, ja niillä pyritään varmistamaan, että tieto on yleisesti käyttökelpoista. Lisäksi laadunarviointi- ja validointityökaluista puuttuu myös hyödyllisyys- ja yksityisyyskriteereitä mittaava laatumittari.  

Tavoitteet:  

  • Parannetut teknologiat (federoidulle) anonymisoinnille ja terveystietojen syntetisoinnille vahvoilla de-identifiointiominaisuuksilla  
  • Mahdollistetaan tekoälyn kehittäjille pääsy suurempiin tietoaltaisiin federoidun oppimisen avulla helppokäyttöisten ja mukautettavien tietopalveluiden avulla  
  • Data Marketin perustaminen - helpotetaan tietojen jakamista ja luodaan kannustimet tietojen tarjoamiseen palveluille  
  • Integroidaan datamarkkinat ja datan palveluekosysteemi eurooppalaiseksi terveystietojen keskukseksi (EHDS, European Health Data Space).  

Turun ammattikorkeakoulu tutkii paikallisia ja globaaleja painoaggregointimalleja, jotka on laadittu differentiaalisen yksityisyyden tekniikoilla. Näin voidaan kehittää skaalautuvia, monikerroksisia ja turvallisia federoidun oppimisen järjestelmiä terveystietojen yksityisyyden säilyttämiseksi. Tutkimme myös menetelmiä synteettisten lääketieteellisten kuvien arvioimiseksi kliinisen ja yksityisyyden näkökulmista. Käytämme myös mahdollisesti tilastollisia ja matemaattisia tekniikoita arvioimaan tekoälymallien generoimia synteettisiä tietoja yksityisyyden takuiden osalta FL- ja DP-malleissa.

Phase ja Horizon_logot.png