OMOP CDM Usein kysyttyjä kysymyksiä

1. Ymmärrän, että yhteinen tietomalli (CDM) on tapa järjestää erilaisia tietolähteitä samaan relaatiotietokannan suunnitteluun, mutta miten se voi olla tehokas, koska monet tietokannat käyttävät erilaisia koodausjärjestelmiä?

extract, transform, load (ETL) – prosessin aikana, jossa tietolähde muunnetaan OMOP-yhteiseksi tietomalliksi, standardoimme rakenteen (esim. taulukot, kentät, tietotyypit), konventiot (esim. säännöt, jotka säätelevät lähdetietojen esittämistä) ja sisällön (esim. mitä yhteisiä sanastoja käytetään saman kielen puhumiseen kliinisillä alueilla). Yhteinen tietomalli säilyttää kaiken lähdeaineiston, mukaan lukien alkuperäiset lähdesanastokoodit, mutta lisää standardoidut sanastot mahdollistamaan verkkotutkimuksen koko OHDSI-tutkimusyhteisössä.

2. Miten tietoni muuttuvat yhteiseksi tietomalliksi?

sinun tai jonkun organisaatiosi jäsenen on luotava prosessi CDM: n rakentamiseksi. Älä kuitenkaan huoli, et ole yksin! Yhteisön avoimuus tarkoittaa sitä, että suuri osa muiden osallistujien kirjoittamasta koodista omien tietojensa muuttamiseksi on sinun käytettävissäsi. Jos sinulla on datalisenssi suurelle hallinnolliselle korvaustietokannalle, kuten IBM MarketScan® tai Optumin Clinformatics® Extended Data Mart, on todennäköistä, että joku on jo tehnyt jalkatyön. Tässä on yksi esimerkki täysi rakentaja vapaasti saatavilla GitHub, joka on kirjoitettu erilaisia tietolähteitä.

yhteisöfoorumit ovat myös oiva paikka esittää kysymyksiä, jos on jumissa tai kaipaa opastusta siitä, miten tietoja voi edustaa yhteisessä tietomallissa. Jäsenet ovat yleensä hyvin reagoiva!

3. Ovatko taulukot tai kentät valinnaisia?

kaikkien taulukoiden oletetaan olevan CDM: ssä, vaikka ei vaadita, että ne kaikki ovat asuttuja. Kaksi pakollista taulukkoa ovat:

  • henkilö: sisältää tietueita, joilla yksilöidään Lähdetiedoissa jokainen potilas, joka on vaarassa saada kliinisiä havaintoja lähdejärjestelmiin.
  • Observation_period: sisältää tietueet, jotka yksikäsitteisesti määrittelevät ajan, jonka ajan henkilöllä on riski saada kliinisiä tapahtumia kirjattavaksi lähdejärjestelmiin.

on sitten sinusta kiinni, mitkä taulukot kansoittavat, vaikka ydintapahtumataulukot ovat yleensä Condition_occurrence, Procedure_occurrence, Drug_ Exposure, Measurement, and Observation. Jokaisessa taulukossa on tietyt vaaditut kentät, joista täydellinen luettelo löytyy Common Data Model wiki-sivulta.

4. Sisältyykö tietomalliin johdettua tietoa? Mitkä taulukot tai arvot on johdettu?

yhteinen tietomalli tallentaa sanatarkasti lähteestä saatuja tietoja eri kliinisiltä aloilta, kuten tiloja, lääkkeitä, toimenpiteitä ja mittauksia koskevat tiedot. Lisäksi yhteinen tietomalli tarjoaa analyytikon avuksi myös joitakin johdettuja taulukoita, jotka perustuvat yleisesti käytettyihin analyyttisiin menetelmiin. Esimerkiksi Condition_era-taulukko on johdettu Condition_occurrence-taulukosta ja sekä Drug_era-että Dose_era-taulukot ovat peräisin Drug_exposure-taulukosta. Era määritellään ajanjaksoksi, jolloin potilaalla oletetaan olevan tietty tila tai altistuminen tietylle vaikuttavalle aineelle. Yhteisön jäsenet ovat kirjoittaneet koodin luoda nämä taulukot ja se on pois github jos päätät käyttää sitä CDM rakentaa. On tärkeää vahvistaa, analyytikolla on mahdollisuus, mutta ei velvoitetta, käyttää mitä tahansa johdettuja taulukoita ja kaikki lähdeaineisto on edelleen käytettävissä suoraan käyttöön, jos analyysi edellyttää erilaisia oletuksia.

5. Miten ikä otetaan mallia?

Year_of_birth, month_of_birth, day_of_birth ja birth_datetime ovat kaikki Henkilötaulukon kenttiä, joiden tarkoituksena on kuvata jonkinlainen syntymäaika. Vaikka vain year_of_birth vaaditaan, nämä kentät mahdollistavat maksimaalisen joustavuuden useilla eri tietolähteillä.

6. Miten sukupuoli, rotu ja etnisyys ovat kiinni mallissa? Koodataanko ne arvoilla, jotka ihmislukija voi ymmärtää?

Standardikäsitteitä käytetään kuvaamaan kaikkia kliinisiä yhteisöjä koko OMOP-tietomallissa, mukaan lukien sukupuoli, rotu ja etnisyys. Lähdearvot on yhdistetty Standardikäsitteisiin extract, transform, load (ETL) – prosessin aikana, jossa tietokanta muunnetaan Omop-yhteiseen tietomalliin. Tämän jälkeen ne tallennetaan Gender_concept_id -, Race_concept_id-ja Ethnicity_concept_id-kenttiin Henkilötaulukossa. Koska vakiokäsitteet kattavat kaikki kliiniset alat, ja Ciminon “Desiderata for Controlled Medical Vocabularies in the Twenty-First Century” – teoksen mukaisesti tunnisteet ovat ainutlaatuisia, pysyviä ei-temaattisia tunnisteita. Gender, esimerkiksi, on tallennettu joko 8532 (nainen) tai 8507 (mies) gender_concept_id kun alkuperäinen arvo lähteestä on tallennettu gender_source_value (m, mies, F, jne).

7. Onko olemassa ehtoja/menettelyjä/huumeita tai muita aloja, jotka pitäisi peittää tai piilottaa CDM: ään?

henkilöön liittyvän tiedon peittäminen riippuu organisaation tietosuojakäytännöistä ja voi vaihdella tietoaineiston mukaan (Themis issue #21).

8. Miten ajassa vaihtelevia potilastietoja, kuten asuinpaikkaa, käsitellään mallissa?

yhteinen omop-tietomalli on määritelty pragmaattisesti perustuen yhteisön toivottuihin analyyttisiin käyttötapauksiin sekä käytettävissä oleviin tietotyyppeihin, joihin yhteisön jäsenillä on pääsy. Ennen CDM v6. 0: ta kuhunkin potilastietokantaan liittyi demografisia ominaisuuksia, joiden oletetaan olevan potilaan kannalta muuttumattomia koko tarkkailujakson ajan, kuten sijainti ja ensisijainen hoidon tarjoaja. CDM v6.0: n julkaisun myötä Location_History-taulukko on nyt käytettävissä ihmisten, hoitopaikkojen ja palveluntarjoajien liikkeiden seuraamiseen ajan kuluessa. Vain viimeisin location_id tallennetaan Henkilötaulukkoon päällekkäisyyden poistamiseksi, kun taas henkilön liikkeet tallennetaan Location_historiaan.

jokin siviilisääty on hieman erilainen, koska sitä pidetään pikemminkin havaintona kuin demografisena ominaisuutena. Tämä tarkoittaa sitä, että se on sijoitettu Tarkkailutaulukkoon Henkilötaulukon sijaan, mikä antaa mahdollisuuden tallentaa jokaisen statuksen muutoksen ainutlaatuisena tietueena.

jos jollakulla yhteisön jäsenellä olisi käyttötapaus ajallisesti vaihteleville asuinpaikoille ja jos hänellä olisi myös lähdetietoja, jotka sisältävät nämä tiedot, haluaisimme osallistua CDM-työryhmään mallin kehittämiseksi edelleen.

9. Miten malli kuvaa ajanjaksoa, jona henkilön tiedot ovat voimassa?

OMOP – yhteisessä tietomallissa käytetään niin sanottuja havaintojaksoja (jotka on tallennettu Observation_period-taulukkoon) määritettäessä ajanjaksoa, jonka aikana potilaalla on riski saada kliininen tapahtuma kirjatuksi. Esimerkiksi hallinnollisissa väittämätietokannoissa nämä havaintojaksot ovat usein analogisia “ilmoittautumisen” käsitteen kanssa.

10. Miten malli capture alkaa ja lopettaa päivämäärät vakuutusturva? Entä jos henkilön kattavuus muuttuu?

Maksajan_plan_period-taulukkoon merkitään tiedot ajanjaksosta, jolloin henkilö on jatkuvasti kirjoilla tietyn maksajan tietyn terveysohjelman etuusrakenteen mukaisesti. Maksajan järjestelyjaksot, toisin kuin tarkkailujaksot, voivat olla päällekkäisiä niin, että ne osoittavat ajan, jolloin henkilö on kirjoilla useissa suunnitelmissa samaan aikaan, kuten Medicare Osa A ja Medicare osa D.

11. Entä jos minulla on EHR-tiedot? Miten voisin luoda tarkkailujaksoja?

tarkkailujaksona pidetään aikaa, jolloin potilaalla on riski saada kliininen tapahtuma kirjattua lähdejärjestelmään. Kunkin lähdeaineiston asianmukaisen tarkkailuajan määrittäminen voi vaihdella riippuen siitä, mitä tietoja lähde sisältää. Jos lähde ei anna tietoa potilaan sisäänmenosta tai poistumisesta järjestelmästä, on ETL: ssä kehitettävä ja sovellettava kohtuullista heuristiikkaa.

Sanaston Kartoitus

12. Täytyykö minun itse kartoittaa lähdekoodini Standardikäsitteille? Onko olemassa sanastoa, jota voisin hyödyntää?

jos tietosi käyttävät jotakin 55: stä tällä hetkellä tuetusta lähdesanastosta, kuvaukset on tehty puolestasi. Täydellinen luettelo on saatavilla avoimen lähdekoodin ATHENA-työkalusta lataus-välilehdeltä (katso alla). Voit ladata kymmenen sanastotaulukkoa myös sieltä – tarvitset kopion ympäristössäsi, jos aiot rakentaa CDM: n.

ATHENA-työkalun avulla voit myös tutkia sanastoa ennen sen lataamista, jos olet utelias kartoituksista tai jos sinulla on tietty koodi mielessäsi ja haluat tietää, mihin standardikäsitteeseen se liittyy.napsauta Haku-välilehteä ja kirjoita hakusana aloittaaksesi haun.

13. Jos haluan soveltaa kartoitukset itse, voinko tehdä niin? Ovatko ne avoimia kaikille käyttäjille?

Kyllä, kaikki kuvaukset löytyvät Concept_relationship-taulukosta (jonka voi ladata ATHENESTA). Jokaiselle tuetun lähdeterminologian arvolle annetaan concept_id (jota pidetään epästandardina). Jokainen Lähde_concept_id on kartoitus standard_concept_id. Esimerkiksi:

tässä tapauksessa standardin SNOMED concept 201826 tyypin 2 diabetes olisi tallennettu Condition_occurrence taulukossa Condition_concept_id ja ICD10CM concept 1567956 tyypin 2 diabetes olisi tallennettu Condition_source_concept_id.

14. Voidaanko rxnorm-koodit tallentaa malliin? Voinko tallentaa useita tasoja, jos niin haluan? Mitä jos yksi yhteistyökumppani käyttää eri tasoa RXNorm kuin käytän muuttaessaan tietokantaansa?

Omop-yhteisessä tietomallissa Rxnormia pidetään lääkealtistusten standardisanastona. Yksi standardisoidun sanaston hienoista puolista on se, että rxnormin hierarkkisuus säilyy tehokkaan kyselyiden mahdollistamiseksi. On sovittu parhaista käytännöistä tallentaa alimman tason rxnorm saatavilla ja sitten käyttää sanastoa tutkia asiaan liittyviä suhteita. Huumeiden ainesosat ovat korkeimman tason esi-isiä, joten ainesosan jälkeläisten kyselyn pitäisi kääntää kaikki kyseistä ainesosaa sisältävät lääkeaineet (kliininen lääke tai merkkituote). Tällä tavalla suunniteltu kysely löytää mistä tahansa CDM: stä kiinnostavia lääkkeitä riippumatta käytetystä rxnorm-tasosta.

15. Entä jos sanastossa on kartoitus, josta en ole samaa mieltä? Voiko sitä muuttaa?

kyllä, se on yhteisön kauneus! Jos löydät kartoitus sanastoa, joka ei näytä kuuluvan tai että luulet voisi olla parempi, voit vapaasti kirjoittaa merkinnän foorumeilla tai sanaston github. Jos yhteisö hyväksyy arvionne, sitä käsitellään seuraavassa sanastoversiossa.

16. Mitä jos minulla on lähdekoodit, jotka ovat erityisiä sivustolleni? Miten nämä kartoitettaisiin?

OMOP-sanastossa on tyhjä taulukko nimeltä Source_to_concept_map. Se on yksinkertainen taulukkorakenne, jonka avulla voit luoda mapping(s) jokaiselle lähdekoodille standardin käsite OMOP Sanasto (TARGET_CONCEPT_ID). Tätä työtä voi helpottaa OHDSI-työkalu Usagi (kuvassa alla), joka etsii tekstin samankaltaisuutta lähdekoodikuvausten ja OMOP-sanaston välillä ja vie kuvaukset SOURCE_TO_CONCEPT_MAP-taulukkorakenteeseen. Esimerkki Source_to_concept_map-tiedostoista löytyy täältä. Nämä luodut Source_to_concept_map-tiedostot ladataan sitten OMOP-sanaston tyhjään Source_to_concept_map-tiedostoon ennen alkuperäisen tiedon käsittelyä CDM: ään, jotta CDM-rakentaja voi käyttää niitä käännöksessä.

jos omop-Sanasto ei tue lähdekoodia, voidaan KONSEPTITAULUKKOON luoda uusia tietueita, mutta CONCEPT_IDs: n pitäisi alkaa >200000000, jotta OMOP-sanaston käsitteiden ja paikkasidonnaisten käsitteiden välillä on helppo erottaa toisistaan. Kun nämä käsitteet ovat olemassa CONCEPT_RELATIONSHIPS voidaan luoda liittää ne standardin terminologies, USAGI voi helpottaa tätä prosessia samoin (THEMIS kysymys #22).

17. Miten yhdestä moneen kartoitusta sovelletaan?

jos yksi lähdekoodi kartoittaa kaksi Standardikäsitettä, vastaavaan kliinisten tapahtumien taulukkoon tallennetaan kaksi riviä.

18. Mitä jos haluan säilyttää alkuperäiset tietoni sekä kartoitetut arvot? Voinko tehdä sen jotenkin?

Yes! Lähdearvot ja Lähdekäsitteet säilyvät täysin OMOP-yhteisessä tietomallissa. Lähdekäsite edustaa lähdeaineistossa olevaa koodia. Jokainen Lähdekäsite yhdistetään yhteen tai useampaan Standardikäsitteeseen ETL-prosessin aikana ja molemmat tallennetaan vastaavaan kliiniseen tapahtumataulukkoon. Jos kartoitusta ei ole saatavilla, Standardikäsite käsitteellä concept_id = 0 kirjoitetaan *_concept_id-kenttään (Condition_concept_id, Procedure_concept_id jne.) jotta tallenne säilyisi natiivitiedoista.

Yhteinen Tietomallin Versiointi

19. Kuka päättää, milloin ja miten datamallia muutetaan?

yhteisö! Mallin päivittämisen ympärille on suunniteltu työryhmä, ja kaikki tehdään yhteisymmärryksessä. Jäsenet esittävät GitHubille muutosehdotuksia asioina ja ryhmä kokoontuu kerran kuukaudessa keskustelemaan ja äänestämään muutoksista. Ratifioidut ehdotukset lisätään jonoon yhteisen tietomallin tulevaa versiota varten.

20. Ovatko muutokset malliin taaksepäin yhteensopivia?

yleensä pisteversiomuutokset (5.1 – > 5.2) ovat taaksepäin yhteensopivia eivätkä suuret versiomuutokset (4.0 -> 5.0) välttämättä ole. Kaikki mallin päivitykset on lueteltu kunkin version julkaisutiedoissa ja kaikki, mikä voi vaikuttaa taaksepäin yhteensopivuuteen, on merkitty selvästi.

21. Kuinka usein malli muuttuu?

nykyinen aikataulu on, että pääversiot julkaistaan joka vuosi ja pisteversiot neljännesvuosittain, vaikka se riippuu yhteisön tarpeista.

22. Mikä on muutosten levittämissuunnitelma?

muutokset on lueteltu ensin GitHubin julkaisutiedoissa ja yhteisessä tietomalli wikissä. Uusia versioita julkistetaan myös viikoittaisilla yhteisöpuheluilla ja yhteisön foorumeilla.

OHDSI-Työkalut

23. Mitkä ovat tällä hetkellä käytettävissä olevat analyyttiset työkalut?

vaikka yhteisössä on vapaasti saatavilla erilaisia työkaluja, niitä käytetään eniten:

  • Achilles – a stand-alone tool for database characterization
  • ATLAS – an integrated platform for sanasto exploration, kohort definition, case review, clinical characterization, insidence estimation, population-level effect estimation design, and patient-level prediction design (link to github)
  • ARACHNE – a tool to helping distributed network analyses
  • WhiteRabbit – an application sitä voidaan käyttää tietokannan rakenteen ja sisällön analysointiin valmisteltaessa ETL
  • rabbitinahat – hakemusta ETL: n interaktiivinen suunnittelu OMOPIN yhteiseen tietomalliin White Rabbitin
  • Usagi – sovelluksen tuottaman scan-raportin avulla-sovellus, joka auttaa luomaan koodausjärjestelmien ja sanaston standardikäsitteiden välisiä yhteyksiä.

24. Kuka on vastuussa työkalujen päivittämisestä tietomallin muutosten, virheiden ja virheiden varalta?

yhteisö! Kaikki työkalut ovat avoimen lähdekoodin tarkoittaa, että kuka tahansa voi lähettää ongelman he ovat löytäneet, tarjota ehdotuksia, ja kirjoittaa koodia korjata ongelman.

25. Antavatko nykyiset työkalut käyttäjälle mahdollisuuden määrittää hoitojaksoja luotaessa mitään arvoa olevan hoitovajeen (pysyvyysikkunan)?

Kyllä-ATLAS-työkalun avulla voidaan määrittää lääkealtistusten välinen pysyvyysikkuna kohorttia määriteltäessä (KS.kuva alla).

26. Voivatko nykyiset työkalut tunnistaa lääkkeiden käytön raskauden aikana?

Kyllä, voit tunnistaa raskauden merkkiaineet eri kliinisistä osa-alueista, mukaan lukien olosuhteet ja menettelyt, esimerkiksi “elävänä syntymä”, ja määrittää sitten ajallisen logiikan, jonka avulla voit etsiä lääkealtistusta tiettynä ajanjaksona ennen raskauden päättymistä. Lisäksi yhteisön jäsenet ovat rakentaneet kehittyneen logiikan raskausjaksojen määrittelemiseksi siten, että kaikki raskaustulokset ovat edustettuina, mikä voi olla hyödyllistä tämäntyyppisessä tutkimuksessa.

27. Suorittavatko nykyiset työkalut kartoitettuja arvoja tai lähdearvoja vastaan?

työkalut voivat suorittaa sekä lähde-että kartoitettuja arvoja vastaan, joskin kartoitettuja arvoja suositellaan voimakkaasti. Koska OHDSIN yhtenä tavoitteena on luoda eri puolille maailmaa hajautettu tietoverkosto, jossa voi tehdä tutkimuksia, lähde-arvojen käytössä ei hyödynnetä yhteisen tietomallin hyötyjä.

Verkostotutkimustutkimukset

28. Kuka voi luoda pyyntöjä?

kuka tahansa yhteisössä! Mikä tahansa kysymys, joka saa tarpeeksi kiinnostusta ja osallistumista voi olla verkostotutkimus.

29. Kuka kehittää verkkoon jaettavia kyselyjä?

tyypillisesti Päätutkija johtaa protokollan kehittämistä. PI voi myös johtaa protokollaa vastaavan analyysimenetelmän kehittämistä. Jos PI: llä ei ole tarvittavia teknisiä taitoja pöytäkirjan täytäntöönpanomenettelyn laatimiseksi, joku yhteisöstä voi auttaa sen laatimisessa.

30. Millä kielellä kyselyt on kirjoitettu?

kyselyt on kirjoitettu R: llä ja SQL: llä. Sqlrender-paketti voi kääntää minkä tahansa kyselyn, joka on kirjoitettu templated SQL Serverin kaltaisella murteella mihin tahansa tuettuun RDBMS-ympäristöön, mukaan lukien Postgresql, Oracle, Redshift, Parallel Data Warehouse, Hadoop Impala, Google BigQuery ja Netezza.

31. Miten kyselyt päätyvät datakumppaneille ja miten niitä ajetaan siellä?

OHDSI toimii hajautettuna tietoverkkona. Kaikki analyysit ovat julkisesti saatavilla ja ne voidaan ladata toimimaan kullakin sivustolla. Paketit voidaan suorittaa paikallisesti, ja datakumppanin harkinnan mukaan kootut tulokset voidaan jakaa tutkimuskoordinaattorin kanssa.

Datakumppanit voivat myös käyttää yhtä OHDSIN avoimen lähdekoodin työkaluista, ARACHNE-nimistä työkalua, joka helpottaa hajautettua verkkoanalytiikkaa OMOP-CDM: ää vastaan.

Vastaa

Sähköpostiosoitettasi ei julkaista.