A KEGG (Kyoto Encyclopedia of Genes and Genomes) egy a genomokkal, biológiai útvonalakkal, betegségekkel, gyógyszerekkel és kémiai elemekkel foglalkozó adatbázisok gyűjtőhelye. A KEGG-et a bioinformatikai kutatásoknál és oktatásoknál használják, többek között a genomika, a metagenomika, a metabolomika és más omikák területén elemzéshez. Emellett a rendszerbiológia, a transzlációs kutatás és a gyógyszerfejlesztés területén használják modellezésnél és szimulációnál.

Bevezetés

szerkesztés

A KEGG adatbázis projektet 1995-ben Minoru Kanehisa kezdeményezte az akkor Japánban futó Humán Genom Program keretein belül, aki akkor a Kiotói Egyetem Kémiai Kutatások Intézetének a professzora volt.[1][2] Előre látva a számítógépen elérhető erőforrások iránti igényt, melynek segítségével feldolgozhatóak a genom szekvenciális adatai, nekiállt kifejleszteni a KEGG PATHWAY adatbázist. Ez kézzel rajzolt KEGG ösvények gyűjteménye lett, amely a anyagcseréről és a sejtek és szervek egyéb funkcióiról szerzett tapasztalati adatokat tette fel egy térképre. Minden térképi ösvény a molekulák kölcsönhatásának és hatásainak egy ösvényét rajzolja ki, célja pedig az volt, hogy a felfedezett géneket azok eredményéhez kapcsolja. Az eredmények többsége valamilyen protein lett.Így létrejöhetett az úgynevezett KEGG ösvény térképek elemzése, mely során a genómban lévő génállomány összehasonlíthatóvá vált a KEGG PATHWAY adatbázissal, és így lehetett tanulmányozni, hogy milyen ösvény és hozzá kapcsolódó funkció lehet az adott génben kódolva.

A fejlesztők szerint a KEGG a biológiai rendszer „számítógépes reprezentánsa.”[3] Ebben benne vannak az építő elemek és az azokat leíró vonaldiagramok. Pontosabban a gének és a proteinek építőelemei, a kis molekulák kémiai építőelemei, a reakcióik, a molekulák reakcióinak és kapcsolatainak vonaldiagramos hálózata. Ezek a KEGG következő adatbázisaiban vannak eltárolva, melyeket több csoportba is be lehet sorolni,melyek között ott van a rendszer, a genom, a kémia és az egészség, illetve az ezekhez kapcsolódó információk.[4]

  • Rendszer információ
    • PATHWAY – biológiai ösvény térképek a sejti és a szervi funkciókról.
    • MODULE – modulok vagy a gének funkcionális egységei
    • BRITE – biológiai egységek hierarchikus felépítése.
  • Genom információ
  • Kémiai információk
    • COMPOUND, GLYCAN – kémiai összetevők és glikánok
    • REACTION, RPAIR, RCLASS – kémiai reakciók
    • ENZYME – enzim nómenklatúra
  • Egészségügyi információk
    • DISEASE – humán betegségek
    • DRUG – jóváhagyott gyógyszerek
    • ENVIRON – gyógyszer alapok és egészségügyi kiegészítők

Adatbázisok

szerkesztés

Rendszer információk

szerkesztés

A KEGG PATHWAY adatbázis, a vonaldiagram adatbázis a KEGG központi eleme. Ez ösvények olyan térképeit gyűjti össze, melybe több entitás is helyet kap. Ilyenek a gének, a proteinek, RNS-ek, kémiai vegyületek, glikánok valamint a kémiai reakciók, a betegségekért felelős gének és a gyógyszerek célpontjai, melyeket a KEGG egyéb adatbázisai külön-külön is tartalmaznak.A térképeket a következő csoportokba sorolták:

  • Metabolizmus
  • Általános információ feldolgozás (transzkripció, transzláció, DNS-másolás, DNS-javítás stb.)
  • Környezeti információk feldolgozása (membrán transzport stb.)
  • Sejti folyamatok (sejtnövekedés, sejthalál, sejt membrán funkciók stb.)
  • organizmus rendszerek (immunrendszer, endokrin rendszer, idegrendszer stb.)
  • Humán betegségek
  • Gyógyszerfejlesztés
  1. (2000) „KEGG: Kyoto Encyclopedia of Genes and Genomes”. Nucleic Acids Res 28 (1), 27–30. o. DOI:10.1093/nar/28.1.27. PMID 10592173. PMC 102409.  
  2. Kanehisa M (1997). „A database for post-genome analysis”. Trends Genet 13 (9), 375–6. o. DOI:10.1016/S0168-9525(97)01223-7. PMID 9287494.  
  3. (2006) „From genomics to chemical genomics: new developments in KEGG”. Nucleic Acids Res 34 (Database issue), D354–7. o. DOI:10.1093/nar/gkj102. PMID 16381885. PMC 1347464.  
  4. (2014) „Data, information, knowledge and principle: back to metabolism in KEGG”. Nucleic Acids Res 42 (Database issue), D199–205. o. DOI:10.1093/nar/gkt1076. PMID 24214961. PMC 3965122.