InterPro este o bază de date cu familii de proteine, domenii și site-uri funcționale în care caracteristicile identificabile găsite în proteinele cunoscute pot fi aplicate noilor secvențe de proteine[2] pentru a le caracteriza funcțional.[3][4]

InterPro
Content
DescriptionInterPro analizează funcțional secvențele de proteine și le clasifică în familii de proteine în timp ce prezice prezența domeniilor și a site-urilor funcționale.
Contact
Research centerEMBL
LaboratoryInstitutul European de Bioinformatică
Primary citationBaza de date interpro familii de proteine și domenii: 20 de ani[1]
Release date1999
Access
Websitewww.ebi.ac.uk/interpro/
Download URLftp.ebi.ac.uk/pub/databases/interpro/
Miscellaneous
Data release
frequency
8-săptămânal
Version83.0 (2 decembrie 2020; acum 3 ani, 4 luni și 17 zile (2020-12-02))

Conținutul InterPro constă din semnături de diagnosticare și proteinele care se potrivesc semnificativ. Semnăturile constau din modele (tipuri simple, cum ar fi expresii regulate sau unele mai complexe, cum ar fi modelele Markov ascunse) care descriu familii de proteine, domenii sau site-uri. Modelele sunt construite din secvențele de aminoacizi ale familiilor sau domeniilor cunoscute și sunt utilizate ulterior pentru a căuta secvențe necunoscute (cum ar fi cele care decurg din secvențierea genomului nou) pentru a le clasifica. Fiecare dintre bazele de date membre ale InterPro contribuie la o nișă diferită, de la clasificări la nivel foarte înalt, bazate pe structură (SUPERFAMILY și CATH-Gene3D) până la clasificări subfamiliale destul de specifice (PRINTS și PANTHER).

Intenția InterPro este de a oferi un mulaj unic pentru clasificarea proteinelor, unde toate semnăturile produse de diferitele baze de date membre sunt plasate în intrări în baza de date InterPro. Semnăturile care reprezintă domenii, site-uri sau familii echivalente sunt introduse în aceeași intrare, iar intrările pot fi, de asemenea, corelate între ele. Informații suplimentare, cum ar fi o descriere, nume coerente și termeni ca ontologia genei (GO) sunt asociate cu fiecare intrare, acolo unde este posibil.

Referințe modificare

  1. ^ Blum M, Chang HY, Chuguransky S, Grego T, Kandasaamy S, Mitchell A, et al. (noiembrie 2020). „The InterPro protein families and domains database: 20 years on”. Nucleic Acids Research: gkaa977. doi:10.1093/nar/gkaa977 . PMID 33156333. 
  2. ^ Hunter S, Jones P, Mitchell A, Apweiler R, Attwood TK, Bateman A, et al. (ianuarie 2012). „InterPro in 2011: new developments in the family and domain prediction database”. Nucleic Acids Research. 40 (Database issue): D306–12. doi:10.1093/nar/gkr948. PMC 3245097 . PMID 22096229. 
  3. ^ Apweiler R, Attwood TK, Bairoch A, Bateman A, Birney E, Biswas M, et al. (ianuarie 2001). „The InterPro database, an integrated documentation resource for protein families, domains and functional sites”. Nucleic Acids Research. 29 (1): 37–40. doi:10.1093/nar/29.1.37. PMC 29841 . PMID 11125043. 
  4. ^ Apweiler R, Attwood TK, Bairoch A, Bateman A, Birney E, Biswas M, et al. (decembrie 2000). „InterPro--an integrated documentation resource for protein families, domains and functional sites”. Bioinformatics. 16 (12): 1145–50. doi:10.1093/bioinformatics/16.12.1145 . PMID 11159333. 

Legături externe modificare