Pfam

S Wikipedije, slobodne enciklopedije
Idi na navigaciju Idi na pretragu

Pfam je baza podataka porodica proteina koja uključuje njihove napomene i višestruka poravnanja sekvenci generirana korištenjem skrivenih Markovljevih modela.[1] [2] [3] Najnovija verzija, Pfam 34.0, objavljena je u martu 2021. i sadrži 19.179 porodica. [4]

Opća svrha Pfam baze podataka je da pruži potpunu i tačnu klasifikaciju porodica i domena proteina.[5] Prvobitno, razlog za kreiranje baze podataka bio je da postoji poluautomatska metoda prikupljanja informacija o poznatim porodicama proteina kako bi se poboljšala efikasnost označavanja genoma. [6] Pfam klasifikacija porodica proteina je široko prihvaćena od strane biologa zbog široke pokrivenosti proteina i razumnih konvencija imenovanja.[7]

Za svaku porodicu u Pfamu može se:

  • Pogledati opis porodice
  • Pogledati višestruka poravnanja
  • Pogledati arhitekture proteinskih domena
  • Ispitati distribuciju vrsta
  • Pratiti veze do drugih baza podataka
  • Pogledati poznate strukture proteina

Reference[uredi | uredi izvor]

  1. ^ "The Pfam protein families database". Nucleic Acids Res. 36 (Database issue): D281–8. 2008. doi:10.1093/nar/gkm960. PMC 2238907. PMID 18039703.
  2. ^ Finn, R. D.; Mistry, J.; Schuster-Böckler, B.; Griffiths-Jones, S.; Hollich, V.; Lassmann, T.; Moxon, S.; Marshall, M.; Khanna, A. (Jan 2006). "Pfam: clans, web tools and services" (Free full text). Nucleic Acids Research. 34 (Database issue): D247–D251. doi:10.1093/nar/gkj149. ISSN 0305-1048. PMC 1347511. PMID 16381856.
  3. ^ Bateman, A.; Coin, L.; Durbin, R.; Finn, R. D.; Hollich, V.; Griffiths-Jones, S.; Khanna, A.; Marshall, M.; Moxon, S. (2004). "The Pfam protein families database". Nucleic Acids Research. 32 (Database issue): 138D–1141. doi:10.1093/nar/gkh121. ISSN 0305-1048. PMC 308855. PMID 14681378. publikacija otvorenog pristupa - besplatna za čitanje
  4. ^ "Pfam 34.0 is released". Xfam Blog. Pristupljeno 2 Jul 2021.
  5. ^ Sammut, Stephen; Finn, Robert D.; Bateman, Alex (2008). "Pfam 10 years on: 10 000 families and still growing". Briefings in Bioinformatics. 9 (3): 210–219. doi:10.1093/bib/bbn010. PMID 18344544.
  6. ^ Sonnhammer, Erik L.L.; Eddy, Sean R.; Durbin, Richard (1997). "Pfam: A Comprehensive Database of Protein Domain Families Based on Seed Alignments". Proteins. 28 (3): 405–420. doi:10.1002/(sici)1097-0134(199707)28:3<405::aid-prot10>3.0.co;2-l. PMID 9223186.
  7. ^ Xu, Qifang; Dunbrack, Roland L. (2012). "Assignment of protein sequences to existing domain and family classification systems: Pfam and the PDB". Bioinformatics. 28 (21): 2763–2772. doi:10.1093/bioinformatics/bts533. PMC 3476341. PMID 22942020.