Idi na sadržaj

GenBank

S Wikipedije, slobodne enciklopedije
GenBank
SkraćenicaGB
PrethodnikNovoosnovana
Datum osnivanja1982.
VrstaJavna baza podataka o nukleotidima
StatusAktivan
CiljPrikupljanje nolvih podataka o nukleotidima i genima
Do 2023.: Nukleotidne sekvence za više od 300.000 organizama s pratećom bibliografskom i biološkom napomenom
Glavno sjedišteNCBI
ČlanstvoNeograničeni
JezikEngleski
Ključne osobeWalter Goad
Glavni organUredništvo
Br. zaposlenih?
Veb-sajt=
NCBI

GenBank baza podataka sekvenci je otvoreno pristupna, označena zbirka svih javno dostupnih nukleotidnih sekvenci i njihovih proteinskih prijevoda. Proizvodi ga i održava Nacionalni centar za informacije o biotehnologiji (NCBI; dio Nacionalnih instituta za zdravlje u Sjedinjenim Državama) kao dio Međunarodne baze podataka o nukleotidnim sekvencama Saradnja (INSDC).

GenBank i njeni saradnici primaju sekvence proizvedene u laboratorijama širom svijeta od više od 500.000 formalno opisanih vrsta.[1] Bazu podataka pokrenuli su Walter Goad i Nacionalna laboratorija Los Alamosa, 1982. GenBank je postala važna baza podataka za istraživanja u biološkim poljima i rastao je posljednjih godina eksponencijalnom stopom udvostručavajući se otprilike svakih 18 mjeseci.[2][3]

Izdanje 250.0, objavljeno u junu 2022., sadržavalo je preko 17 triliona nukleotidnih baza u više od 2,45 milijardi sekvenci.[4] GenBank je napravljen direktnim podnošenjem iz pojedinačnih laboratorija, kao i iz masovnih predaja iz velikih centara sekvenciranje.

Prijave

[uredi | uredi izvor]

GenBank se mogu poslati samo originalne sekvence. Direktno podnošenje se vrši GenBank koristeći BankIt, koji je web-bazirani obrazac, ili samostalni program za podnošenje, Sequin. Po prijemu predaje sekvence, osoblje GenBank-a ispituje originalnost podataka i dodjeljuje pristupni broj sekvenci i vrši provjere osiguranja kvaliteta. Prijave se zatim puštaju u javnu bazu podataka, gdje se unosi mogu pronaći putem Entrez ili preuzeti putem FTP. Grupno slanje eksprimirana oznaka sekvence (EST), lokacija označena sekvencom (STS), sekvenca istraživanja genoma (GSS) i sekvenca genoma visoke propusnosti (HTGS) podatke najčešće dostavljaju veliki centri za sekvenciranje. Grupa za direktno podnošenje GenBank-a također obrađuje kompletne sekvence mikrobnog genoma.[5][6]

Baza podataka GenBank uključuje dodatne skupove podataka koji su konstruisani mehanički iz prikupljanja podataka glavne sekvence, i stoga su isključeni iz ovog brojanja.

Top 20 organizama u GenBank-u (Izdanje 250)[4]
Organizam Bazni parovi
Triticum aestivum 2,15443744183×10^11
SARS-CoV-2 1,65771825746×10^11
Hordeum vulgare ssp. vulgare 1,01344340096×10^11
Mus musculus 3,0614386913×10^10
Homo sapiens 2,7834633853×10^10
Avena sativa 2,1127939362×10^10
Escherichia coli 1,5517830491×10^10
Klebsiella pneumoniae 1,1144687122×10^10
Danio rerio 1,0890148966×10^10
Bos taurus 1,0650671156×10^10
Triticum turgidum subsp. durum 9,981529154×10^9
Zea mays 7,412263902×10^9
Avena insularis 6,924307246×10^9
Secale cereale 6,749247504×10^9
Rattus norvegicus 6,548854408×10^9
Aegilops longissima 5,920483689×10^9
Canis lupus familiaris 5,776499164×10^9
Aegilops sharonensis 5,272476906×10^9
Sus scrofa 5,179074907×10^9
Rhinatrema bivittatum 5,178626132×10^9

Također pogledajte

[uredi | uredi izvor]

Reference

[uredi | uredi izvor]
  1. Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7. 1. 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.
  2. Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
  3. Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.
  4. 1 2 "GenBank release notes (Release 250)". NCBI. 15. 6. 2022. Pristupljeno 20. 7. 2022.
  5. "How to submit data to GenBank". NCBI. Pristupljeno 20. 7. 2022.
  6. "GenBank Submission Types". NCBI. Pristupljeno 20. 7. 2022.

Vanjski linkovi

[uredi | uredi izvor]