GenBank
| GenBank | |
|---|---|
| Skraćenica | GB |
| Prethodnik | Novoosnovana |
| Datum osnivanja | 1982. |
| Vrsta | Javna baza podataka o nukleotidima |
| Status | Aktivan |
| Cilj | Prikupljanje nolvih podataka o nukleotidima i genima Do 2023.: Nukleotidne sekvence za više od 300.000 organizama s pratećom bibliografskom i biološkom napomenom |
| Glavno sjedište | NCBI |
| Članstvo | Neograničeni |
| Jezik | Engleski |
| Ključne osobe | Walter Goad |
| Glavni organ | Uredništvo |
| Br. zaposlenih | ? |
| Veb-sajt | = NCBI |
GenBank baza podataka sekvenci je otvoreno pristupna, označena zbirka svih javno dostupnih nukleotidnih sekvenci i njihovih proteinskih prijevoda. Proizvodi ga i održava Nacionalni centar za informacije o biotehnologiji (NCBI; dio Nacionalnih instituta za zdravlje u Sjedinjenim Državama) kao dio Međunarodne baze podataka o nukleotidnim sekvencama Saradnja (INSDC).
GenBank i njeni saradnici primaju sekvence proizvedene u laboratorijama širom svijeta od više od 500.000 formalno opisanih vrsta.[1] Bazu podataka pokrenuli su Walter Goad i Nacionalna laboratorija Los Alamosa, 1982. GenBank je postala važna baza podataka za istraživanja u biološkim poljima i rastao je posljednjih godina eksponencijalnom stopom udvostručavajući se otprilike svakih 18 mjeseci.[2][3]
Izdanje 250.0, objavljeno u junu 2022., sadržavalo je preko 17 triliona nukleotidnih baza u više od 2,45 milijardi sekvenci.[4] GenBank je napravljen direktnim podnošenjem iz pojedinačnih laboratorija, kao i iz masovnih predaja iz velikih centara sekvenciranje.
Prijave
[uredi | uredi izvor]GenBank se mogu poslati samo originalne sekvence. Direktno podnošenje se vrši GenBank koristeći BankIt, koji je web-bazirani obrazac, ili samostalni program za podnošenje, Sequin. Po prijemu predaje sekvence, osoblje GenBank-a ispituje originalnost podataka i dodjeljuje pristupni broj sekvenci i vrši provjere osiguranja kvaliteta. Prijave se zatim puštaju u javnu bazu podataka, gdje se unosi mogu pronaći putem Entrez ili preuzeti putem FTP. Grupno slanje eksprimirana oznaka sekvence (EST), lokacija označena sekvencom (STS), sekvenca istraživanja genoma (GSS) i sekvenca genoma visoke propusnosti (HTGS) podatke najčešće dostavljaju veliki centri za sekvenciranje. Grupa za direktno podnošenje GenBank-a također obrađuje kompletne sekvence mikrobnog genoma.[5][6]
Baza podataka GenBank uključuje dodatne skupove podataka koji su konstruisani mehanički iz prikupljanja podataka glavne sekvence, i stoga su isključeni iz ovog brojanja.
| Organizam | Bazni parovi |
|---|---|
| Triticum aestivum | 2,15443744183×1011 |
| SARS-CoV-2 | 1,65771825746×1011 |
| Hordeum vulgare ssp. vulgare | 1,01344340096×1011 |
| Mus musculus | 3,0614386913×1010 |
| Homo sapiens | 2,7834633853×1010 |
| Avena sativa | 2,1127939362×1010 |
| Escherichia coli | 1,5517830491×1010 |
| Klebsiella pneumoniae | 1,1144687122×1010 |
| Danio rerio | 1,0890148966×1010 |
| Bos taurus | 1,0650671156×1010 |
| Triticum turgidum subsp. durum | 9,981529154×109 |
| Zea mays | 7,412263902×109 |
| Avena insularis | 6,924307246×109 |
| Secale cereale | 6,749247504×109 |
| Rattus norvegicus | 6,548854408×109 |
| Aegilops longissima | 5,920483689×109 |
| Canis lupus familiaris | 5,776499164×109 |
| Aegilops sharonensis | 5,272476906×109 |
| Sus scrofa | 5,179074907×109 |
| Rhinatrema bivittatum | 5,178626132×109 |
Također pogledajte
[uredi | uredi izvor]- Ensembl
- Referentna baza podataka o ljudskim proteinima (HPRD)
- Analiza sekvence
- UniProt
- Entrez
- Lista sekvenciranih eukariotskih genoma
- Lista sekvenciranih arhealnih genoma
- RefSeq — baza podataka referentnih sekvenci
- Geneious — uključuje GenBank alat za podnošenje
- Otvoreni naučni podaci
- Proteinska banka podataka
Reference
[uredi | uredi izvor]- ↑ Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7. 1. 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.
- ↑ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
- ↑ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.
- 1 2 "GenBank release notes (Release 250)". NCBI. 15. 6. 2022. Pristupljeno 20. 7. 2022.
- ↑ "How to submit data to GenBank". NCBI. Pristupljeno 20. 7. 2022.
- ↑ "GenBank Submission Types". NCBI. Pristupljeno 20. 7. 2022.
Vanjski linkovi
[uredi | uredi izvor]- GenBank
- Example sequence record, for hemoglobin beta
- BankIt
- Sequin — a stand-alone software tool developed by the NCBI for submitting and updating entries to the GenBank sequence database.
- EMBOSS — free, open source software for molecular biology
- GenBank, RefSeq, TPA and UniProt: What's in a Name?