Idi na sadržaj

INAVA

S Wikipedije, slobodne enciklopedije
(Preusmjereno sa Hipotetski protein LOC55765)
INAVA
Identifikatori
AliasiINAVA
Vanjski ID-jeviOMIM: 618051 MGI: 1921579 HomoloGene: 10103 GeneCards: INAVA
Lokacija gena (čovjek)
Hromosom 1 (čovjek)
Hrom.Hromosom 1 (čovjek)[1]
Hromosom 1 (čovjek)
Genomska lokacija za INAVA
Genomska lokacija za INAVA
Bend1q32.1Početak200,891,048 bp[1]
Kraj200,915,742 bp[1]
Lokacija gena (miš)
Hromosom 1 (miš)
Hrom.Hromosom 1 (miš)[2]
Hromosom 1 (miš)
Genomska lokacija za INAVA
Genomska lokacija za INAVA
Bend1 E4|1Početak136,141,269 bp[2]
Kraj136,162,002 bp[2]
Ontologija gena
Molekularna funkcija GO:0001948, GO:0016582 vezivanje za proteine
Ćelijska komponenta jedro
citoplazma
Biološki proces pattern recognition receptor signaling pathway
cytokine production involved in immune response
response to peptidoglycan
response to muramyl dipeptide
positive regulation of interleukin-1 beta production
positive regulation of interleukin-10 production
positive regulation of interleukin-6 production
positive regulation of stress-activated MAPK cascade
positive regulation of I-kappaB kinase/NF-kappaB signaling
nucleotide-binding oligomerization domain containing 2 signaling pathway
reactive oxygen species biosynthetic process
immune system process
Urođeni imunski sistem
positive regulation of protein ubiquitination
adherens junction maintenance
intestinal epithelial structure maintenance
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_001142569
NM_018265
NM_001367289
NM_001367290

NM_028872

RefSeq (bjelančevina)

NP_001136041
NP_060735
NP_001354218
NP_001354219

NP_083148
NP_001392081
NP_001392082
NP_001392083

Lokacija (UCSC)Chr 1: 200.89 – 200.92 MbChr 1: 136.14 – 136.16 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

INAVA, ponekad označavan kao hipotetski protein LOC55765, jest protein nrepoznate funkcije koji je kod ljudi kodiran genom INAVA sa hromosoma 1.[5] Manje uobičajeni aliasi gena uključuju oznake FLJ10901 i MGC125608.

Aminokiselinska sekvenca

[uredi | uredi izvor]

Dužina polipeptidnog lanca je 663 aminokiseline, a molekulska težina 72.914 Da.[6]

1020304050
MLQMPKLNEIPPGRAGRREARGEGRWPGQTGPEAARLEWRAQGQAGGARA
PWDSWGSSRLPTQPGPGWSRCPPSLLCALSFQKSTMESKDEVSDTDSGII
LQSGPDSPVSPMKELTHAVHKQQRALEARLEACLEELRRLCLREAELTGT
LPAEYPLKPGEKAPKVRRRIGAAYKLDDWALHREDPLSSLERQLALQLQI
TEAARRLCLEENLSRQARRQRKHSMLQEEKKLQELQRCLVERRRNSEPPP
AAALPLGRELSASDDSSLSDGLLLEEEESQVPKPPPESPAPPSRPLPPQT
LEGLQPTGPEAGSPERAPVQNSPWKETSLDHPYEKPRKSSEPWSESSSPA
TTPQDGPSASSLWLLEPASYHVVPIRGVPGQWQGRTSAPATPEIQGRRGQ
SQSLRVDSFRAGPEGRGRSAFPRRRPTHYTVTVPDSCFPATKPPLPHAAC
HSCSEDSGSDVSSISHPTSPGSSSPDISFLQPLSPPKTHRHRGAWVPAGS
RELVAHHPKLLLPPGYFPAGRYVVVAESPLPPGEWELRRAAPGPAYEEEG
TPLRYQRLVPSRSRIVRTPSLKDSPAGRGLSKAAVSEELKWWHERARLRS
TRPHSLDRQGAFRVRSLPLGREGFGRALGPRAQVPTVCVLRRSPDGAPVQ
VFVPEKGEIISQV

Struktura

[uredi | uredi izvor]

Predviđeno je da se uoredene zavojnice nalale izmešu ostatka 130–160 i 200–260.[7] Predviđeno je da sekundarni sastav bude oko 60% opredenih zavojnica, 30% alfa-heliksa i 10% beta-listova.[8]

Položaj C1orf106 na hromosomu 1

Kod ljudi, INAVA se nalazi na dugom kraku hromosoma 1, na lokusu 1q32.1. Proteže se na plus lancu, od pp 200,891.499 do bp 200,915.736 (24,238 kb).[5]

Gensko susjedstvo

[uredi | uredi izvor]
Gensko susjedstvo C1orf106-a

INAVA je okružen genoma za receptor 25, spojenim sa G-proteinskim (uzvodno) i glavnog člana porodice 3 koji je sličan toplotnom (MROH3P), predviđenim nizvodnim pseudogenom. Ribosomni pseudogenski 6 protein L34 (RPL34P6) je dalje uzvodno, a član porodice kinezina 21B je dalje nizvodno.[5]

Promotor

[uredi | uredi izvor]
Predviđena regija promotora C1orf106 s navodnim mjestima vezivanja faktora transkripcije

Postoji sedam predviđenih promotora za INAVA, a eksperimentalni dokazi sugeriraju da se izoforme 1 i 2, kao najčešće, transkribiraju korištenjem različitih promotora.[9] MatInspector, alat dostupan preko Genomatixa, korišten je za predviđanje mjesta vezanja transkripcijskih faktora unutar potencijalnih promotorskih regija. Transkripcijski faktori za koje se predviđa da ciljaju na očekivani promotor za izoformu 1 eksprimirani su u nizu tkiva. Najčešća ekspresijska tkiva su urogenitalni i nervni sistem, te koštana srž. Ovo se poklapa sa podacima o ekspresiji za protein INAVA, koji je visoko eksprimiran u bubrezima i koštanoj srži.[10] Dijagram predviđenog promotorskog regiona, sa istaknutim mestima vezivanja faktora transkripcije, prikazan je desno. Faktori za koje se predviđa da će se vezati za promotorsku regiju izoforme 2 se razlikuju, a 12 od prvih 20 predviđenih faktora izraženo je u krvnim ćelijama i/ili tkivima kardiovaskularnog sistema.

Ekspresija

[uredi | uredi izvor]

C1orf106 eksprimira se u širokom spektru tkiva. Podaci o ekspresiji iz GEO profila prikazani su ispod. Mjesta najveće ekspresije su navedena u tabeli. Ekspresija je umjerena u placenti, prostati, sjemenicima, plućima, pljuvačnim žlijezdama i dendritskim ćelijama. Niska razu+inaa mu je u mozgu, većini imunskih ćelija, nadbubrežnim žlijezdamya, maternici, srcu i adipocitima.[10] Podaci o ekspresiji, iz različitih eksperimenata, pronađeni na GEO profilima, sugeriraju da je ekspresija INAVA pojačano regulirana u nekoliko karcinoma uključujući: rak pluća, jajnika, kolorektumski i dojke

Podaci o ekspresiji C1orf106, prema GEO profilima
TkivoRang
(percentili)
B-limfociti90
Traheja89
Koža88
Ćelije ljudskog bronhijskog epitela88
Kolorektumski adenokarcinom87
Bubreg87
Jezik85
Gušterača84
Crvuljak82
Koštana srž80

Izoforme

[uredi | uredi izvor]

Proizvedeno je devet navodnih izoformi gena INAVA, od kojih se predviđa da sedam kodira proteine.[11] Izoforme 1 i 2, prikazane u nastavku, najčešće su izoforme.

Najćešće izoforme C1orf106

Izoforma 1, koja je najduža, prihvaćena je kao kanonska izoforma. Sadrži deset egzona, koji kodiraju protein dug 677 aminokiselina, ovisno o izvoru. Neki izvori navode da se protein sastoji od samo 663 aminokiseline, zbog upotrebe startnog kodona koji se nalazi nizvodno 42 nukleotida. Prema NCBI, ova izoforma je predviđena samo računarski.[5] Ovo može biti zato što je Kozak sekvenca koja okružuje nizvodni start kodon sličnija konsenzusnoj Kozakovoj sekvenci, kao što je prikazano u tabeli ispod. Za dobianje sekvence predviđene izoforme korišten je Softberry program.[12] Izoforma 2 je kraća zbog skraćenog N-kraja. Obje izoforme imaju alternativna mjesta poliadenilacija.[11]

Okolna sekvenca startnih kodona u poređenju sa Kozakovom konsenzusnom sekvencom
Okolna sekvenca startnih kodona u poređenju sa Kozakovom konsenzusnom sekvencom

Regulacija miRNK

[uredi | uredi izvor]
Predviđena viljna sekvenca miRNK

miRNK-24 identificirana je kao mikroRNK koja bi potencijalno mogla ciljati INAVA iRNK.[13] Prikazano je mjesto vezivanja koje se nalazi u 5' neprevedenoj regiji.

Protein

[uredi | uredi izvor]

Opća svojstva

[uredi | uredi izvor]
Protein C1of106 (izoforma 1)

Izoforma 1, dijagram ispod, sadrži domen DUF3338, dvije regije niske složenosti i regiju bogatu prolinom. Protein je bogat argininom i prolinom i ima manju od prosječne količine asparagina i hidrofobnih aminokiselina, posebno fenilalanina i izoleucina.[14] Izoelektrična tačka je 9,58, a molekulska težina nemodifikovanog proteina je 72,9 kDa.[15] Nije predviđeno da protein ima N-terminalni signalni peptid, ali postoje predviđeni signali jedarne lokalizacije (NLS) i leucinom bogat jedarni eksportni signal.[16][17][18]

Modifikacije

[uredi | uredi izvor]

Predviđa se da je INAVA visoko fosforiliran.[19][20] Mjesta fosfoilacije koja predviđa PROSITE prikazana su u tabeli ispod. NETPhos predviđanja ilustrovana su na dijagramu. Svaka linija ukazuje na predviđeno mjesto fosforilacije i povezuje se sa slovom koje predstavlja ili serin (S), treonin (T) ili tirozin (Y).

Predviđena mjesta fosforilacije prema PROSITE-u
Predviđena mjesta fosforilacije prema PROSITE-u
predviđena jesta fosforilacije prema NETPhos-i. Slova odgovaraju serinu (S), treoninu (T) uli tirotinu (Y).

Interakcije

[uredi | uredi izvor]

Proteini sa kojima INAVA protein interraguje nisu dobro okarakterisani. Dokazi sugeriraju da INAVA može stupiti u interakciju sa sljedećim proteinima: DNAJC5G, SLC7A13, PIEZO2, MUC19.[21] Eksperimrntalni dokazi, prema pregledu dvohibridnog kvasca, sugeriraju da protein INAVA ima interakcije sa proteinom 14-3-3 sigma, koji je adapterski protein.[22]

Homologija

[uredi | uredi izvor]

INAVA je dobro konzervirana kod kičmenjaka kao što je prikazano u tabeli ispod. Sekvence su preuzete sa BLAST-a.[23] i BLAT-a.[24]

SekvencaRod i vrstaUobičajeno imePristup za NCBI Dužinma (aa)Identitet sekvenceDatiranje divergencije od ljudske loze (milioni godina prije današnjice)
*C1orf106Homo sapiensČovjekNP_060735.3667100%N/A
*C1orf106Macaca fascicularisRakojedi makakXP_005540414.170397%29,0
*LOC289399Rattus norvegicusSmeđi pacovNP_001178750.166786%92,3
*Predviđeni homolog C1orf106-aOdobenus rosmarus divergensMoržXP_004392787.167285%94.2
*C1orf106-olikiLoxodonta africanaAfrički slonXP_003410255.166384%98,7
*Predviđeni C1orf106 homologDasypus novemcinctusDevetoprigi armadiloXP_004478752.167681%104,2
*Predviđeni C1orf106 homologOchotona princepsAmerički pikaXP_004578841.168178%92,3
*Predviđeni C1orf106 homologMonodelphis domesticaSivi kratkorepi oposumXP_001367913.257876%162,2
*Predviđeni C1orf106 homologChrysemys picta belliiObojena kornjačaXP_005313167.160256%296,0
*Predviđeni C1orf106 homologGeospiza fortisSrednjeprizemna zebaXP_005426868.154250%296,0
*Predviđeni C1orf106 homologAlligator mississippiensisAligatorXP_006278041.154749%296,0
*Predviđeni C1orf106 homologFicedula albicollisOgrličasta muharicaXP_005059352.154249%296,0
Predviđeni C1orf106 homologLatimeria chalumnaeLatimerija zapadnoindijskog okeanaXP_005988436.161346%414.9
*Predviđeni C1orf106 homologLepisosteus oculatusPjegava riba garXP_006628420.163744%400.1
*FERM sa domenom 4AXenopus (Silurana) tropicalisZapadna kandžasta žabaXP_002935289.269543%371,2
*Predviđeni C1orf106 homologOreochromis niloticusNilska tilapijaXP_005478188.157640%400.1
Predviđeni C1orf106 homologHaplochromis burtoniBurtonova astatotilapijaXP_005914919.157640%400,1
Predviđeni C1orf106 homologPundamilia nyerereiHaplohromis ribaXP_005732720.157740%400,1
*LOC563192Danio rerioZebricaNP_001073474.161237%400,1
LOC101161145Oryzias latipesRiba japanskih rižinih poljaXP_004069287.161233%400,1

Grafikon identiteta sekvence u odnosu na vrijeme od divergencije za unose označene zvjezdicom prikazan je ispod. Boje odgovaraju stepenu srodnosti (zelena = blisko srodna, ljubičasta = udaljeni srodnik).

Postotak identiteta sekvence u odnosu na srodnost vrsta

Paralozi

[uredi | uredi izvor]

Proteini koji se smatraju INAVA paralozima nisu konzistentni između baza podataka. Napravljeno je višestruko poravnavanje sekvenci (MSA) potencijalno paralognih proteina kako bi se utvrdila vjerovatnoća prave paralogne veze.[25] Sekvence su izvučene iz pretrage BLAST-a kod ljudi sa proteinom C1orf106. MSA sugerira da proteini dijele homologni domen, DUF3338, koji se nalazi kod eukariota. Dio višestrukog poravnavanja je prikazan ispod. Osim DUF domena (uokviren zelenom bojom), bilo je malo konzerviranosti. DUF3338 domen nema nikakva izvanredna fizička svojstva; međutim, značajan je nalaz da se predviđa da svaki od proteina u MSA ima dva signala jedarne lokalizacije. Predviđa se da će se svi proteini u MSA lokalizirati u jedru.[16] U tabeli prikazano jr i poređenje konduciranih fizičnih svojstava proteina i SAPS-a.[14]

Konzervacija ljudskog domena DUF3338
Fizička svojstva potencijalnih [[paralog]a]]
Fizička svojstva potencijalnih [[paralog]a]]

Klinički značaj

[uredi | uredi izvor]

U genskoj regiji INAVA identificirano je ukupno 556 jednonukleotidnih polimorfizama (SNP), od kojih je 96 povezano s kliničkim uzrokom.[26] Rivas et al.[27] dentificirali su četiri i SNP-a, prikazana u tabeli ispod, koji mogu biti povezani sa upalnom bolešću crijeva i Crohnovom bolešću. Prema GeneCards, druge asocijacije bolesti mogu uključivati multiplu sklerozu i ulcerozni kolitis.[28]

OstatakPromjenaNapomana
333 (rs41313912)TirozinfenilalaninFosforilizizan , omjereno konzerviran
376ArginincisteinUmjereno konzerviran
397ArginintreoninNekonzerviran
554 (rs61745433)Arginin ⇒ cisteinUmjereno konzerviran

Modelni organizmi

[uredi | uredi izvor]

U proučavanju funkcije INAVA korišteni su modelni organizmi . Uslovna nokaut-mišja linija pod nazivom 5730559C18Riktm2a(EUCOMM)Wtsi generirana je na Institutu Wellcome Trust Sanger.[29] Mužjaci i ženke su podvrgnuti standardizovanom fenotipskom pregledu[30] za određivanje efekata delecija.[31][32][33][34] Urađeni su dodatni pregledi: Dubinska imunološka fenotipizacija[35] kostiju i hrskavice.[36]

5730559C18Rik fenotip nokaut-miševa
SvojstvoFenotip
Svi podaci su zaspoloživi na:[30][35][36]
Leukociti periferne krvi 6 sedmicaNormalan
InsulinNormalan
Hematologija 6 sedmicaNormalan
Vijabilnost homozigota na P14Normalan
Plodnost homozigotaNormalan
Tjelesna težinaNormalan
Neurološla procjenaNormalan
Snaga stiskaNormalan
DismorfologijaNormalan
Indirektna kalorimetrijaNormalan
Test tolerancije glukozeNormalan
Slušni odgovor moždanog stablaNormalan
DEXANormalan
RadiografijaNormalan
Morfologija okaNormalan
Klinička hemijaNormalan
Hematologija 16 sedmicaNormalan
Leukociti periferne krvi 16 sedmicaNormalan
Težina srcaNormalan
Salmonella infekcijaNormalan
Funkcija citotoksičnih T-ćelijaNormalan
Imunofenotipizacija slezeneNormalan
Imunofenotipizacija mezenternog limfnog čvoraNormalan
Imunofenotipizacija koštane sržiNormalan
Kompozicija epidermne imunostiNormalan
Izazov gripeNormalan

Reference

[uredi | uredi izvor]
  1. 1 2 3 GRCh38: Ensembl release 89: ENSG00000163362 - Ensembl, maj 2017
  2. 1 2 3 GRCm38: Ensembl release 89: ENSMUSG00000041605 - Ensembl, maj 2017
  3. "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. 1 2 3 4 "NCBI Gene 55765". Pristupljeno 10. 2. 2014.
  6. "UniProt, Q3KP66" (jezik: en.). Pristupljeno 12. 12. 2021.CS1 održavanje: nepoznati jezik (link)
  7. "ExPASy COILS". Arhivirano s originala, 22. 4. 2014. Pristupljeno 20. 4. 2014.
  8. "SOPMA". Pristupljeno 27. 4. 2014.
  9. "Genomatix: MatInspector". Arhivirano s originala, 2. 12. 2021. Pristupljeno 6. 3. 2014.
  10. 1 2 "GEO Profiles". Pristupljeno 6. 3. 2014.
  11. 1 2 "Aceview". Pristupljeno 6. 3. 2014.
  12. "Softberry". Pristupljeno 20. 4. 2014.
  13. "TargetScanHuman 6.2". Pristupljeno 15. 4. 2014.
  14. 1 2 "Statistical Analysis of Protein Sequences". Pristupljeno 20. 4. 2014.
  15. "Compute pI/Mw tool". Pristupljeno 10. 4. 2014.
  16. 1 2 "PSORTII". Pristupljeno 20. 4. 2014.
  17. "cNLS Mapper". Arhivirano s originala, 22. 11. 2021. Pristupljeno 20. 4. 2014.
  18. "NetNES". Pristupljeno 20. 4. 2014.
  19. "NETPhos". Pristupljeno 20. 4. 2014.
  20. "Swiss Institute of Bioinformatics: PROSITE".
  21. "STRING". Arhivirano s originala, 15. 5. 2013. Pristupljeno 15. 4. 2014.
  22. "MINT". Pristupljeno 15. 4. 2014.
  23. "BLAST". Pristupljeno 8. 3. 2014.
  24. "BLAT". Pristupljeno 8. 3. 2014.
  25. "SDSC Biology Workbench: ClustalW". Pristupljeno 12. 3. 2014.
  26. "dbSNP". Pristupljeno 22. 4. 2014.
  27. Rivas MA; et al. (2011). "Deep resequencing of GWAS loci identifies independent rare variants associated with inflammatory bowel disease". Nature Genetics. 43 (11): 1066–1073. doi:10.1038/ng.952. PMC 3378381. PMID 21983784.
  28. "GeneCards". Pristupljeno 1. 5. 2014.
  29. Gerdin AK (2010). "The Sanger Mouse Genetics Programme: high throughput characterisation of knockout mice". Acta Ophthalmologica. 88: 925–7. doi:10.1111/j.1755-3768.2010.4142.x. S2CID 85911512.
  30. 1 2 "International Mouse Phenotyping Consortium".
  31. Skarnes WC, Rosen B, West AP, Koutsourakis M, Bushell W, Iyer V, Mujica AO, Thomas M, Harrow J, Cox T, Jackson D, Severin J, Biggs P, Fu J, Nefedov M, de Jong PJ, Stewart AF, Bradley A (Jun 2011). "A conditional knockout resource for the genome-wide study of mouse gene function". Nature. 474 (7351): 337–42. doi:10.1038/nature10163. PMC 3572410. PMID 21677750.
  32. Dolgin E (Jun 2011). "Mouse library set to be knockout". Nature. 474 (7351): 262–3. doi:10.1038/474262a. PMID 21677718.
  33. Collins FS, Rossant J, Wurst W (Jan 2007). "A mouse for all reasons". Cell. 128 (1): 9–13. doi:10.1016/j.cell.2006.12.018. PMID 17218247. S2CID 18872015.
  34. White JK, Gerdin AK, Karp NA, Ryder E, Buljan M, Bussell JN, Salisbury J, Clare S, Ingham NJ, Podrini C, Houghton R, Estabel J, Bottomley JR, Melvin DG, Sunter D, Adams NC, Sanger Institute Mouse Genetics Project, Tannahill D, Logan DW, Macarthur DG, Flint J, Mahajan VB, Tsang SH, Smyth I, Watt FM, Skarnes WC, Dougan G, Adams DJ, Ramirez-Solis R, Bradley A, Steel KP (2013). "Genome-wide generation and systematic phenotyping of knockout mice reveals new roles for many genes". Cell. 154 (2): 452–64. doi:10.1016/j.cell.2013.06.022. PMC 3717207. PMID 23870131.
  35. 1 2 "Infection and Immunity Immunophenotyping (3i) Consortium". Arhivirano s originala, 21. 5. 2015. Pristupljeno 12. 12. 2021.
  36. 1 2 "OBCD Consortium". Arhivirano s originala, 12. 8. 2020. Pristupljeno 12. 12. 2021.

Vanjski linkovi

[uredi | uredi izvor]