INAVA

S Wikipedije, slobodne enciklopedije
INAVA
Identifikatori
AliasiINAVA
Vanjski ID-jeviOMIM: 618051 MGI: 1921579 HomoloGene: 10103 GeneCards: INAVA
Lokacija gena (čovjek)
Hromosom 1 (čovjek)
Hrom.Hromosom 1 (čovjek)[1]
Hromosom 1 (čovjek)
Genomska lokacija za INAVA
Genomska lokacija za INAVA
Bend1q32.1Početak200,891,048 bp[1]
Kraj200,915,742 bp[1]
Lokacija gena (miš)
Hromosom 1 (miš)
Hrom.Hromosom 1 (miš)[2]
Hromosom 1 (miš)
Genomska lokacija za INAVA
Genomska lokacija za INAVA
Bend1 E4|1Početak136,141,269 bp[2]
Kraj136,162,002 bp[2]
Ontologija gena
Molekularna funkcija GO:0001948, GO:0016582 vezivanje za proteine
Ćelijska komponenta jedro
citoplazma
Biološki proces pattern recognition receptor signaling pathway
cytokine production involved in immune response
response to peptidoglycan
response to muramyl dipeptide
positive regulation of interleukin-1 beta production
positive regulation of interleukin-10 production
positive regulation of interleukin-6 production
positive regulation of stress-activated MAPK cascade
positive regulation of I-kappaB kinase/NF-kappaB signaling
nucleotide-binding oligomerization domain containing 2 signaling pathway
reactive oxygen species biosynthetic process
immune system process
Urođeni imunski sistem
positive regulation of protein ubiquitination
adherens junction maintenance
intestinal epithelial structure maintenance
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_001142569
NM_018265
NM_001367289
NM_001367290

NM_028872

RefSeq (bjelančevina)

NP_001136041
NP_060735
NP_001354218
NP_001354219

NP_083148
NP_001392081
NP_001392082
NP_001392083

Lokacija (UCSC)Chr 1: 200.89 – 200.92 MbChr 1: 136.14 – 136.16 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

INAVA, ponekad označavan kao hipotetski protein LOC55765, jest protein nrepoznate funkcije koji je kod ljudi kodiran genom INAVA sa hromosoma 1.[5] Manje uobičajeni aliasi gena uključuju oznake FLJ10901 i MGC125608.

Aminokiselinska sekvenca[uredi | uredi izvor]

Dužina polipeptidnog lanca je 663 aminokiseline, a molekulska težina 72.914 Da.[6]

1020304050
MLQMPKLNEIPPGRAGRREARGEGRWPGQTGPEAARLEWRAQGQAGGARA
PWDSWGSSRLPTQPGPGWSRCPPSLLCALSFQKSTMESKDEVSDTDSGII
LQSGPDSPVSPMKELTHAVHKQQRALEARLEACLEELRRLCLREAELTGT
LPAEYPLKPGEKAPKVRRRIGAAYKLDDWALHREDPLSSLERQLALQLQI
TEAARRLCLEENLSRQARRQRKHSMLQEEKKLQELQRCLVERRRNSEPPP
AAALPLGRELSASDDSSLSDGLLLEEEESQVPKPPPESPAPPSRPLPPQT
LEGLQPTGPEAGSPERAPVQNSPWKETSLDHPYEKPRKSSEPWSESSSPA
TTPQDGPSASSLWLLEPASYHVVPIRGVPGQWQGRTSAPATPEIQGRRGQ
SQSLRVDSFRAGPEGRGRSAFPRRRPTHYTVTVPDSCFPATKPPLPHAAC
HSCSEDSGSDVSSISHPTSPGSSSPDISFLQPLSPPKTHRHRGAWVPAGS
RELVAHHPKLLLPPGYFPAGRYVVVAESPLPPGEWELRRAAPGPAYEEEG
TPLRYQRLVPSRSRIVRTPSLKDSPAGRGLSKAAVSEELKWWHERARLRS
TRPHSLDRQGAFRVRSLPLGREGFGRALGPRAQVPTVCVLRRSPDGAPVQ
VFVPEKGEIISQV

Struktura[uredi | uredi izvor]

Predviđeno je da se uoredene zavojnice nalale izmešu ostatka 130–160 i 200–260.[7] Predviđeno je da sekundarni sastav bude oko 60% opredenih zavojnica, 30% alfa-heliksa i 10% beta-listova.[8]

Gen[uredi | uredi izvor]

Lokacija[uredi | uredi izvor]

Položaj C1orf106 na hromosomu 1

Kod ljudi, INAVA se nalazi na dugom kraku hromosoma 1, na lokusu 1q32.1. Proteže se na plus lancu, od pp 200,891.499 do bp 200,915.736 (24,238 kb).[5]

Gensko susjedstvo[uredi | uredi izvor]

Gensko susjedstvo C1orf106-a

INAVA je okružen genoma za receptor 25, spojenim sa G-proteinskim (uzvodno) i glavnog člana porodice 3 koji je sličan toplotnom (MROH3P), predviđenim nizvodnim pseudogenom. Ribosomni pseudogenski 6 protein L34 (RPL34P6) je dalje uzvodno, a član porodice kinezina 21B je dalje nizvodno.[5]

Promotor[uredi | uredi izvor]

Predviđena regija promotora C1orf106 s navodnim mjestima vezivanja faktora transkripcije

Postoji sedam predviđenih promotora za INAVA, a eksperimentalni dokazi sugeriraju da se izoforme 1 i 2, kao najčešće, transkribiraju korištenjem različitih promotora.[9] MatInspector, alat dostupan preko Genomatixa, korišten je za predviđanje mjesta vezanja transkripcijskih faktora unutar potencijalnih promotorskih regija. Transkripcijski faktori za koje se predviđa da ciljaju na očekivani promotor za izoformu 1 eksprimirani su u nizu tkiva. Najčešća ekspresijska tkiva su urogenitalni i nervni sistem, te koštana srž. Ovo se poklapa sa podacima o ekspresiji za protein INAVA, koji je visoko eksprimiran u bubrezima i koštanoj srži.[10] Dijagram predviđenog promotorskog regiona, sa istaknutim mestima vezivanja faktora transkripcije, prikazan je desno. Faktori za koje se predviđa da će se vezati za promotorsku regiju izoforme 2 se razlikuju, a 12 od prvih 20 predviđenih faktora izraženo je u krvnim ćelijama i/ili tkivima kardiovaskularnog sistema.

Ekspresija[uredi | uredi izvor]

C1orf106 eksprimira se u širokom spektru tkiva. Podaci o ekspresiji iz GEO profila prikazani su ispod. Mjesta najveće ekspresije su navedena u tabeli. Ekspresija je umjerena u placenti, prostati, sjemenicima, plućima, pljuvačnim žlijezdama i dendritskim ćelijama. Niska razu+inaa mu je u mozgu, većini imunskih ćelija, nadbubrežnim žlijezdamya, maternici, srcu i adipocitima.[10] Podaci o ekspresiji, iz različitih eksperimenata, pronađeni na GEO profilima, sugeriraju da je ekspresija INAVA pojačano regulirana u nekoliko karcinoma uključujući: rak pluća, jajnika, kolorektumski i dojke

Podaci o ekspresiji C1orf106, prema GEO profilima
Tkivo Rang
(percentili)
B-limfociti 90
Traheja 89
Koža 88
Ćelije ljudskog bronhijskog epitela 88
Kolorektumski adenokarcinom 87
Bubreg 87
Jezik 85
Gušterača 84
Crvuljak 82
Koštana srž 80

iRNK[uredi | uredi izvor]

Izoforme[uredi | uredi izvor]

Proizvedeno je devet navodnih izoformi gena INAVA, od kojih se predviđa da sedam kodira proteine.[11] Izoforme 1 i 2, prikazane u nastavku, najčešće su izoforme.

Najćešće izoforme C1orf106

Izoforma 1, koja je najduža, prihvaćena je kao kanonska izoforma. Sadrži deset egzona, koji kodiraju protein dug 677 aminokiselina, ovisno o izvoru. Neki izvori navode da se protein sastoji od samo 663 aminokiseline, zbog upotrebe startnog kodona koji se nalazi nizvodno 42 nukleotida. Prema NCBI, ova izoforma je predviđena samo računarski.[5] Ovo može biti zato što je Kozak sekvenca koja okružuje nizvodni start kodon sličnija konsenzusnoj Kozakovoj sekvenci, kao što je prikazano u tabeli ispod. Za dobianje sekvence predviđene izoforme korišten je Softberry program.[12] Izoforma 2 je kraća zbog skraćenog N-kraja. Obje izoforme imaju alternativna mjesta poliadenilacija.[11]

Okolna sekvenca startnih kodona u poređenju sa Kozakovom konsenzusnom sekvencom
Okolna sekvenca startnih kodona u poređenju sa Kozakovom konsenzusnom sekvencom

Regulacija miRNK[uredi | uredi izvor]

Predviđena viljna sekvenca miRNK

miRNK-24 identificirana je kao mikroRNK koja bi potencijalno mogla ciljati INAVA iRNK.[13] Prikazano je mjesto vezivanja koje se nalazi u 5' neprevedenoj regiji.

Protein[uredi | uredi izvor]

Opća svojstva[uredi | uredi izvor]

Protein C1of106 (izoforma 1)

Izoforma 1, dijagram ispod, sadrži domen DUF3338, dvije regije niske složenosti i regiju bogatu prolinom. Protein je bogat argininom i prolinom i ima manju od prosječne količine asparagina i hidrofobnih aminokiselina, posebno fenilalanina i izoleucina.[14] Izoelektrična tačka je 9,58, a molekulska težina nemodifikovanog proteina je 72,9 kDa.[15] Nije predviđeno da protein ima N-terminalni signalni peptid, ali postoje predviđeni signali jedarne lokalizacije (NLS) i leucinom bogat jedarni eksportni signal.[16][17][18]

Modifikacije[uredi | uredi izvor]

Predviđa se da je INAVA visoko fosforiliran.[19][20] Mjesta fosfoilacije koja predviđa PROSITE prikazana su u tabeli ispod. NETPhos predviđanja ilustrovana su na dijagramu. Svaka linija ukazuje na predviđeno mjesto fosforilacije i povezuje se sa slovom koje predstavlja ili serin (S), treonin (T) ili tirozin (Y).

Predviđena mjesta fosforilacije prema PROSITE-u
Predviđena mjesta fosforilacije prema PROSITE-u
predviđena jesta fosforilacije prema NETPhos-i. Slova odgovaraju serinu (S), treoninu (T) uli tirotinu (Y).

Interakcije[uredi | uredi izvor]

Proteini sa kojima INAVA protein interraguje nisu dobro okarakterisani. Dokazi sugeriraju da INAVA može stupiti u interakciju sa sljedećim proteinima: DNAJC5G, SLC7A13, PIEZO2, MUC19.[21] Eksperimrntalni dokazi, prema pregledu dvohibridnog kvasca, sugeriraju da protein INAVA ima interakcije sa proteinom 14-3-3 sigma, koji je adapterski protein.[22]

Homologija[uredi | uredi izvor]

INAVA je dobro konzervirana kod kičmenjaka kao što je prikazano u tabeli ispod. Sekvence su preuzete sa BLAST-a.[23] i BLAT-a.[24]

Sekvenca Rod i vrsta Uobičajeno ime Pristup za NCBI Dužinma (aa) Identitet sekvence Datiranje divergencije od ljudske loze (milioni godina prije današnjice)
* C1orf106 Homo sapiens Čovjek NP_060735.3 667 100% N/A
* C1orf106 Macaca fascicularis Rakojedi makak XP_005540414.1 703 97% 29,0
* LOC289399 Rattus norvegicus Smeđi pacov NP_001178750.1 667 86% 92,3
* Predviđeni homolog C1orf106-a Odobenus rosmarus divergens Morž XP_004392787.1 672 85% 94.2
* C1orf106-oliki Loxodonta africana Afrički slon XP_003410255.1 663 84% 98,7
* Predviđeni C1orf106 homolog Dasypus novemcinctus Devetoprigi armadilo XP_004478752.1 676 81% 104,2
* Predviđeni C1orf106 homolog Ochotona princeps Američki pika XP_004578841.1 681 78% 92,3
* Predviđeni C1orf106 homolog Monodelphis domestica Sivi kratkorepi oposum XP_001367913.2 578 76% 162,2
* Predviđeni C1orf106 homolog Chrysemys picta bellii Obojena kornjača XP_005313167.1 602 56% 296,0
* Predviđeni C1orf106 homolog Geospiza fortis Srednjeprizemna zeba XP_005426868.1 542 50% 296,0
* Predviđeni C1orf106 homolog Alligator mississippiensis Aligator XP_006278041.1 547 49% 296,0
* Predviđeni C1orf106 homolog Ficedula albicollis Ogrličasta muharica XP_005059352.1 542 49% 296,0
Predviđeni C1orf106 homolog Latimeria chalumnae Latimerija zapadnoindijskog okeana XP_005988436.1 613 46% 414.9
* Predviđeni C1orf106 homolog Lepisosteus oculatus Pjegava riba gar XP_006628420.1 637 44% 400.1
* FERM sa domenom 4A Xenopus (Silurana) tropicalis Zapadna kandžasta žaba XP_002935289.2 695 43% 371,2
* Predviđeni C1orf106 homolog Oreochromis niloticus Nilska tilapija XP_005478188.1 576 40% 400.1
Predviđeni C1orf106 homolog Haplochromis burtoni Burtonova astatotilapija XP_005914919.1 576 40% 400,1
Predviđeni C1orf106 homolog Pundamilia nyererei Haplohromis riba XP_005732720.1 577 40% 400,1
* LOC563192 Danio rerio Zebrica NP_001073474.1 612 37% 400,1
LOC101161145 Oryzias latipes Riba japanskih rižinih polja XP_004069287.1 612 33% 400,1

Grafikon identiteta sekvence u odnosu na vrijeme od divergencije za unose označene zvjezdicom prikazan je ispod. Boje odgovaraju stepenu srodnosti (zelena = blisko srodna, ljubičasta = udaljeni srodnik).

Postotak identiteta sekvence u odnosu na srodnost vrsta

Paralozi[uredi | uredi izvor]

Proteini koji se smatraju INAVA paralozima nisu konzistentni između baza podataka. Napravljeno je višestruko poravnavanje sekvenci (MSA) potencijalno paralognih proteina kako bi se utvrdila vjerovatnoća prave paralogne veze.[25] Sekvence su izvučene iz pretrage BLAST-a kod ljudi sa proteinom C1orf106. MSA sugerira da proteini dijele homologni domen, DUF3338, koji se nalazi kod eukariota. Dio višestrukog poravnavanja je prikazan ispod. Osim DUF domena (uokviren zelenom bojom), bilo je malo konzerviranosti. DUF3338 domen nema nikakva izvanredna fizička svojstva; međutim, značajan je nalaz da se predviđa da svaki od proteina u MSA ima dva signala jedarne lokalizacije. Predviđa se da će se svi proteini u MSA lokalizirati u jedru.[16] U tabeli prikazano jr i poređenje konduciranih fizičnih svojstava proteina i SAPS-a.[14]

Konzervacija ljudskog domena DUF3338

[[slika:Paralog Properties (C1orf106.png|frameless|center|650x500px|Fizička svojstva potencijalnih [[paralog]a]]]

Klinički značaj[uredi | uredi izvor]

U genskoj regiji INAVA identificirano je ukupno 556 jednonukleotidnih polimorfizama (SNP), od kojih je 96 povezano s kliničkim uzrokom.[26] Rivas et al.[27] dentificirali su četiri i SNP-a, prikazana u tabeli ispod, koji mogu biti povezani sa upalnom bolešću crijeva i Crohnovom bolešću. Prema GeneCards, druge asocijacije bolesti mogu uključivati multiplu sklerozu i ulcerozni kolitis.[28]

Ostatak Promjena Napomana
333 (rs41313912) Tirozinfenilalanin Fosforilizizan , omjereno konzerviran
376 Arginincistein Umjereno konzerviran
397 Arginintreonin Nekonzerviran
554 (rs61745433) Arginin ⇒ cistein Umjereno konzerviran

Modelni organizmi[uredi | uredi izvor]

U proučavanju funkcije INAVA korišteni su modelni organizmi . Uslovna nokaut-mišja linija pod nazivom 5730559C18Riktm2a(EUCOMM)Wtsi generirana je na Institutu Wellcome Trust Sanger.[29] Mužjaci i ženke su podvrgnuti standardizovanom fenotipskom pregledu[30] za određivanje efekata delecija.[31][32][33][34] Urađeni su dodatni pregledi: Dubinska imunološka fenotipizacija[35] kostiju i hrskavice.[36]

5730559C18Rik fenotip nokaut-miševa
Svojstvo Fenotip
Svi podaci su zaspoloživi na:[30][35][36]
Leukociti periferne krvi 6 sedmica Normalan
Insulin Normalan
Hematologija 6 sedmica Normalan
Vijabilnost homozigota na P14 Normalan
Plodnost homozigota Normalan
Tjelesna težina Normalan
Neurološla procjena Normalan
Snaga stiska Normalan
Dismorfologija Normalan
Indirektna kalorimetrija Normalan
Test tolerancije glukoze Normalan
Slušni odgovor moždanog stabla Normalan
DEXA Normalan
Radiografija Normalan
Morfologija oka Normalan
Klinička hemija Normalan
Hematologija 16 sedmica Normalan
Leukociti periferne krvi 16 sedmica Normalan
Težina srca Normalan
Salmonella infekcija Normalan
Funkcija citotoksičnih T-ćelija Normalan
Imunofenotipizacija slezene Normalan
Imunofenotipizacija mezenternog limfnog čvora Normalan
Imunofenotipizacija koštane srži Normalan
Kompozicija epidermne imunosti Normalan
Izazov gripe Normalan

Reference[uredi | uredi izvor]

  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000163362 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000041605 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b c d "NCBI Gene 55765". Pristupljeno 10. 2. 2014.
  6. ^ "UniProt, Q3KP66" (jezik: en.). Pristupljeno 12. 12. 2021.CS1 održavanje: nepoznati jezik (link)
  7. ^ "ExPASy COILS". Arhivirano s originala, 22. 4. 2014. Pristupljeno 20. 4. 2014.
  8. ^ "SOPMA". Pristupljeno 27. 4. 2014.
  9. ^ "Genomatix: MatInspector". Arhivirano s originala, 2. 12. 2021. Pristupljeno 6. 3. 2014.
  10. ^ a b "GEO Profiles". Pristupljeno 6. 3. 2014.
  11. ^ a b "Aceview". Pristupljeno 6. 3. 2014.
  12. ^ "Softberry". Pristupljeno 20. 4. 2014.
  13. ^ "TargetScanHuman 6.2". Pristupljeno 15. 4. 2014.
  14. ^ a b "Statistical Analysis of Protein Sequences". Pristupljeno 20. 4. 2014.
  15. ^ "Compute pI/Mw tool". Pristupljeno 10. 4. 2014.
  16. ^ a b "PSORTII". Pristupljeno 20. 4. 2014.
  17. ^ "cNLS Mapper". Arhivirano s originala, 22. 11. 2021. Pristupljeno 20. 4. 2014.
  18. ^ "NetNES". Pristupljeno 20. 4. 2014.
  19. ^ "NETPhos". Pristupljeno 20. 4. 2014.
  20. ^ "Swiss Institute of Bioinformatics: PROSITE".
  21. ^ "STRING". Pristupljeno 15. 4. 2014.
  22. ^ "MINT". Pristupljeno 15. 4. 2014.
  23. ^ "BLAST". Pristupljeno 8. 3. 2014.
  24. ^ "BLAT". Pristupljeno 8. 3. 2014.
  25. ^ "SDSC Biology Workbench: ClustalW". Pristupljeno 12. 3. 2014.
  26. ^ "dbSNP". Pristupljeno 22. 4. 2014.
  27. ^ Rivas MA; et al. (2011). "Deep resequencing of GWAS loci identifies independent rare variants associated with inflammatory bowel disease". Nature Genetics. 43 (11): 1066–1073. doi:10.1038/ng.952. PMC 3378381. PMID 21983784.
  28. ^ "GeneCards". Pristupljeno 1. 5. 2014.
  29. ^ Gerdin AK (2010). "The Sanger Mouse Genetics Programme: high throughput characterisation of knockout mice". Acta Ophthalmologica. 88: 925–7. doi:10.1111/j.1755-3768.2010.4142.x. S2CID 85911512.
  30. ^ a b "International Mouse Phenotyping Consortium".
  31. ^ Skarnes WC, Rosen B, West AP, Koutsourakis M, Bushell W, Iyer V, Mujica AO, Thomas M, Harrow J, Cox T, Jackson D, Severin J, Biggs P, Fu J, Nefedov M, de Jong PJ, Stewart AF, Bradley A (Jun 2011). "A conditional knockout resource for the genome-wide study of mouse gene function". Nature. 474 (7351): 337–42. doi:10.1038/nature10163. PMC 3572410. PMID 21677750.
  32. ^ Dolgin E (Jun 2011). "Mouse library set to be knockout". Nature. 474 (7351): 262–3. doi:10.1038/474262a. PMID 21677718.
  33. ^ Collins FS, Rossant J, Wurst W (Jan 2007). "A mouse for all reasons". Cell. 128 (1): 9–13. doi:10.1016/j.cell.2006.12.018. PMID 17218247. S2CID 18872015.
  34. ^ White JK, Gerdin AK, Karp NA, Ryder E, Buljan M, Bussell JN, Salisbury J, Clare S, Ingham NJ, Podrini C, Houghton R, Estabel J, Bottomley JR, Melvin DG, Sunter D, Adams NC, Sanger Institute Mouse Genetics Project, Tannahill D, Logan DW, Macarthur DG, Flint J, Mahajan VB, Tsang SH, Smyth I, Watt FM, Skarnes WC, Dougan G, Adams DJ, Ramirez-Solis R, Bradley A, Steel KP (2013). "Genome-wide generation and systematic phenotyping of knockout mice reveals new roles for many genes". Cell. 154 (2): 452–64. doi:10.1016/j.cell.2013.06.022. PMC 3717207. PMID 23870131.
  35. ^ a b "Infection and Immunity Immunophenotyping (3i) Consortium". Arhivirano s originala, 21. 5. 2015. Pristupljeno 12. 12. 2021.
  36. ^ a b "OBCD Consortium".

Vanjski linkovi[uredi | uredi izvor]