LRRC41

S Wikipedije, slobodne enciklopedije
LRRC41
Identifikatori
AliasiLRRC41
Vanjski ID-jeviMGI: 2441984 HomoloGene: 4645 GeneCards: LRRC41
Lokacija gena (čovjek)
Hromosom 1 (čovjek)
Hrom.Hromosom 1 (čovjek)[1]
Hromosom 1 (čovjek)
Genomska lokacija za LRRC41
Genomska lokacija za LRRC41
Bend1p34.1-p33Početak46,261,196 bp[1]
Kraj46,303,616 bp[1]
Lokacija gena (miš)
Hromosom 4 (miš)
Hrom.Hromosom 4 (miš)[2]
Hromosom 4 (miš)
Genomska lokacija za LRRC41
Genomska lokacija za LRRC41
Bend4|4 D1Početak115,932,466 bp[2]
Kraj115,954,240 bp[2]
Obrazac RNK ekspresije
Više referentnih podataka o ekspresiji
Ontologija gena
Molekularna funkcija protein homodimerization activity
Ćelijska komponenta membrana
jedro
citoplazma
citosol
Biološki proces protein ubiquitination
Posttranslacione modifikacije
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_006369

NM_153521

RefSeq (bjelančevina)

NP_006360

NP_705741

Lokacija (UCSC)Chr 1: 46.26 – 46.3 MbChr 4: 115.93 – 115.95 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Leucinom bogati protein sa ponavljanjem 40 (LRRC40) jest protein koji je kod ljudi kodiran genom LRRC40 sa hromosoma 1.[5]

Aminokiselinska sekvenca[uredi | uredi izvor]

Dužina polipeptidnog lanca je 602 aminokiseline, a molekulska težina 68.250 Da.[6]

1020304050
MSRLKRIAGQDLRAGFKAGGRDCGTSVPQGLLKAARKSGQLNLSGRNLSE
VPQCVWRINVDIPEEANQNLSFGATERWWEQTDLTKLIISNNKLQSLTDD
LRLLPALTVLDIHDNQLTSLPSAIRELENLQKLNVSHNKLKILPEEITNL
RNLKCLYLQHNELTCISEGFEQLSNLEDLDLSNNHLTTVPASFSSLSSLV
RLNLSSNELKSLPAEINRMKRLKHLDCNSNLLETIPPELAGMESLELLYL
RRNKLRFLPEFPSCSLLKELHVGENQIEMLEAEHLKHLNSILVLDLRDNK
LKSVPDEIILLRSLERLDLSNNDISSLPYSLGNLHLKFLALEGNPLRTIR
REIISKGTQEVLKYLRSKIKDDGPSQSESATETAMTLPSESRVNIHAIIT
LKILDYSDKQATLIPDEVFDAVKSNIVTSINFSKNQLCEIPKRMVELKEM
VSDVDLSFNKLSFISLELCVLQKLTFLDLRNNFLNSLPEEMESLVRLQTI
NLSFNRFKMLPEVLYRIFTLETILISNNQVGSVDPQKMKMMENLTTLDLQ
NNDLLQIPPELGNCVNLRTLLLDGNPFRVPRAAILMKGTAAILEYLRDRI
PT

Struktura proteina[uredi | uredi izvor]

sekundarna struktura proteina ima obrazac unutar regiona ponavljanja leucina. Svako ponavljanje leucina ima β-list i α-heliks. Slika desno pokazuje konkretnu strukturu proteina nalik potkovici, sa mnogo ponavljanja bogatih leucinom. Ovisno o području gdje se LRR nalaze, drugi proteini mogu se vezati unutar krivulje potkovice ili za vanjski dio proteina.

Gen[uredi | uredi izvor]

LRRC40 se nalazi na negativnom lancu DNK (vidi smislenost) hromosoma 1 između baznih parova 70,611.483 i 70,671.223.[7] Gen proizvodi iRNK sa 2.958 baznih parova. U ljudskom genu ima 15 predviđenih egzona [8] sa četiri druga obrasca prerade predviđena na GeneCards prema Alternative Splice Database.[9]

Gensko susjedstvo[uredi | uredi izvor]

LRRC40 je nizvodno susedan sa LRRC7 (70,225,888 - 70,587,570) na pozitivnom DNK lancu i uzvodno sa SRSF11 (70,687,320-70,716,488) na pozitivnom DNK lancu.

Ekspresija gena[uredi | uredi izvor]

LRRC40 je eksprimiran između 50. i 100. percentila u skoro svakom tkivu u tijelu.[10]

Protein[uredi | uredi izvor]

Iako tačna funkcija proteina LRRC40 još nije shvaćena, vjeruje se da učestvuje u interakcijama protein-protein jer je član porodice proteina leucinom bogata ponavljanja, za koje se zna da učestvuju u interakcijama protein-protein.[11]

Svojstva[uredi | uredi izvor]

LRRC40 je protein od 602 aminokiseline sa molekulskom težinom od 68,254 kDa i izoelektričnom tačkom od 6,04.[12] Očekuje se da se LRRC40 nalazi u ćelijskom jedru[13] i nema transmembranske domene da ga usidri za jedrovu membranu. LRRC40 ima mnogo predviđenih mjesta fosforilacije. Od 19 predviđenih fosfoserinskih lokacija, samo dvije su konzervirane unutar ortologa.[14] Ova dva mjesta S38 i S391.

Interakcije proteina[uredi | uredi izvor]

Prema Genecards-u, LRRC40 ima 756 mogućih interakcija proteina.[9] Ove interakcije su zasnovane na rezultatima u bazi podataka Molecular Interaction, koja pruža dvije moguće interakcije proteina. Dva proteina su opisana u tabeli ispod.

Skraćenica Protein Pristup bazi NCBI Ćelijska lokacija Funkcija
CDC5L Protein sličan proteinu 5 ciklusa ćelijske diobe NP_001244 Jedro regulacija transkripcije i prerada iRNK [15]
SNW1 Ski-interaktivni protein NP_036377.1 Jedro Prerada iRNK [16]

Distribucija po vrstama[uredi | uredi izvor]

LRRC40 je konzerviran kod svih svojih ortologa. Cijeli protein je visoko konzerviran kod sisara, dok je konzerviranost visoka unutar ponavljanja bogatih leucinom u ostatku ortologa.[17] Ortolozi su pronađeni sve do grimizne morske anemone i homolozi su pronađeni u bakterija i Archaea pomoću BLAST-a.[18] The following table gives information on the homologs of LRRC40.

Rod i vrsta Uobičajeno ime Datiranje divergencije od ljudske loze (milioni godina) [19] NCBI mRNA accession Sequence similarity [18] Dužina protena Uobičajeni naziv gena
Homo sapiens[8] Čovjek -- NM_017768 100% 602 LRRC40
Pan troglodytes[20] Obični čimpanza 6,4 XM_513483 99% 602 Hipotetski protein
Pongo abelii [21] Orangutan 15.8 NM_001131180 99% 602 LRRC40
Macaca fascicularis [22] Dugorepi makak-majmun 30,2 AB179219 99% 602 Puni LRRC40
Callithrix jacchus [23] Obični marmozet 43,9 XM_002750952.1 99% 602 Predviđeni: LRRC40
Sus scrofa [24] Divlja svinja 92,5 XM_003127928 96% 602 Predviđeni: LRRC40-liki protein
Mus musculus [25] Miš 94,1 NM_024194 92% 602 LRRC40
Monodelphis domestica [26] Oposum 160,2 XM_001379417 86% 598 Hipotetski protein
Gallus gallus [27] Kokoš 274,8 NM_001031295 85% 603 LRRC40
Taeniopygia guttata [28] Zebrasta zeba 274,8 XM_002188367 85% 605 Predviđeni: LRRC40
Xenopus (Silurana) tropicalis [29] Zapadna kandžasta žaba 389,7 NM_001011310 80% 605 LRRC40
Danio rerio [30] Zebrica 444,3 NM_199862 83% 601 LRRC40
Salmo salar [31] Losos 444,3 BT043621 82% 600 LRRC40
Nematostella vectensis [32] Grimizna morska anemona 830,3 XM_001640230 66% 602 Predviđeni protein
Culex quinquefasciatus [33] Južni kućni komarac 838,3 XM_001842697.1 58% 612 LRRC40

Reference[uredi | uredi izvor]

  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000132128 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000028703 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ "Entrez Gene: leucine rich repeat containing 40".
  6. ^ "UniProt, Q9H9A6" (jezik: eng.). Pristupljeno 30. 11. 2021.CS1 održavanje: nepoznati jezik (link)
  7. ^ "NCBI Gene: 55631".
  8. ^ a b "NCBI Nucleotide: NM_017768.4".
  9. ^ a b "GeneCards: LRRC40".
  10. ^ "GEO Profiles: LRRC40 GDS596".
  11. ^ Kobe B, Kajava AV (decembar 2001). "The leucine-rich repeat as a protein recognition motif". Curr. Opin. Struct. Biol. 11 (6): 725–32. doi:10.1016/S0959-440X(01)00266-4. PMID 11751054.
  12. ^ "ExPASy: Compute PI/Mw". Arhivirano s originala, 23. 7. 2003.
  13. ^ "PSORTII: Protein Localization Tool".[trajno mrtav link]
  14. ^ "NetPhos 2.0 Server: Phosphorylation Prediction".
  15. ^ "MINT: CDC5L". Arhivirano s originala, 18. 2. 2013.
  16. ^ "MINT: SNW1". Arhivirano s originala, 18. 2. 2013.
  17. ^ Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, Thompson JD (juli 2003). "Multiple sequence alignment with the Clustal series of programs". Nucleic Acids Res. 31 (13): 3497–500. doi:10.1093/nar/gkg500. PMC 168907. PMID 12824352.
  18. ^ a b "NCBI BLAST".
  19. ^ "Time Tree".
  20. ^ "NCBI Nucleotide: XP_513483".
  21. ^ "NCBI Nucleotide: NM_001131180".
  22. ^ "NCBI Nucleotide: AB179219".
  23. ^ "NCBI Nucleotide: XM_002750952.1".
  24. ^ "NCBI Nucleotide: XM_003127928".
  25. ^ "NCBI Nucleotide: NM_024194".
  26. ^ "NCBI Nucleotide: XM_001379417".
  27. ^ "NCBI Nucleotide: NM_001031295".
  28. ^ "NCBI Nucleotide: XM_002188367".
  29. ^ "NCBI Nucleotide: NM_001011310".
  30. ^ "NCBI Nucleotide: NM_199862".
  31. ^ "NCBI Nucleotide: BT043621".
  32. ^ "NCBI Nucleotide: XM_001640230".
  33. ^ "NCBI Nucleotide: XM_001842697.1".