MAP11 (skr. od: M ikroubula-a socirani p rotein 11 ) je protein koji je kod ljudi kodiran genom MAP11 . Ranije je vio poznat pod generičkim imenom C7orf43 .[1] C7orf43 nema drugi ljudski pseudonim, ali se u miševa može naći kao BC037034.[2]
Dužina polipeptidnog lanca je 580 aminokiselina , а molekulska težina 62.597 Da .[3] .
10 20 30 40 50
MESQCDYSMY FPAVPLPPRA ELAGDPGRYR ALPRRNHLYL GETVRFLLVL
RCRGGAGSGT GGGPGLGSRG AWAELATALA ALASVSAGGG MPGGGGAGDQ
DSEPPGGGDP GGGGLFRGCS PLLTHGPGPA TSGGATTLPV EEPIVSTDEV
IFPLTVSLDR LPPGTPKAKI VVTVWKREIE APEVRDQGYL RLLQTRSPGE
TFRGEQSAFK AQVSTLLTLL PPPVLRCRQF TVAGKHLTVL KVLNSSSQEE
ISIWDIRILP NFNASYLPVM PDGSVLLVDN VCHQSGEVSM GSFCRLPGTS
GCFPCPLNAL EEHNFLFQLR GGEQPPPGAK EGLEVPLIAV VQWSTPKLPF
TQSIYTHYRL PSVRLDRPCF VMTASCKSPV RTYERFTVTY TLLNNLQDFL
AVRLVWTPEH AQAGKQLCEE ERRAMQAALD SVVCHTPLNN LGFSRKGSAL
TFSVAFQALR TGLFELSQHM KLKLQFTASV SHPPPEARPL SRKSSPSSPA
VRDLVERHQA SLGRSQSFSH QQPSRSHLMR SGSVMERRAI TPPVASPVGR
PLYLPPDKAV LSLDKIAKRE CKVLVVEPVK
Kod ljudi, MAP11 nalazi se u dugom kraku hromosoma 7 (7q22.1), i nalazi se na negativnom (antisens) lancu.[1] Geni koji se nalaze oko C7orf43 uključuju GAL3ST4 , LAMTOR4, GPC2 .[1] Kod ljudi, C7orf43 ima devet otkrivenih uobičajenih jednonukleotidnih polimorfizama (SNP), koji se svi nalaze u nekodirajućim regijama i stoga ne utiču na aminokiselinsku sekvencu.[4]
Gensko susjedstvo gena C7orf43 na ljudskom hromosomu 7
Primarni transkript of izoforme 1 C7orf43 sa 11 egzona i 10 introna (NCBI Aceview:C7orf43 )
MAP11 kodira dvije izoforme , dužu C7orf43 izoformu 1, od 2.585 sa 11 egzona i 10 intron .[1] C7orf43 izoforma 1 kodira protein dug 580 aminokiselina s samo jednim mjestom poliadenilacije.[1] C7orf43 izoformA 2 duga je 2.085 parova baza i kodira protein od 311 aminokiselina. U više navrata prijavljene su dvije dodatne izoforme koje kodiraju proteine sa 199 i 206 aminokiselina.[5]
Ljudski protein MAP11 ima izoelektričnu tačku od 8,94. MAP11 također ima glicin -bogato područje koje obuhvata aminokiseline 54 do 134.[6] Analiza pomoću alata SAPS SDSC Biology Workbencha pokazala je da ovo područje bogato glicinom nije konzervirano u smislu specifičnih položaja ostataka glicina, ali je dobro konzervirano u ukupnom sadržaju glicina u sisara i gmizavaca , iako ne u košljoriba .[7] [8] C7orf43 uglavnom je nenaelektrisan, a ova neutralna raspodjela naboja očuvana je kod sisara i gmizavaca, ali košljoribe imaju najmanje jednu skupinu negativnog naboja [7] [8]
Predviđeno je da C7orf43 nema signalni peptid u svojih prvih 70 aminokiselinskih ostataka. Međutim, predviđa se da vakuolno ciljani motiv u ljudskom proteinu počinje od ostatka 258.[9] Pokazalo se da je ovaj motiv vakuolnog ciljanja konzerviran kod sisara, gmizavaca, ptica , vodozemaca i košljoriba.
MAP11 ima široko rasprostranjenu umjerenu ekspresiju sa varijabilnošću tkiva do tkiva kod ljudi i kod ostalih sisarskih vrsta .[10] [11] Pokazalo se da je mišji ortolog C7orf43 sveprisutno izražen u mozgu ,[12] kao i kod mišjeg embrionskom centralnog nervnog sistema .[13]
MAP11 ima jednu promotorsku regiju , uzvodno od svog mjesta za transkripciju, kako je predviđeno Genomatix . Ovaj promotor je dug 657 parova baza i nalazi se na pozicijama 99756182 do 99756838 pb u negativnom lancu hromosoma 7.[14] Postoji nekoliko mjesta vezanja transkripcijskog faktora . koja se nalaze u ovom promotoru, uključujući mjesta vezanja za cinkov prst i faktore transkripcije slične Kruppelu .[15] 20 najboljih mjesta vezivanja transkripcije koje je predvidio ElDorado iz Genomatixa navedeno je u sljedećoj tablici.
Detaljni podaci o porodici
Detaljni podaci o matriksu
Početni položaj
Položaj kraja
Sidreni položaj
Lanac
Rezultat sličnosti matriksa
Sekvenca
Brachyury gen, faktor razvoja mezoderma
T-kutijski transkripcijski faktor TBX20
617
645
631
+
1
agcagccggAGGTgtcgggaccctctgga
C2H2 transkripcijski faktori cinkovog prsta 2
KRAB-proteion 300 sa cinkovim prstom
596
618
607
+
1
ccggccgCCCCagccgggcgcag
Domenski faktori replikacijske viljuške
Alternativno prerađena varijanta FOXP1, aktivirana u ESC-ovima
37
53
45
–
1
aaaaaaaAACAaccctt
Gen pleomorfnog adenoma
Gen 1 pleomorfnog adenoma
411
433
422
–
1
[[DNK
gaGGGGgcggggtcccgctgctc]]
Gen pleomorfnog adenoma
Pleomorphic adenoma gene 1
464
486
475
–
1
gaGGGGgcgtggccgccgaggcc
Transkripcijski faktor II B RNK-polimeraze II
Transkripcijski faktor II B (TFIIB) element prepoznavanja
197
203
200
+
1
ccgCGCC
Protein TGF-beta indicirane apoptoze
Cistein -serin -bogati jedarni protein 1 (AXUD1, AXIN1 nadregulirani 1)
73
79
76
–
1
AGAGtga
GC-kutijski faktori SP1/GC
Stimulirajući protein 1, sveprisutni faktor transkripcije cinkovih prstiju
418
434
426
–
0,998
ggaggGGGCggggtccc
Ljudski i mišji faktori ETS1
Ets varijanta 3
486
506
496
–
0,996
gagaaacaGGAAgcggaaggg
Kruepeloliki transkripcijski faktori
Krueppeloliki faktor obogaćen crijevima / KLF4
469
485
477
–
0,994
agggggcGTGGccgccg
Dvošaki homeodomen transkripcijskih faktora cinkovog prsta
AREB6 (Atp1a1 regulatorni faktor vezanja elementa 6)
495
507
501
+
0,994
ttcctGTTTctct
Transkripcijski faktor RU49 cinkovog prsta, proliferecija cinkovog prsta 1 - Zipro1
Transkripcijski faktor RU49 cinkovog prsta , proliferecija cinkovog prsta 1 - Zipro1). RU49 pokazuje snažnu sklonost vezivanju za tandemska ponavljanja minimalnog mjesta vezivanja za konsenzusni RU49.
522
528
525
+
0,994
cAGTAcc
Krueppeloliki transkripcijski faktori
Sržni promotor-vezujući protein (CPBP) sa 3 Krueppel-tipom cinkovih prstiju (KLF6, ZF9)
418
434
426
–
0,992
ggagGGGGcggggtccc
C2H2 transkripcijski faktori cinkovog prsta 7
Protein 263 cinkovog prsta, ZKSCAN12 (zinc protein cinkovog prrsta 12 sa domenima KRAB i SCAN )
425
439
432
+
0,99
cgccccCTCCtccac
C2H2 transkrippcijski faktori cinkovog prsta 6
Protein cinkovog prsta i BTB sa domenom 7, oroto-onkogen FBI-1, Pokémon (preferira sekundarno vezanje DNK )
252
264
258
–
0,989
caaGACCaccctg
Krueppeloliki transkripcijski faktori
Kruppeloliki faktor 7 (sveprisutni, UKLF)
416
432
424
–
0,989
agggGGCGgggtcccgc
GC-kutijski faktori SP1/GC
Transkripcijski faktor Sp4
471
487
479
–
0,986
ggagggGGCGtggccgc
Krueppeloliki transkripcijski faktori
Krueppeloliki faktor obogaćen crijevima
137
153
145
+
0,986
gggctcAAAGgatcctc
Krueppeloliki transkripcijski faktori
Krueppeloliki faktor 2 (plućni) (LKLF)
641
657
649
–
0,986
cgctaGGGTgggtccag
Ljudska i mišja varijanta and faktora ETS1
Ets varijanta 1
6
26
16
–
0,984
ttctcccaGGAAgattctcca
Hartley JL, Temple GF, Brasch MA (2001). "DNA cloning using in vitro site-specific recombination" . Genome Res . 10 (11): 1788–95. doi :10.1101/gr.143000 . PMC 310948 . PMID 11076863 .
Wiemann S, Weil B, Wellenreuther R, et al. (2001). "Toward a catalog of human genes and proteins: sequencing and analysis of 500 novel complete protein coding human cDNAs" . Genome Res . 11 (3): 422–35. doi :10.1101/gr.GR1547R . PMC 311072 . PMID 11230166 .
Simpson JC, Wellenreuther R, Poustka A, et al. (2001). "Systematic subcellular localization of novel proteins identified by large-scale cDNA sequencing" . EMBO Rep . 1 (3): 287–92. doi :10.1093/embo-reports/kvd058 . PMC 1083732 . PMID 11256614 .
Scherer SW, Cheung J, MacDonald JR, et al. (2003). "Human chromosome 7: DNA sequence and biology" . Science . 300 (5620): 767–72. doi :10.1126/science.1083423 . PMC 2882961 . PMID 12690205 .
Ota T, Suzuki Y, Nishikawa T, et al. (2004). "Complete sequencing and characterization of 21,243 full-length human cDNAs" . Nat. Genet . 36 (1): 40–5. doi :10.1038/ng1285 . PMID 14702039 .
Gerhard DS, Wagner L, Feingold EA, et al. (2004). "The status, quality, and expansion of the NIH full-length cDNA project: the Mammalian Gene Collection (MGC)" . Genome Res . 14 (10B): 2121–7. doi :10.1101/gr.2596504 . PMC 528928 . PMID 15489334 .
Wiemann S, Arlt D, Huber W, et al. (2004). "From ORFeome to biology: a functional genomics pipeline" . Genome Res . 14 (10B): 2136–44. doi :10.1101/gr.2576704 . PMC 528930 . PMID 15489336 .
Mehrle A, Rosenfelder H, Schupp I, et al. (2006). "The LIFEdb database in 2006" . Nucleic Acids Res . 34 (Database issue): D415–8. doi :10.1093/nar/gkj139 . PMC 1347501 . PMID 16381901 .