U nedavnoj studiji, navodi se da se otkrivanjem kompletne ljudske genomske sekvence fokus prebacuje na identifikaciju gena i na funkcionalnu analizu genskih proizvoda. Generiranje niza cDNK, i sekvenci i fizičkih klonova, koji sadrži potpune i neprekinute regije za kodiranje proteina svih ljudskih gena, pružit će neophodne alate za sistemsku i sveobuhvatnu analizu proteinske funkcije, kako bi se na kraju razumjela molekulska osnova čovjeka. Sekvenciranjem i analizom 500 novih ljudskih cDNK koje sadrže potpuni okvir za kodiranje proteina, dodjeljena je funkcionalna kategorizacija bilo je moguće sekvence za 52% (259) kodiranih proteina, a preostala frakcija nema sličnosti s poznatim proteinima. Poravnavanjem sekvenci cDNK sa sekvencama identificirani su brojni geni koji su ili potpuno promašeni u analizi genomskih sekvenci ili su pogrešno predviđeni. Čini se da su tri od ovih gena prisutna u nekoliko kopija. Može se zaključiti da je sekvenciranje cDNK pune dužine i dalje ključno za tačnu identifikaciju gena. Skup od 500 novih cDNK i još 1.000 potpuno kodiranih cDNK poznatih transkripata koji su identificirani, dodaje se reprezentacija cDNK koja pokrivaju 2% -5% svih ljudskih gena. Time se značajno doprinosi generiranju kataloga gena, koji se sastoji od potpuno kodiranih sekvenci cDNK i klonova, koji bi trebali biti dostupni i postat će neprocjenjiv alat za detaljna funkcionalna proučavanja.[5][6]