DNA-sekvensenDet er sekvensen af nucleotider, der indeholder koden eller instruktionerne til at fremstille de molekyler, som er nødvendige i en levende organisme. De fire bogstaver i den genetiske kodebog kan kombineres på uendeligt mange måder. Tænk blot på, at der findes 16 forskellige sekvenser af to baser (24 muligheder), og en sekvens på 1000 baser kan laves på 10004 = 1.000.000.000.000 måder. I en E. coli-bakterie findes der ca. 4.400 gener med en gennemsnitslængde på ca. 1.000 nucleotider, så der er et astronomisk antal muligheder for at danne disse gener. Det er dog kun nogle ganske få af disse muligheder, der kan bruges for at danne en E. coli-bakterie. Hvis man sammenligner sekvensen af genomet fra to forskellige E. colibakterier, vil man finde, at der i gennemsnit er forskelle i 0,1 - 0,2% af baserne. Det er det samme, man ser, hvis man sammenligner to menneskers genomer. Disse forskelle afgør, om man er høj eller lav; neger eller kineser; blond eller rødhåret, men også om man har en arvelig (genetisk) sygdom, og om man bliver syg eller ej. Det er derfor yderst interessant at kende sekvensen af det menneskelige genom og dermed kunne sammenligne menneskelige genomer for at finde sammenhænge mellem sekvensvariation og udseende eller sygdomsbillede. |