Seqüència de nucleòtidsUna seqüència de nucleòtids o seqüència genètica és una successió de lletres que representen part de l'estructura primària d'una molècula real o hipotètica d'àcid nucleic (ADN o ARN). Les possibles lletres són A, C, G, T i U, que simbolitzen les cinc subunitats de nucleòtids (adenina, citosina, guanina, timina i uracil), que són bases covalentment lligades a cadenes de fòsfor. En el típic cas, les seqüències es presenten enganxades les unes a les altres, sense espais, com en la seqüència AAAGTCTGAC, anant de 5' a 3' d'esquerra a dreta. Una successió de qualsevol nombre de nucleòtids major a quatre és possible de dir-se una seqüència. En relació amb la seva funció biològica, que pot dependre del context, una seqüència pot tenir sentit o antisentit, i ser tant codificant com no codificant. Les seqüències d'ADN poden contenir "ADN no codificant". Les seqüències poden derivar-se de material biològic de descartament mitjançant el procés de seqüenciació d'ADN. En alguns casos especials, les lletres seguides de A, T, C i G es presenten en una seqüència. Aquestes lletres representen ambigüitat. De totes les molècules mostres, hi ha més d'una classe de nucleòtids en aquesta posició. Les regles de la Unió Internacional de Química Pura i Aplicada (IUPAC) són les que segueixen:
Complexitat lingüística de seqüènciaLa complexitat lingüística de seqüència és una mesura de la 'riquesa del vocabulari' d'un “text genètic” dins seqüències gèniques.[1] Quan una seqüència de nucleòtids és escrita en format text utilitzant un alfabet de quatre lletres, la repetitivitat del text, és a dir, la repetició del seus N-caràcters (paraules), pot ser calculat i serveix com a mesura de la complexitat de seqüència. Per això, com més complexa siga una seqüència d'ADN, més ric serà el seu vocabulari de nucleòtids, mentre que seqüències repetitives solen tenir complexitats més baixes. Posteriorment, s'ha millorat l'algoritme original descrit en Trifonov (1990), sense canviar l'essència de l'aproximació de complexitat lingüística.[1][2][3][4] Referències
Enllaços externs |