Comment déterminer la teneur en gc d`une séquence d`adn

La teneur en cytosine guanine, ou la teneur en GC, d`une séquence d`ADN indique le pourcentage de paires de base nucléotidiques où la guanine est liée à la cytosine. L`ADN avec une teneur en GC plus élevée sera plus difficile à séparer.

Pas

Méthode 1 de 2:
Par la main
  1. Image intitulée 7114843 1
1. Tracez la séquence et le nombre de nucléotides de cytosine (c) ou de guanine (g).
  • Image intitulée 7114843 2
    2. Divisez le nombre de nucléotides de cytosine et de guanine par le nombre total de paires de base dans la séquence.
  • Méthode 2 sur 2:
    Programmatiquement (Python 2)
    1. Image intitulée 7114843 3
    1. Créer ou accepter un fichier d`entrée. Cet article suppose que l`entrée est dans Faste format, avec une séquence unique par fichier.
  • Image intitulée 7114843 4
    2. Lire dans le fichier. Pour FASTA FORMAT:
  • Jeter la première ligne du fichier.
  • Supprimer toutes les nouvelles lignes restantes et autres espaces de suivi.
  • def init (séquence): avec ouvert (argv [1]) en entrée: séquence = "".rejoindre ([ligne.bande () pour la ligne en entrée.Readlines () [1:]]) Séquence de retour
  • Image intitulée 7114843 5
    3. Créer un compteur. ITERER à travers les données et incrémenter votre comptoir lorsque vous rencontrez des nucléotides de guanine ou de cytosine.
  • 4
    defer GCContent (séquence): GCCount = 0Pour lettre en séquence: si lettre == "g" ou lettre == "C": Gcount + = 1return gccount
  • Image intitulée 7114843 6
    5. Divisez le nombre de GC par la longueur totale de la séquence et de produire le résultat en pourcentage de format.
  • 6
    defer Main (): script, entrée = argovantence = ""Séquence = init (séquence) Imprimer "%.2f" % (flotteur (GCContent (séquence)) / LEN (séquence))

    Conseils

    Si vous calculez la teneur en GC à la main, assurez-vous de vérifier! Il peut être facile de manifester, surtout si vous analysez une longue séquence sur papier.
    Articles connexes