Des données de séquençage de haute qualité sont un élément important pour s’assurer que vos données sont fiables et reproductibles, et obtenir des données de séquençage de haute qualité signifie utiliser un matériau de départ de haute qualité. Pour les données RNA-seq, cela signifie utiliser un ARN ayant un RIN (RNA Integrity Number) élevé, une échelle de 10 points de 1 à 10 qui fournit un nombre standardisé aux chercheurs indiquant la qualité de leur ARN, éliminant ainsi le biais individuel et l’interprétation du processus.
Le RIN est une amélioration significative par rapport à la façon dont l’intégrité de l’ARN était précédemment calculée: le rapport 28S et 18S. Étant donné que 28S est d’environ 5 ko et que 18S est d’environ 2 ko, le rapport idéal 28S: 18S est de 2,7: 1 – mais le point de référence est considéré comme environ 2: 1. Cependant, cette mesure repose sur l’hypothèse que la qualité de l’ARNr (une molécule très stable) reflète linéairement la qualité de l’ARNm, qui est en fait beaucoup moins stable et connaît un renouvellement plus élevé.
Figure 1: Traces d’ARN d’échantillons d’ARN avec des valeurs de RIN différentes. Notez la différence entre les échantillons de haute et de basse qualité.
Heureusement, Agilent Technologies a développé une meilleure méthode : la valeur RIN. Agilent a développé un algorithme sophistiqué qui calcule la valeur de RIN, une mesure qui constitue une amélioration considérable par rapport au rapport 28S:18S. Le RIN est une amélioration en ce sens qu’il prend en compte l’intégralité de l’échantillon d’ARN, pas seulement les mesures d’ARNr, comme vous pouvez le voir sur la figure 1
L’importance de l’intégrité de l’ARN dans la détermination de la qualité de l’expression des gènes a été examinée par Chen et al. en 2014, en comparant des échantillons d’ARN de 4 nombres de RIN différents (de 4,5 à 9,4) et 3 méthodes de préparation de bibliothèques différentes (sélection de poly-A, ARNr appauvri et ARN total) pour un total de 12 échantillons. Ils ont ensuite calculé le coefficient de corrélation de l’expression génique entre l’ARN de la plus haute qualité et les échantillons les plus dégradés entre les méthodes de préparation de la bibliothèque.
Figure 2: Seules les préparations de banques d’ARN sélectionnées par poly-A présentent une diminution de la qualité des données avec une diminution de la valeur du RIN.
De manière fascinante, la seule méthode de préparation de bibliothèque qui a montré une diminution significative de la corrélation entre l’ARN de haute qualité et de faible qualité était la méthode de préparation de bibliothèque sélectionnée par poly-A. Les deux autres méthodes de préparation de la bibliothèque avaient encore des coefficients de corrélation supérieurs à 0,95, même à faible rinçage (voir Figure 2)!
Chen et al. théorisez que la raison derrière cela est que les échantillons dégradés qui sont sélectionnés poly-A entraîneront une préparation de bibliothèque de plus en plus biaisée de 3 ‘, et que vous perdrez donc des lectures précieuses de vos données. Étant donné que les autres méthodes impliquent soit l’absence de traitement, soit l’élimination de l’ARNr (par opposition à la sélection), il y aura beaucoup moins de biais dans l’échantillon global.
Même s’il semble que seule la méthode de préparation de la bibliothèque sélectionnée par poly-A souffre d’une RIN faible, les fournisseurs préfèrent toujours travailler avec des échantillons d’ARN de qualité relativement élevée pour toutes les méthodes de préparation de la bibliothèque. Cependant, si vous avez des échantillons importants de RIN de qualité inférieure, il peut être utile de discuter de vos options avec un fournisseur directement – et Genohub est plus qu’heureux de vous aider à faciliter vos discussions! Veuillez nous contacter ici si vous avez d’autres questions sur le séquençage d’échantillons avec un RIN médiocre.