Services
Livrables Version imprimable Convertir en PDF

Recevez vos données analysées et concentrez-vous uniquement
sur les interactions pertinentes!

L'exhaustivité des criblages ULTImate Y2H™ tout autant que le très grand nombre d'interactions répertoriées dans notre base de données nous ont permis de développer des outils bioinformatiques sophistiqués pour une analyse poussée de vos résultats:

  > Identification des Proies
Les séquences expérimentales 5' et 3' du fragment proie de chaque clone sont raboutées afin de créer des contigs (i.e. longs assemblages de séquences continues). Les séquences de ces contigs sont d'abord filtrées, afin d’écarter les motifs de séquences répétées, avant de voir leur qualité estimée (algorithme PHRED). Les protéines correspondant à ces séquences sont identifiées suite à une recherche d’identité de séquences (programme BLAST) dans des banques publiques de séquences de gènes (e.g. Genbank...).

  > Domaines fonctionnels et d'interaction
Puisque nos banques de fragments représentatifs de domaines affichent une haute complexité et sont criblées à saturation (10 fois la couverture de la banque en moyenne), nous sommes souvent capables d’isoler pour chaque interactant de multiples fragments indépendants. Le « plus petit dénominateur commun » que se partagent tous les fragments indépendants d’une même protéine proie définit le SID® (Selected Interacting Domain). Nous proposons des outils pour comparer ce domaine d’interaction expérimental à des domaines fonctionnels ou structuraux connus.

  > Attribution d’un score de confiance
Hybrigenics Services assigne à chaque interaction un score statistique de confiance, le PBS® (Predicted Biological Score) qui classe les proies selon un certain nombre de critères techniques, comme le nombre de fragments proie indépendants. Sont incorporées dans cette analyse statistique non seulement les données propres à chaque crible mais aussi l’ensemble des informations pertinentes provenant de la totalité des cribles effectués contre des banques du même organisme (interactions réciproques, appartenance à un cycle, domaines protéiques hautement connectés ou collants).

 

Le score PBS s’apparente à une E-value (Expected value), classiquement utilisée par des programmes bioinformatiques tels que BLAST. Sa valeur s’échelonne de 0 à 1 et représente la probabilité que l’interaction trouvée ne soit pas spécifique. Ces PBS se répartissent en 4 catégories, chacune représentée par une lettre de A à D, suivant l’intervalle de valeurs d’appartenance.

 •    les PBS A, B et C caractérisent des interactions bénéficiant d’un haut niveau de confiance, matérialisées par plusieurs fragments indépendants et/ou des protéines impliquées dans des interactions réciproques ou des cycles.
 •    le PBS D est assigné aux interactions représentées par un fragment unique ou par plusieurs fragments identiques. Ce sont soit des interactions difficilement détectables par la technique du double-hybride en levure classique (interactions faibles ou éphémères, rareté du transcrit au sein de la banque) mais identifiés grâce à ULTImate Y2H, soit des faux-positifs correspondant au bruit de fond de la technique.
 •    le PBS E est une catégorie spéciale regroupant les interactions impliquant des domaines proie connectés au moins 10 fois dans les organismes tels l’humain, la souris, la drosophile et Arabidopsis, et 6 fois pour tous les autres organismes. Ce seuil, fixé de manière arbitraire, nous permet de vous signaler les domaines proie les plus connectés (non-spécifiques). Notre expérience engrangée avec plus de 4500 cribles réalisés nous permet de classer les protéines fortement connectées en plusieurs catégories : i) les protéines dont la fonction biologique les amène à interagir avec un grand nombre d’autres protéines (enzymes de modification, chaperones, enzymes liées à la dégradation des protéines…) et qui dépassent facilement le seuil de 6 connections, ii) les protéines dont le domaine d’interaction contient un motif connu d’interaction entre protéines (PDZ, Ras Association Domain….) ou un motif biochimique à haute promiscuité biochimique(résidus chargés…). La forte connectivité de cette classe de proie peut donc témoigner d’interactions avérées et caractéristiques de certaines populations de protéines hautement connectées naturellement ou bien la conséquence d’une interaction biochimique réelle mais n’existant pas forcément dans le contexte cellulaire.
 •    le PBS F correspond à des artefacts de la technologie Y2H utilisée et prouvés expérimentalement. Il peut s’agir de protéines qui se lient aux domaines de liaison de LexA ou de Gal4, à la séquence d’ADN promotrice en amont du gène rapporteur…

 

Vous trouverez plus de détails sur ces modes de calcul et ces répartitions dans notre publication sur la carte d’interaction (PIM) de la drosophile (Formstecher E., et al. "Protein interaction mapping: A Drosophila case study." (2005) Genome Research).

> Découvrez bien plus que des interactions !

Trois fichiers, dépendant du type de données présentées, vous permettent d’exploiter et d’analyser vos résultats :
  > un fichier pdf établissant la synthèse de vos résultats une fois affinés
  > une feuille Excel®  regroupant l’ensemble des données brutes
  > ‘DomSight™’, un fichier au format pdf établissant la cartographie en domaines fonctionnels et structuraux des protéines proies, à comparer avec les domaines d’interaction minimaux (SID®) issus du crible.

Un exemplaire de chacun de ces fichiers est à votre disposition sur simple demande: contactez-nous !

Excel® est une marque déposée par Microsoft Corp.

 
© 2010 hybrigenics