niveau d'imputation

Poster un nouveau sujet   Répondre au sujet

Aller en bas

niveau d'imputation

Message par Ced@P3S le Mer 21 Mar - 11:14

Bonjour,

J'utilise la fonction "Refine Protein Set" pour l'agrégation des peptides en protéines, en sommant l'intensité des peptides de chaque protéines (Sum). J'ai lu que cela revient à faire une imputation des valeurs manquantes au niveau des peptides, une valeur nulle étant attribuée au données manquantes (puisqu'elle ne sont pas comptabilisées pour le calcul de l'intensité des protéines). La macro ProStaR du Data Analyser me permet ensuite de faire une imputation des données manquantes au niveau des protéines (j'utilise la fonction MLE).

Est-il possible de faire une imputation des données manquantes d'abord sur les peptides puis de faire l'agrégation en protéines ? Apparemment, il n'y a pas le module "agrégation" dans le Data Analyzer... (j'utilise les versions Proline Server et Proline Studio 1.5).

Est-il conseillé une agrégation en protéines (impliquant une imputation non contrôlée au niveau des peptides) puis une imputation au niveau protéines, comme le fait la combinaison de "Refine Protein Set" et "ProStaR", ou une imputation au niveau peptides puis l'agrégation en protéines ?

Merci pour vos réponses.

Cédric

Ced@P3S

Messages : 2
Date d'inscription : 19/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: niveau d'imputation

Message par Christophe Bruley le Jeu 22 Mar - 16:50

Bonjour Cédric,

En effet, je confirme que pour le moment il n'y a pas de module d'agrégation dans le Data Analyzer pour faire ce une imputation niveau peptide puis une agrégation protéine.

En ce qui concerne la stratégie, imputation au niveau peptide ou proteine pour le moment la stratégie le plus souvent employée (chez nous) consiste à faire l'agrégation protéique puis une imputation. L'imputation peptidique "implicite" par une valeur 0 lorsque tu fais une agrégation par la somme n'est pas sans effet mais elle est assez "conservative", donc acceptée pour le moment en attendant de faire mieux (mais les gens qui sont sur ProStaR y travaillent).
avatar
Christophe Bruley

Messages : 9
Date d'inscription : 21/03/2017
Localisation : Grenoble

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: niveau d'imputation

Message par Thomas B. le Jeu 7 Juin - 13:26

Bonjour Cédric,
Je suis d'accord avec toi: en effet, imputer au niveau protéique est équivalent à imputer implicitement au niveau peptidique par une valeur nulle (en cas d'agrégation avec un opérateur de somme), et cela introduit un biais dans les quanti. Comme le dit Christophe, ce n'est pas sens effet, mais cela est couramment fait malgré tout, chez nous, mais aussi ailleurs.

En tant que tel, je ne pense pas qu'on puisse dire que cette méthode d'imputation soit "conservative", puisqu'elle peut introduire des biais importants. En revanche, il est possible d'adopter une stratégie globale qui aura tendance à minimiser ces biais... C'est ce que nous faisons au labo, et qu'on pourrait qualifier d'approche "conservative". Cependant, ce n'est pas l'imputation en elle-même qui l'est, mais plutot la manière dont on gère les données ainsi imputées, en sachant qu'elles sont potentiellement source de biais.

Concrètement, la stratégie suivante a été mise en place sur la plateforme: toutes les protéines qui ne sont pas complètement observées dans au moins une condition donnée (donc 0% de valeur manquante dans cette condition) sont filtrées. Ainsi, les valeurs manquantes restantes sont associées à des protéines pour lesquelles les valeurs observées sont fiables, de sorte que l'imputation fonctionnera pas trop mal sur elles. En effet, si on décide d'être moins stringeant au niveau du filtrage, et donc de laisser des protéines avec potentiellement beaucoup de valeurs manquantes dans toutes conditions, on accentue le risque que des imputations implicites (par une valeur nulle au niveau peptidique) prenne de l'importance. Pour comprendre cela, il faut garder en tête que quand on combine plusieurs peptides qui ont des valeurs manquantes et des valeurs observées, on n'obtiendra au niveau protéique une valeur manquante que si tous les peptides ont une valeur manquante pour cet échantillon. Il en résulte que:
- les valeurs manquantes au niveau protéique sont plus rares
- les valeurs non-manquantes au niveau protéiques sont le fruit d'une agrégation de valeurs manquantes et non-manquantes, plus ou moins fiable en fonction de la proportion de valeurs manquantes
Du coup, en étant un peu plus stringent sur le filtrage des protéines (en ne gardant que celle qui sont suffisamment observées) on peut limiter le risque que les valeurs présentes soient trop polluées par des valeurs manquantes "cachées" au niveau peptidique.

Ainsi, même si je suis d'accord avec Christophe sur le fait qu'on peut imputer au niveau protéique malgré le problème que tu mentionnes, je serais un peu plus prudent: l'approche d'imputation protéique peut-être assez conservative si elle s'inscrit dans une démarche globale qui l'est. En revanche, si elle est appliquée un peu sauvagement, elle peut faire plus de dégâts qu'une imputation au niveau peptidique. C'est d'ailleurs pour cela qu'on a travaillé sur une imputation au niveau protéique. Celle-ci est déjà disponible dans ProStaR (la version stand-alone, pas encore sa version intégrée dans proline) et se nomme IMP4P. On l'a déjà évalué, et en tant que telle, elle fonctionne très bien. En revanche, la plateforme n'est pas encore passé à son usage systématique pour la simple raison qu'avoir une bonne méthode ne suffit pas: il faut aussi qu'elle s'inscrive dans une stratégie globale cohérente (par exemple vis à vis du filtrage ou de la normalisation)... Et maintenant, c'est là-dessus que nous travaillons. En revanche, d'autres plateforme utilisatrices de ProStaR commencent déjà à l'utiliser, et semblent satisfaites des résultats que IMP4P fourni.

En espérant que c'est plus claire maintenant ! :-)

Thomas B.
Invité


Revenir en haut Aller en bas

Re: niveau d'imputation

Message par Ced@P3S le Jeu 7 Juin - 17:22

Bonjour Thomas,

Merci pour ces précisions.

Au niveau de mes analyses, j'ai filtré de façon moins stringeante mes protéines avant imputation, à savoir au moins 5 valeurs (sur 6) dans au moins 1 condition : j'ai donc pu imputer sur des protéines ayant moins de 5 valeurs dans une condition (avec l'autre condition complète ou quasi complète). Cependant cette proportion de protéines est faible (6,3 % des protéines totales) donc je pense que ma stratégie reste cohérente.

Cédric

Ced@P3S

Messages : 2
Date d'inscription : 19/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: niveau d'imputation

Message par Thomas B. le Ven 8 Juin - 12:25

Bonjour Cédric,
oui, ca me semble pas mal en effet: Déjà la proportion sur l'ensemble du dataset est en effet faible, comme tu dis. Ensuite, avoir une valeur manquante sur 6 est acceptable. Avec 3 échantillons, en avoir une manquante serait plus embêtant (il manquerait 1/3 des données), mais avec autant de réplicats, je pense que ca doit bien tenir la route.

Thomas

Thomas B.
Invité


Revenir en haut Aller en bas

Re: niveau d'imputation

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous pouvez répondre aux sujets dans ce forum