probleme sur l'indexation de SeqRepo

Poster un nouveau sujet   Répondre au sujet

Voir le sujet précédent Voir le sujet suivant Aller en bas

probleme sur l'indexation de SeqRepo

Message par wbienvenut le Mer 12 Juil - 12:09

Bonjour,

j'ai un petit problème concernant une indexation incomplète des séquence des protéines. Après une indexation initial qui semblait avoir fonctionné, l'indexation des nouvelles séquences ne semble plus se faire alors que le script tourne toujours...

Une idée d’où pourrais venir le problème ?

Merci

Willy

wbienvenut

Messages : 12
Date d'inscription : 12/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par ProlineAdmin le Mer 12 Juil - 14:18

Quand tu dis nouvelles sequences c'est que tu as fait un nouvel import ? Les recherches que tu as importées elles avaient été faites sur les mêmes banques que les précédentes ou ce sont des banques différentes ? Auquel cas c'est peut être un problème de configuration de SequenceRepository Shocked

Véronique

ProlineAdmin
Admin

Messages : 28
Date d'inscription : 06/12/2016

Voir le profil de l'utilisateur http://proline.profiproteomics.fr/

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par wbienvenut le Mer 12 Juil - 14:28

c'est effectivement un nouvel import de donnée depuis les fichier dat de Mascot à partir de nouvelles recherches utilisant TAIR comme banque (et donc avec les même type d'AC... puisqu'il n'y a que le nom de la banque qui a été changé...). Le plus bizarre, c'est que pour un certain nombre de protéines, j'ai bien la séquence...

W.

wbienvenut

Messages : 12
Date d'inscription : 12/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par ProlineAdmin le Mer 12 Juil - 14:39

Avec TAIR, il me semble que l'ID qu'il faut extraire pour les protéines est la chaine de caractère entre ">" et le premier espace.

Du coup, je suppose que si ça a marché pour les précédentes recherches c'est OK pour la config.... Sauf peut être  pour reconnaître la nouvelle banque comme banque TAIR. Est-ce que le nom de la banque a beaucoup changé ? En d'autres termes est-ce que la règle donnée pour identifier un fasta comme un fasta TAIR va fonctionner pour cette banque ?
Pour considérer toutes les banques dont le nom commence par Arabidopsis_TAIR par exemple, il faut mettre :   fasta-name=["Arabidopsis_TAIR"]

Sinon, tu peux m'envoyer ton log (et éventuellement la version finale de parsing_rule), je regarderai !

ProlineAdmin
Admin

Messages : 28
Date d'inscription : 06/12/2016

Voir le profil de l'utilisateur http://proline.profiproteomics.fr/

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par wbienvenut le Mer 12 Juil - 14:44

Initialement c'etait Arabidopsis_tair10-UPS3-2.fasta et maintenant c'est Arabidopsis_10.fasta...

Mais ce qui est étrange c'est que les ancienne recherche avais été faite avec Arabidopsis_tair10-UPS3-2.fasta mais que les séquences des protéines avaient été récupérées dans Arabidopsis_10.fasta...

Les dernières recherche ont été faite dans Arabidopsis_10.fasta...

W.

wbienvenut

Messages : 12
Date d'inscription : 12/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par ProlineAdmin le Mer 12 Juil - 15:08

Du coup il faut mettre dans parsing rules (pour que ça fonctionne avec toutes les recherches) :

parsing-rules = [{
name=" TAIR",
fasta-name=["Arabidopsis_"],
fasta-version="",
protein-accession =">(\\S+) "
}

Mais il me semble que c'est ce que tu as !

C'est étrange en effet qu'il n'est pas récupéré les bonnes séquences ! Peux-être est-ce dû au fait qu'il n'y a pas de version associée aux banques ... Mais je ne crois pas (je vérifierai !).
Par contre, c'est normal que tu ai des séquences pour certaines protéines si celles-ci existaient déjà dans la version précédente, il ne recherche pas dans le fichier fasta du coup.

Tu peux me faire parvenir les logs des jours où tu as importé une ancienne recherche et une nouvelle ?

Merci Smile
Veronique

ProlineAdmin
Admin

Messages : 28
Date d'inscription : 06/12/2016

Voir le profil de l'utilisateur http://proline.profiproteomics.fr/

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par wbienvenut le Mer 12 Juil - 15:23

les parsing rules n'ont pas changé pour TAIR juste le nom de la banque pour qu'il considère la version...

Quel genre de "log" veux tu...? et ou puis je trouver ces fichiers...?

W.

wbienvenut

Messages : 12
Date d'inscription : 12/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par ProlineAdmin le Mer 12 Juil - 15:25


C'est à la racine du répertoire d'installation de SequenceRepository :
- sequence_repository_log.txt
- sequence_repository_debug_<date>.txt

ProlineAdmin
Admin

Messages : 28
Date d'inscription : 06/12/2016

Voir le profil de l'utilisateur http://proline.profiproteomics.fr/

Revenir en haut Aller en bas

Re: probleme sur l'indexation de SeqRepo

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

Poster un nouveau sujet   Répondre au sujet
 
Permission de ce forum:
Vous pouvez répondre aux sujets dans ce forum