Biogemma, première entreprise européenne de biotechnologies végétales issue du monde agricole, ouvrant aux semenciers de nouvelles voies de création végétale qui répondent aux grands défis de l’agriculture en se basant sur l’exploration et l’enrichissement de la diversité génétique des plantes cultivées, se dote de TIBCO Spotfire 3.1, pour dépasser le cadre des analyses transcriptomiques, et s’engager vers de nouveaux types de recherches intégratives sur la base de cartes génétiques.
« Les analyses génétiques étaient auparavant réalisées principalement grâce à des logiciels développés au sein de laboratoire, mais l'intérêt de Spotfire pour exploiter des données positionnées sur des cartes génétiques est rapidement apparut. De plus, avec les nouvelles versions de Spotfire, certaines fonctionnalités nous ont paru intéressantes et ont permis d'envisager l’extension de son usage à toute la société » déclare Oliver Dugas. Upstream Genomics Coordinator and Bioinformatics Manager at Biogemma
Dans le cadre de son grand projet de développement d’une solution complète pour fouiller l’intégralité des données produites par les différentes plateformes de la société, Biogemma cherche tout d’abord à centraliser des données qui proviennent de projets extérieurs, des projets en collaboration avec des partenaires, publics ou privés, ou des données qui sont disponibles dans le domaine public généralement publiées dans des articles scientifiques. L’intégration et le formatage de ces données est bien évidemment nécessaire avant toute exploitation, mais grâce à la souplesse du logiciel Spotfire, les chercheurs de Biogemma passent facilement l’écueil, et réussissent à travailler des données hétérogènes. Ils réalisent rapidement des liens entre les données produites en interne, et toutes les autres provenant d’horizons différents, et peuvent produire une vision analytique précise et efficace de leurs recherches.
TIBCO Spotfire utilisé pour de multiples projets d’analyse :
Les principaux utilisateurs de l’outil TIBCO Spotfire sont les membres de l'équipe GeneDiscovery, des ingénieurs et des docteurs qui réalisent des analyses « in silico » en intégrant, comparant, des données issues des plateformes de services afin de découvrir les gènes ayant des effets majeurs pour l’amélioration des plantes dans un contexte agricole. Au delà de cette équipe, d’autres chercheurs ou chefs de projets utilisent TIBCO Spotfire, par exemple pour visualiser des analyses de recherche de similarités entre des séquences d'ADN ou bien lorsqu’ils souhaitent ajouter une dimension plus reporting aux analyses.
Ces chercheurs de Biogemma travaillent sur plusieurs axes de recherche et sur quatre espèces de grandes cultures : le maïs, le blé, le tournesol et le colza. Leur approche vise à l'amélioration de ces espèces pour mieux répondre aux besoins des agriculteurs.
Leur recherche principale consiste à repérer les éléments (des gènes) qui favorisent la croissance de plantes adaptées aux différents lieux de culture en fonction des contraintes climatiques (froid, sécheresse), biologiques (présence d'insectes, de champignons, de parasites), réglementaire (diminution des apports en pesticides) et environnementales (réduction des apports en engrais, en eau). Le logiciel Spotfire permet une aide rapide au repérage des gènes favorables parmi la biodiversité naturelle de ces plantes. Cette recherche exploite conjointement nos génétiques, des résultats de génétique d’association, et utilise toutes les séquences génomiques ou exprimées ainsi que la séquence génomique de l’espèce d’intérêt ou d’espèces apparentées lorsqu’elles sont disponibles.
Même si la création de carte génétique est un procédé bien maitrisé à ce jour, l’apport des différents modules de statistiques présents dans le logiciel Spotfire, permet la manipulation des données positionnées sur les cartes génétiques, et l'ajout d'information, éléments essentiels des recherches.
« L'analyse des différents niveaux d’expression de dizaines de milliers de gènes en même temps va pouvoir être recoupée avec des informations de génétique pour apporter encore plus de certitude qu'une région génétique contient bien un gène surexprimé sous condition de stress. C’est là où se trouve toute la puissance du logiciel TIBCO Spotfire» Confirme Olivier Dugas
TIBCO Spotfire au service de tous les utilisateurs :
L’usage du logiciel Spotfire s’est très rapidement imposé chez Biogemma. Les chercheurs confirment que de part sa facilité d’utilisation, c’est vraiment un outil très intuitif dans sa manipulation, très versatile dans les fonctions qu'il peut accomplir. Il offre en outre, des possibilités de visualisations différentes aussi bien en génétique qu'en génomique et sa capacité à se connecter à des sources de données très diverses telles que des bases de données, ou des fichiers plats est un atout. De plus, les ingénieurs de Biogemma ne négligent absolument pas l’explosion des nouvelles technologies, car un des points majeurs dans le domaine des sciences du vivant , ce sont les activités de séquençage qui nécessitent la récupération de volumes importants de données - près d'1To tous les 2 mois - émanant de sites différents, afin de poursuivre des analyses plus complexes. Dans ce cadre, le logiciel Spotfire a la capacité de créer des visualisations simples mais également de lancer des analyses avec des scripts d'analyses statistiques complexes, notamment en utilisant le langage R. Ainsi les données et les analyses peuvent être prisent en charge par des serveurs de calcul distants, alors que les résultats finaux seront exploités avec le logiciel Spotfire.
De nombreux bénéfices pour les chercheurs :
Les choix exprimés par Biogemma dans ses méthodes de travail déployées au sein de l’entreprise, démontre un désir bien déterminé de mettre à disposition une diversité de méthodologies d’analyses, alliée à une concentration de moyens relativement importante, une proximité des utilisateurs ainsi qu’une collaboration avec des équipes extérieures ayant développées leurs propres méthodes. De ce fait, les équipes de Biogemma sont amenées à brasser des données qui viennent d’horizons très différents, qui ont été obtenues avec des approches différentes, des méthodes différentes des visions différentes, des spécialités différentes. Biogemma travaille aussi bien avec des chercheurs qui analysent les contenus de protéines ou d’acides aminés dans des graines, que d’autres qui vont mesurer les caractéristiques du sol dans des conditions de sècheresse, ou encore la hauteur des plantes. Les chercheurs de Biogemma trouvent dans le logiciel Spotfire un véritable outil de datamining, suffisamment souple pour tolérer une hétérogénéité au niveau des types données, ajoutez à cela tous les aspects de visualisation très poussés, cela leur donne des performances de rendus de statistiques assez exceptionnelles.
«L’utilisation du logiciel Spotfire nous fait gagner en pertinence, et en vision. Il nous permet d’avoir des réflexions sur nos résultats, et de visualiser des comportements dans les données biologiques non attendus et pouvant avoir un impact sur nos recherches. Il s’agit dans ces cas, de résultats que nous n’aurions pas vus si nous nous étions contentés des analyses standards et plutôt figées » ajoute Olivier Dugas
Les chercheurs de Biogemma ont pu s’offrir une nouvelle représentation de l’analyse des données, et plus particulièrement, ramener à d’autres recherches, de regarder de multiples façons la visualisation des résultats. Ils se sont aperçu par exemple, qu’en analysant des séquences d’ADN, de larges régions sur des chromosomes étaient organisées de façon particulière. Ils avaient depuis longtemps toutes les données entre les mains pour se rendre compte de cela, mais ces données, trop détaillées, trop abondantes, auraient nécessité d'être analysées, décortiquées en mettant en place toute une chaine d'analyse conçut avec une hypothèse de départ liée à des mouvements génomiques importants.
« Là nous n'avons pas émis d'hypothèse de départ, le résultat nous a juste "sauté aux yeux". » insiste Olivier Dugas
Biogemma en avance sur ses concurrents :
Lors de recherches portant sur le génome du maïs, les équipes de Biogemma ont mis à jour des liens entre les données génétiques et génomiques. Grâce à l’utilisation simple du logiciel Spotfire, il leur a été permis, sans avoir besoin de développer un outil dédié, de visualiser un graphique représentant la « courbe de recombinaison » de chaque chromosome du maïs, résultat de l’accumulation de données, à partir de la création d’une puce de génotypage.
Pour réaliser cette analyse visuelle qui n’avait jamais été publiée par aucun autre laboratoire de recherche à cette époque, fin 2007 les chercheurs de Biogemma se sont appuyé sur la force d’analyse du logiciel Spotfire, et ont pu ainsi intégrer les informations concernant 16.000 positions (marqueurs génétiques) sur plus de 4.000 variétés de maïs et mettre en relation la position génétique et la position génomique permettant l’obtention de la courbe de recombinaison.
« Cela avait été très excitant, car quatre mois plus tard, j'assistais à la grande conférence de la génomique animale et plante, le PAG (Plant and Animal Genomics) à San Diego durant laquelle les leaders académiques en génomique du maïs ont alors présenté ce même graphique voire même un peu moins précis que le nôtre. C'était une réelle satisfaction que de constater qu'avec nos moyens, plus restreints et non focalisés uniquement sur le maïs, nous avions pu produire un travail de qualité, scientifiquement pertinent et sur lequel nous étions toujours en avance. Cela a permis à Biogemma de jouer dans la cour des grands face à d’autres concurrents disposant de moyens financiers et humains plus importants » se félicite Olivier Dugas
«L’exemple de Biogemma illustre parfaitement la valeur ajoutée proposée par TIBCO Spotfire en matière de recherche. », déclare Ben McGraw directeur en charge des solutions dans le secteur des sciences de la vie chez Spotfire, TIBCO Software Inc. « En permettant à ses scientifiques d’éliminer les erreurs, d’identifier les tendances essentielles et d’accéder aux données en temps réel, Biogemma peut devenir encore plus agile et compétitif dans l’optique de mettre sur le marché de nouvelles analyses d’une importance capitale dans le traitement des ressources pour l’agriculture des prochaines décennies. »
« Les analyses génétiques étaient auparavant réalisées principalement grâce à des logiciels développés au sein de laboratoire, mais l'intérêt de Spotfire pour exploiter des données positionnées sur des cartes génétiques est rapidement apparut. De plus, avec les nouvelles versions de Spotfire, certaines fonctionnalités nous ont paru intéressantes et ont permis d'envisager l’extension de son usage à toute la société » déclare Oliver Dugas. Upstream Genomics Coordinator and Bioinformatics Manager at Biogemma
Dans le cadre de son grand projet de développement d’une solution complète pour fouiller l’intégralité des données produites par les différentes plateformes de la société, Biogemma cherche tout d’abord à centraliser des données qui proviennent de projets extérieurs, des projets en collaboration avec des partenaires, publics ou privés, ou des données qui sont disponibles dans le domaine public généralement publiées dans des articles scientifiques. L’intégration et le formatage de ces données est bien évidemment nécessaire avant toute exploitation, mais grâce à la souplesse du logiciel Spotfire, les chercheurs de Biogemma passent facilement l’écueil, et réussissent à travailler des données hétérogènes. Ils réalisent rapidement des liens entre les données produites en interne, et toutes les autres provenant d’horizons différents, et peuvent produire une vision analytique précise et efficace de leurs recherches.
TIBCO Spotfire utilisé pour de multiples projets d’analyse :
Les principaux utilisateurs de l’outil TIBCO Spotfire sont les membres de l'équipe GeneDiscovery, des ingénieurs et des docteurs qui réalisent des analyses « in silico » en intégrant, comparant, des données issues des plateformes de services afin de découvrir les gènes ayant des effets majeurs pour l’amélioration des plantes dans un contexte agricole. Au delà de cette équipe, d’autres chercheurs ou chefs de projets utilisent TIBCO Spotfire, par exemple pour visualiser des analyses de recherche de similarités entre des séquences d'ADN ou bien lorsqu’ils souhaitent ajouter une dimension plus reporting aux analyses.
Ces chercheurs de Biogemma travaillent sur plusieurs axes de recherche et sur quatre espèces de grandes cultures : le maïs, le blé, le tournesol et le colza. Leur approche vise à l'amélioration de ces espèces pour mieux répondre aux besoins des agriculteurs.
Leur recherche principale consiste à repérer les éléments (des gènes) qui favorisent la croissance de plantes adaptées aux différents lieux de culture en fonction des contraintes climatiques (froid, sécheresse), biologiques (présence d'insectes, de champignons, de parasites), réglementaire (diminution des apports en pesticides) et environnementales (réduction des apports en engrais, en eau). Le logiciel Spotfire permet une aide rapide au repérage des gènes favorables parmi la biodiversité naturelle de ces plantes. Cette recherche exploite conjointement nos génétiques, des résultats de génétique d’association, et utilise toutes les séquences génomiques ou exprimées ainsi que la séquence génomique de l’espèce d’intérêt ou d’espèces apparentées lorsqu’elles sont disponibles.
Même si la création de carte génétique est un procédé bien maitrisé à ce jour, l’apport des différents modules de statistiques présents dans le logiciel Spotfire, permet la manipulation des données positionnées sur les cartes génétiques, et l'ajout d'information, éléments essentiels des recherches.
« L'analyse des différents niveaux d’expression de dizaines de milliers de gènes en même temps va pouvoir être recoupée avec des informations de génétique pour apporter encore plus de certitude qu'une région génétique contient bien un gène surexprimé sous condition de stress. C’est là où se trouve toute la puissance du logiciel TIBCO Spotfire» Confirme Olivier Dugas
TIBCO Spotfire au service de tous les utilisateurs :
L’usage du logiciel Spotfire s’est très rapidement imposé chez Biogemma. Les chercheurs confirment que de part sa facilité d’utilisation, c’est vraiment un outil très intuitif dans sa manipulation, très versatile dans les fonctions qu'il peut accomplir. Il offre en outre, des possibilités de visualisations différentes aussi bien en génétique qu'en génomique et sa capacité à se connecter à des sources de données très diverses telles que des bases de données, ou des fichiers plats est un atout. De plus, les ingénieurs de Biogemma ne négligent absolument pas l’explosion des nouvelles technologies, car un des points majeurs dans le domaine des sciences du vivant , ce sont les activités de séquençage qui nécessitent la récupération de volumes importants de données - près d'1To tous les 2 mois - émanant de sites différents, afin de poursuivre des analyses plus complexes. Dans ce cadre, le logiciel Spotfire a la capacité de créer des visualisations simples mais également de lancer des analyses avec des scripts d'analyses statistiques complexes, notamment en utilisant le langage R. Ainsi les données et les analyses peuvent être prisent en charge par des serveurs de calcul distants, alors que les résultats finaux seront exploités avec le logiciel Spotfire.
De nombreux bénéfices pour les chercheurs :
Les choix exprimés par Biogemma dans ses méthodes de travail déployées au sein de l’entreprise, démontre un désir bien déterminé de mettre à disposition une diversité de méthodologies d’analyses, alliée à une concentration de moyens relativement importante, une proximité des utilisateurs ainsi qu’une collaboration avec des équipes extérieures ayant développées leurs propres méthodes. De ce fait, les équipes de Biogemma sont amenées à brasser des données qui viennent d’horizons très différents, qui ont été obtenues avec des approches différentes, des méthodes différentes des visions différentes, des spécialités différentes. Biogemma travaille aussi bien avec des chercheurs qui analysent les contenus de protéines ou d’acides aminés dans des graines, que d’autres qui vont mesurer les caractéristiques du sol dans des conditions de sècheresse, ou encore la hauteur des plantes. Les chercheurs de Biogemma trouvent dans le logiciel Spotfire un véritable outil de datamining, suffisamment souple pour tolérer une hétérogénéité au niveau des types données, ajoutez à cela tous les aspects de visualisation très poussés, cela leur donne des performances de rendus de statistiques assez exceptionnelles.
«L’utilisation du logiciel Spotfire nous fait gagner en pertinence, et en vision. Il nous permet d’avoir des réflexions sur nos résultats, et de visualiser des comportements dans les données biologiques non attendus et pouvant avoir un impact sur nos recherches. Il s’agit dans ces cas, de résultats que nous n’aurions pas vus si nous nous étions contentés des analyses standards et plutôt figées » ajoute Olivier Dugas
Les chercheurs de Biogemma ont pu s’offrir une nouvelle représentation de l’analyse des données, et plus particulièrement, ramener à d’autres recherches, de regarder de multiples façons la visualisation des résultats. Ils se sont aperçu par exemple, qu’en analysant des séquences d’ADN, de larges régions sur des chromosomes étaient organisées de façon particulière. Ils avaient depuis longtemps toutes les données entre les mains pour se rendre compte de cela, mais ces données, trop détaillées, trop abondantes, auraient nécessité d'être analysées, décortiquées en mettant en place toute une chaine d'analyse conçut avec une hypothèse de départ liée à des mouvements génomiques importants.
« Là nous n'avons pas émis d'hypothèse de départ, le résultat nous a juste "sauté aux yeux". » insiste Olivier Dugas
Biogemma en avance sur ses concurrents :
Lors de recherches portant sur le génome du maïs, les équipes de Biogemma ont mis à jour des liens entre les données génétiques et génomiques. Grâce à l’utilisation simple du logiciel Spotfire, il leur a été permis, sans avoir besoin de développer un outil dédié, de visualiser un graphique représentant la « courbe de recombinaison » de chaque chromosome du maïs, résultat de l’accumulation de données, à partir de la création d’une puce de génotypage.
Pour réaliser cette analyse visuelle qui n’avait jamais été publiée par aucun autre laboratoire de recherche à cette époque, fin 2007 les chercheurs de Biogemma se sont appuyé sur la force d’analyse du logiciel Spotfire, et ont pu ainsi intégrer les informations concernant 16.000 positions (marqueurs génétiques) sur plus de 4.000 variétés de maïs et mettre en relation la position génétique et la position génomique permettant l’obtention de la courbe de recombinaison.
« Cela avait été très excitant, car quatre mois plus tard, j'assistais à la grande conférence de la génomique animale et plante, le PAG (Plant and Animal Genomics) à San Diego durant laquelle les leaders académiques en génomique du maïs ont alors présenté ce même graphique voire même un peu moins précis que le nôtre. C'était une réelle satisfaction que de constater qu'avec nos moyens, plus restreints et non focalisés uniquement sur le maïs, nous avions pu produire un travail de qualité, scientifiquement pertinent et sur lequel nous étions toujours en avance. Cela a permis à Biogemma de jouer dans la cour des grands face à d’autres concurrents disposant de moyens financiers et humains plus importants » se félicite Olivier Dugas
«L’exemple de Biogemma illustre parfaitement la valeur ajoutée proposée par TIBCO Spotfire en matière de recherche. », déclare Ben McGraw directeur en charge des solutions dans le secteur des sciences de la vie chez Spotfire, TIBCO Software Inc. « En permettant à ses scientifiques d’éliminer les erreurs, d’identifier les tendances essentielles et d’accéder aux données en temps réel, Biogemma peut devenir encore plus agile et compétitif dans l’optique de mettre sur le marché de nouvelles analyses d’une importance capitale dans le traitement des ressources pour l’agriculture des prochaines décennies. »