Pierre FORMOSA, responsable avant-vente, Umanis
Nous vous proposons donc de faire le point sur ce que sont réellement ces nouvelles solutions, leurs domaines d’application et leur réalité opérationnelle dans les systèmes existants.
Tout d’abord, qu’est ce qu’un outil de SBA ?
Il s’agit d’une application verticale qui s’appuie sur un moteur de recherche et qui permet de faire de l’exploration sur des informations structurées et non structurées. Cette application s’appuie sur l’utilisation d’un index de moteur de recherche et non plus sur une base de données (telle SQL par exemple) et permet d’indexer de grands volumes de données en temps réel. Les résultats d’analyses sont ensuite affichés sous forme de tableaux de bord personnalisés.
Tous les métiers de l’entreprise sont ainsi concernés et les utilisateurs ont théoriquement accès rapidement à une information fiable.
Avec les outils traditionnels de BI, comment les recherches sont-elles effectuées ? Qu’est ce qui change avec les SBA ?
La BI traditionnelle permet la recherche et l’analyse de données structurées, ce qui équivaut à dire aux opérationnels qu’il faut déjà que le système connaisse la réponse pour qu’ils puissent poser leur question et qu’en plus, il ne faut pas qu’ils soient pressés… On voit bien que nous sommes arrivés à la limite du système, Google est passé par là ! Les utilisateurs veulent pouvoir poser des questions aléatoires qui vont aller trouver leurs réponses dans des masses d’informations ou de données de toute sortes, issues indifféremment des ERP, CRM, DW BI, RSE, documents PDF, serveurs mails, blogs, flux RSS, etc.
Alors que le patrimoine informationnel explose et que les données structurées n’en représentent qu’une infime partie, les fonctionnalités des solutions de ESP (Entreprise Search Plateform) apportent un nouveau souffle. Il est vrai que cette couche applicative, qui semble s’affranchir des architectures traditionnelles, a de quoi séduire avec ses promesses de performances que ce soit en terme de temps de réponses, de volume de données traitées ou encore en nombre d’utilisateurs supportés.
Il faut également apporter une précision : conçues sur la base de technologies de type Index et Web, les SBA permettent aux entreprises de concevoir rapidement des services d’accès à l’information pour leurs collaborateurs, clients ou bien partenaires, et cela sans remettre en cause les architectures en place. En clair, plus besoin d’être un pro de la requête SQL pour aller interroger une application décisionnelle, on peut dorénavant le faire en langage naturel.
Qu’entend-on par BI étendue ? Et comment concilier SBA et Décisionnel ?
Ce terme est employé dans le cas du rapprochement entre les ESP et la BI.
Par opposition ou plus exactement en complément de la « BI Traditionnelle » la « BI Etendue » va tirer pleinement profit du gisement d’informations issu du monde des données non structurées, avec en plus la capacité de fournir une convergence entre ces 2 mondes. La « BI Etendue » va permettre aux entreprises d’exploiter la globalité de leur patrimoine informationnel par la mise en place d’un « guichet unique » d’accès à ces informations. Cette convergence, données structurées et non structurées, offre aux utilisateurs de nouveaux moyens d’analyse. La « BI étendue » va plus loin que le simple fait de fournir un indicateur à un instant donné, elle fournit à l’utilisateur le périmètre social de chaque indicateur.
Qu’est ce qui fait qu’un moteur de recherche est supérieur à un autre ?
Tout d’abord, il faut bien être conscient du fait que cette nouvelle génération de moteurs de recherche vise à transformer ceux-ci en véritables infrastructures logicielles, associant sémantique et statistique pour rendre les applications plus interactives et permettre de mieux exploiter tous les canaux de données.
Généralement ce n’est pas sur l’aspect statistique que les moteurs de recherche marquent le pas mais bien sur l’analyse sémantique. En effet, l’analyse statistique permet d’évaluer la ou les situations dans lesquelles apparait tel ou tel mot mais également son emplacement dans la phrase. En ce qui concerne l’analyse sémantique, comme son nom l’indique, il s’agit d’identifier le sens du mot et en allant au-delà, de créer des associations avec d’autres mots (par exemple : table, pain et nourriture…).
Il est important de le préciser même si cela va de soit, que la capacité du moteur à rester performant sur des volumes exponentiels de données est un critère déterminant dans le choix de la solution.
Quels sont les avantages de ces nouveaux outils ?
Les SBA agissent comme des révélateurs de la richesse de l’entreprise et des systèmes en place en permettent leur exploitation efficace. Parmi les grandes qualités de ces outils nous pouvons citer la facilité d’usage bien évidemment et les bonnes performances dans les recherches.
Pour l’usager, ce sont des outils très axés user-friendly. En effet, l’accès se fait rapidement et de façon unifié aux documents par le biais d’une seule infrastructure.
Sur quelle architecture reposent les SBA et comment la sécurité est-elle gérée ?
Les SBA offrent aux utilisateurs un environnement d’accès aux informations qui se veut totalement ouvert et indépendant de toute technologie. A ce niveau on ne parle plus vraiment d’architecture puisque le niveau d’intrusion dans les systèmes en place doit être réduit au minimum. L’architecture de prédilection des SBA en entreprise repose sur une approche SOA afin d’obtenir un couplage entre les différents environnements. L’autre point important concerne la sécurité, et plus particulièrement la sécurité d’accès à l’information. En effet, si la sécurité des informations stockées dans les BDD est gérée, il n’en est pas naturellement de même pour les documents non structurés. Qu’adviendrait-il dans le cas d’une donnée sécurisée dans le SI mais « désécurisée » par le moteur de recherche parce qu’elle est présente au sein d’un document accessible à tous ?
Comment fonctionnent les SBA et quelles sont leurs caractéristiques ?
Le principe est assez simple de prime abord puisqu’il s’agit d’une application permettant de « retrouver » au sein de données structurées ou non des mots clé ou des expressions. Naturellement, il s’agit ici d’un raccourci car bien d’autres considérations permettent de spécialiser une recherche, comme des dictionnaires et des anti-dictionnaires. Par ailleurs, le moteur de recherche est toujours associé à un ou plusieurs agents intelligents – des crawlers – balayant en temps réel ou de manière programmée les périmètres indexables. On peut donc résumer le fonctionnement des SBA à :
• la définition du périmètre indexable et l’association à ce périmètre des crawlers d’exploration
• l’indexation elle-même qui consiste à conserver l’index entre la donnée indexée et l’index terminologique
• une fonction de recherche qui assure de fait l’interface avec l’utilisateur
Les moteurs disposent de plusieurs autres capacités comme par exemple un correcteur orthographique ou un lemmatiseur permettant d’étendre la portée de la recherche. Les moteurs sémantiques intègrent également les règles grammaticales et lexicales de langue, langue que certains moteurs sont capables de déterminer par eux-mêmes..
Y a-t-il des limites à ces outils ?
Vouloir remplacer la « BI Traditionnelle » par la « BI Etendue » reviendrait à vouloir faire entrer un rond dans un carré… ou l’inverse ! Par contre, le fait que ces 2 mondes convergent à moyen terme est inéluctable.
Toutefois, même si certaines solutions intègrent une couche de présentation des informations trouvées, les fonctionnalités présentées sont encore loin d’être au niveau des solutions de « Business Intelligence ». Le monde du décisionnel ne pourra pas évoluer sans l’intégration du non structuré c’est une certitude et les éditeurs de ce secteur l’ont parfaitement compris. Reste à savoir comment se passera cette intégration, mais il s’agit d’une autre histoire !
En conclusion, pour trouver, chercher ne suffit pas ! Il faut savoir chercher, comprendre ce que l’on cherche, exprimer ce l’on recherche simplement, imaginer la réponse à ce que l’on cherche et comprendre les réponses fournies par rapport à ce que l’on cherche.
Umanis met son expertise à votre disposition notamment en ce qui concerne l’aide au choix d’outil parmi l’offre pléthorique du marché que ce soit au niveau des pure-players tels que Exalead, Sinequa, Verity, Open Text, Auracom, Arisem, Vivisimo, Endeca, Autonomy ou des MISO tels que Fast Search Server de Microsoft, Omnifind d’IBM, SAP Entreprise Search et Oracle Secure Entreprise Search.
Tout d’abord, qu’est ce qu’un outil de SBA ?
Il s’agit d’une application verticale qui s’appuie sur un moteur de recherche et qui permet de faire de l’exploration sur des informations structurées et non structurées. Cette application s’appuie sur l’utilisation d’un index de moteur de recherche et non plus sur une base de données (telle SQL par exemple) et permet d’indexer de grands volumes de données en temps réel. Les résultats d’analyses sont ensuite affichés sous forme de tableaux de bord personnalisés.
Tous les métiers de l’entreprise sont ainsi concernés et les utilisateurs ont théoriquement accès rapidement à une information fiable.
Avec les outils traditionnels de BI, comment les recherches sont-elles effectuées ? Qu’est ce qui change avec les SBA ?
La BI traditionnelle permet la recherche et l’analyse de données structurées, ce qui équivaut à dire aux opérationnels qu’il faut déjà que le système connaisse la réponse pour qu’ils puissent poser leur question et qu’en plus, il ne faut pas qu’ils soient pressés… On voit bien que nous sommes arrivés à la limite du système, Google est passé par là ! Les utilisateurs veulent pouvoir poser des questions aléatoires qui vont aller trouver leurs réponses dans des masses d’informations ou de données de toute sortes, issues indifféremment des ERP, CRM, DW BI, RSE, documents PDF, serveurs mails, blogs, flux RSS, etc.
Alors que le patrimoine informationnel explose et que les données structurées n’en représentent qu’une infime partie, les fonctionnalités des solutions de ESP (Entreprise Search Plateform) apportent un nouveau souffle. Il est vrai que cette couche applicative, qui semble s’affranchir des architectures traditionnelles, a de quoi séduire avec ses promesses de performances que ce soit en terme de temps de réponses, de volume de données traitées ou encore en nombre d’utilisateurs supportés.
Il faut également apporter une précision : conçues sur la base de technologies de type Index et Web, les SBA permettent aux entreprises de concevoir rapidement des services d’accès à l’information pour leurs collaborateurs, clients ou bien partenaires, et cela sans remettre en cause les architectures en place. En clair, plus besoin d’être un pro de la requête SQL pour aller interroger une application décisionnelle, on peut dorénavant le faire en langage naturel.
Qu’entend-on par BI étendue ? Et comment concilier SBA et Décisionnel ?
Ce terme est employé dans le cas du rapprochement entre les ESP et la BI.
Par opposition ou plus exactement en complément de la « BI Traditionnelle » la « BI Etendue » va tirer pleinement profit du gisement d’informations issu du monde des données non structurées, avec en plus la capacité de fournir une convergence entre ces 2 mondes. La « BI Etendue » va permettre aux entreprises d’exploiter la globalité de leur patrimoine informationnel par la mise en place d’un « guichet unique » d’accès à ces informations. Cette convergence, données structurées et non structurées, offre aux utilisateurs de nouveaux moyens d’analyse. La « BI étendue » va plus loin que le simple fait de fournir un indicateur à un instant donné, elle fournit à l’utilisateur le périmètre social de chaque indicateur.
Qu’est ce qui fait qu’un moteur de recherche est supérieur à un autre ?
Tout d’abord, il faut bien être conscient du fait que cette nouvelle génération de moteurs de recherche vise à transformer ceux-ci en véritables infrastructures logicielles, associant sémantique et statistique pour rendre les applications plus interactives et permettre de mieux exploiter tous les canaux de données.
Généralement ce n’est pas sur l’aspect statistique que les moteurs de recherche marquent le pas mais bien sur l’analyse sémantique. En effet, l’analyse statistique permet d’évaluer la ou les situations dans lesquelles apparait tel ou tel mot mais également son emplacement dans la phrase. En ce qui concerne l’analyse sémantique, comme son nom l’indique, il s’agit d’identifier le sens du mot et en allant au-delà, de créer des associations avec d’autres mots (par exemple : table, pain et nourriture…).
Il est important de le préciser même si cela va de soit, que la capacité du moteur à rester performant sur des volumes exponentiels de données est un critère déterminant dans le choix de la solution.
Quels sont les avantages de ces nouveaux outils ?
Les SBA agissent comme des révélateurs de la richesse de l’entreprise et des systèmes en place en permettent leur exploitation efficace. Parmi les grandes qualités de ces outils nous pouvons citer la facilité d’usage bien évidemment et les bonnes performances dans les recherches.
Pour l’usager, ce sont des outils très axés user-friendly. En effet, l’accès se fait rapidement et de façon unifié aux documents par le biais d’une seule infrastructure.
Sur quelle architecture reposent les SBA et comment la sécurité est-elle gérée ?
Les SBA offrent aux utilisateurs un environnement d’accès aux informations qui se veut totalement ouvert et indépendant de toute technologie. A ce niveau on ne parle plus vraiment d’architecture puisque le niveau d’intrusion dans les systèmes en place doit être réduit au minimum. L’architecture de prédilection des SBA en entreprise repose sur une approche SOA afin d’obtenir un couplage entre les différents environnements. L’autre point important concerne la sécurité, et plus particulièrement la sécurité d’accès à l’information. En effet, si la sécurité des informations stockées dans les BDD est gérée, il n’en est pas naturellement de même pour les documents non structurés. Qu’adviendrait-il dans le cas d’une donnée sécurisée dans le SI mais « désécurisée » par le moteur de recherche parce qu’elle est présente au sein d’un document accessible à tous ?
Comment fonctionnent les SBA et quelles sont leurs caractéristiques ?
Le principe est assez simple de prime abord puisqu’il s’agit d’une application permettant de « retrouver » au sein de données structurées ou non des mots clé ou des expressions. Naturellement, il s’agit ici d’un raccourci car bien d’autres considérations permettent de spécialiser une recherche, comme des dictionnaires et des anti-dictionnaires. Par ailleurs, le moteur de recherche est toujours associé à un ou plusieurs agents intelligents – des crawlers – balayant en temps réel ou de manière programmée les périmètres indexables. On peut donc résumer le fonctionnement des SBA à :
• la définition du périmètre indexable et l’association à ce périmètre des crawlers d’exploration
• l’indexation elle-même qui consiste à conserver l’index entre la donnée indexée et l’index terminologique
• une fonction de recherche qui assure de fait l’interface avec l’utilisateur
Les moteurs disposent de plusieurs autres capacités comme par exemple un correcteur orthographique ou un lemmatiseur permettant d’étendre la portée de la recherche. Les moteurs sémantiques intègrent également les règles grammaticales et lexicales de langue, langue que certains moteurs sont capables de déterminer par eux-mêmes..
Y a-t-il des limites à ces outils ?
Vouloir remplacer la « BI Traditionnelle » par la « BI Etendue » reviendrait à vouloir faire entrer un rond dans un carré… ou l’inverse ! Par contre, le fait que ces 2 mondes convergent à moyen terme est inéluctable.
Toutefois, même si certaines solutions intègrent une couche de présentation des informations trouvées, les fonctionnalités présentées sont encore loin d’être au niveau des solutions de « Business Intelligence ». Le monde du décisionnel ne pourra pas évoluer sans l’intégration du non structuré c’est une certitude et les éditeurs de ce secteur l’ont parfaitement compris. Reste à savoir comment se passera cette intégration, mais il s’agit d’une autre histoire !
En conclusion, pour trouver, chercher ne suffit pas ! Il faut savoir chercher, comprendre ce que l’on cherche, exprimer ce l’on recherche simplement, imaginer la réponse à ce que l’on cherche et comprendre les réponses fournies par rapport à ce que l’on cherche.
Umanis met son expertise à votre disposition notamment en ce qui concerne l’aide au choix d’outil parmi l’offre pléthorique du marché que ce soit au niveau des pure-players tels que Exalead, Sinequa, Verity, Open Text, Auracom, Arisem, Vivisimo, Endeca, Autonomy ou des MISO tels que Fast Search Server de Microsoft, Omnifind d’IBM, SAP Entreprise Search et Oracle Secure Entreprise Search.