L’eldorado des outils d’amélioration de la qualité des données


Rédigé par le 15 Décembre 2005

Pour une très large majorité des utilisateurs de systèmes décisionnels, la qualité des données est le principal souci actuel. Ils sont à la recherche de solutions pour détecter et éventuellement corriger les erreurs identifiées.



La qualité des données stockées dans votre système décisionnel est-il un problème pour vous ? Assurément oui !
Vous n’êtes que 6 % à considérer n’avoir aucun problème de qualité de données… ou à ne pas les avoir encore découverts. 12 % des utilisateurs de systèmes décisionnels ont un peu d’avance, car ils ont identifié ces problèmes, et déjà mis en place des solutions pour détecter et éventuellement corriger les problèmes de qualité des données.

Mais pour la très large majorité de nos lecteurs, 52 %, les problèmes de qualité sont permanents, et se révèlent un sujet clef sur lequel ils travaillent en ce moment. Cet indicateur confirme donc un autre chiffre extrait de notre baromètre Decideo 2006 ; pour près de 40 % des utilisateurs, la qualité des données est un des facteurs clefs de succès d’un projet décisionnel. Cet item arrive en troisième position, juste après la pertinence de l’analyse des besoins, et l’adhésion des utilisateurs.

A ces 52 % de personnes concernées en permanence, il faut ajouter les 30 % d’utilisateurs qui avouent avoir parfois des problèmes de qualité des données, et chercher à actuellement des solutions.

Au total, ce sont donc encore aujourd’hui 82 % des utilisateurs de systèmes décisionnels qui sont à la recherche de solutions pour améliorer la qualité de leurs données. Un marché considérable, pourtant encore mal ciblé par les éditeurs spécialisés.
En effet, quelques éditeurs d’outils d’alimentation proposent des modules complémentaires destinés à détecter et éventuellement corriger en partie les valeurs aberrantes avant qu’elles ne viennent polluer l’entrepôt de données.
Le seul domaine sur lequel la qualité des données est aujourd’hui réellement maîtrisable, est celui des adresses postales, email ou numéros de téléphone. En effet il s’agit de trois types de données normés, pour lesquels des règles de qualité peuvent plus facilement être programmées. Les spécialistes du marketing direct et de la vente par correspondance ont très tôt compris le retour sur investissement immédiat lié à l’amélioration de la qualité de ces données.
Mais les données financières, les données clients diverses, les données produits, sont encore difficiles à évaluer sous l’angle de leur qualité. Entre intelligence artificielle et intelligence humaine, il n’est pas évident de déterminer si un chiffre est potentiellement juste ou potentiellement erroné. Sans augmenter le nombre de « faux positifs », il faut diminuer le nombre d’erreurs stockées dans l’entrepôt de données. Et pourtant on sait combien des données fausses peuvent avoir des conséquences désastreuses si elles engendrent des décisions inadéquates. Le marché des solutions informatiques d’amélioration de la qualité des données est donc largement ouvert. Aux éditeurs de savoir le saisir.



Dans la même rubrique :