Enquêtes sur les données ou comment un hub de données opérationnelles optimise les résultats à partir des données

David Northmore, VP EMEA de MarkLogic

Pour les fins limiers comme Sherlock Holmes, le recours à la logique et à la science de la déduction pour établir les rapports entre des faits disparates était tout simplement inné.
Mais avec l'essor exponentiel des données créées et stockées au niveau international, dur dur de résoudre les énigmes par les temps qui courent. Les données d'entreprise sont à la limite de l'implosion et les silos de données disparates ne font qu'aggraver le problème. Si les données ne peuvent pas être intégrées de manière à faciliter la recherche et l'analyse, leur utilité est alors à remettre en question. Les entreprises passent à côté d'une vue unique et à 360° de leurs données, et donc de toute une série d'avantages.
Cela inclut notamment des informations précieuses et potentiellement génératrices de revenus concernant leurs processus commerciaux ou les préférences de leurs clients. Les entreprises peuvent également s'épargner de fortes amendes en mettant de l’ordre dans leurs données pour qu'elles soient conformes aux réglementations actuelles et émergentes.

Silos de données : accusés, levez-vous !

Voici l'un des problèmes majeurs : la plupart des données d'une entreprise se trouvent actuellement dans plusieurs silos de données non connectés, souvent le résultat d’initiatives précédentes. Les fusions et acquisitions ont entraîné la création d'encore plus de silos. Or, la répartition de doublons de données dans plusieurs silos menace l'intégrité même des données.
Histoire de compliquer les choses, les secteurs d'aujourd'hui (des services financiers aux multinationales pharmaceutiques) sont soumis à une pression croissante en matière de conformité, à cause des nouvelles réglementations en constante évolution, notamment la directive MiFID II (Marchés d'instruments financiers) et le règlement général sur la protection des données (RGPD) de l'Union européenne. Même Sherlock Holmes et ses talents de déduction ne pourraient rien faire. Heureusement, il existe une solution pour résoudre ces problèmes d'intégration et générer davantage de valeur : le hub de données opérationnelles.

Résoudre le casse-tête des données grâce à un hub de données opérationnelles

Un hub de données opérationnelles est un emplacement de stockage virtuel permettant de bénéficier d'une vue unique, unifiée et à 360° de toutes les données. Jusqu'à 80 % des données d'entreprise actuelles étant non structurées ou semi-structurées (PDF, données en ligne, fichiers audio, clips vidéo), il est logique de développer un hub au moyen d'une base de données pouvant prendre en charge cette pléthore de formats.
C'est là qu'une base de données de niveau entreprise NoSQL entre en jeu : elle peut gérer tout type de données et permet de s'affranchir de nombreuses (et coûteuses) heures d'intégration de données complexes. L'extraction, la transformation et le chargement des données (ETL) constituent en effet le talon d'Achille des bases de données relationnelles classiques.
Il est essentiel de choisir la base de données d'entreprise NoSQL qui convient. Privilégiez les fonctions sémantiques et de recherche intégrées, ainsi qu'une conformité complète à la norme ACID de niveau professionnel. Dans un monde toujours plus riche en données, il est important de pouvoir intégrer et modéliser des données complexes pour mettre au jour de nouvelles relations et tendances. La sémantique facilite la localisation des faits et des relations cachés, la création de concepts et de catégories, ainsi que la mise en contexte.
Dans une base de données dotée d'une capacité ACID, même les ensembles de données les plus importants sont traités de manière homogène et fiable pour qu'aucune des données ne soit altérée ou perdue. Plus important encore : grâce à l'évolutivité et la flexibilité de la structure NoSQL, le système peut être facilement adapté, développé et amélioré pour répondre aux exigences commerciales et réglementaires qui changent au fil du temps.
Voici trois exemples concrets d'utilisation des hubs de données opérationnelles pour résoudre les problèmes d'intégration de données complexes dans trois secteurs: banque d'investissement, produits pharmaceutiques et assurance.

Les banques d'investissement

Les banques doivent faire en sorte que leurs données commerciales soient de qualité optimale, accessibles et consultables afin de limiter les risques et d'assurer leur conformité aux exigences réglementaires (MiFID II et Dodd-Frank, notamment).
Une banque d'investissement leader a mis sur pied un hub de données opérationnelles en utilisant notre base de données. Elle bénéficie ainsi d'une vue unique et unifiée des transactions de dérivés. Les auditeurs et régulateurs peuvent quant à eux s'appuyer sur une piste d'audit complète. 20 bases de données Sybase ont ainsi été remplacées par une base de données unique, pour permettre de récupérer et d'exploiter les informations transactionnelles en temps réel. Outre l'amélioration des rapports de conformité, cela a permis de réduire considérablement les coûts de maintenance, le système reposant sur une architecture évolutive de base. Résultat : un moindre coût par transaction. La banque peut désormais développer et déployer de nouveaux logiciels, et donc lancer de nouveaux produits en réponse au marché, beaucoup plus rapidement.
En conjuguant innovation technologique et analyses bancaires, une banque d'investissement de premier plan qui travaille avec notre base au déploiement d'un référentiel de transactions, a perçu qu'il serait bientôt essentiel de savoir très précisément quelles informations étaient disponibles à quel moment. Suite à cette prise de conscience, une nouvelle fonctionnalité à l'importance croissante, appelée « gestion bitemporelle des données », a été mise au point. La fonction bitemporelle de notre société permet aux banques d'atténuer les risques « en remontant dans le temps par la technologie ». L'horodatage et la consultation des différentes versions d'un document permet d'identifier les changements et de suivre l'évolution des données au fil du temps sans avoir à recharger les versions de sauvegarde. Ce processus est crucial pour maintenir et démontrer la conformité aux processus d'analyse des données Dodd-Frank, par exemple.

L'industrie pharmaceutique

Les entreprises pharmaceutiques se démènent pour ordonner leurs données afin de se conformer à l'IDMP (la nouvelle norme ISO concernant l'identification des médicaments) et soumettre leurs données sur les médicaments à l'Agence européenne des médicaments. Cela concerne notamment des informations sur la manière dont ils doivent être utilisés, consommés et emballés.
La situation gagne en complexité puisqu'une bonne partie desdites informations est actuellement stockée dans des silos de données non connectés, notamment des systèmes de facturation, cliniques, de manufacture et de gestion logistique.
Le développement d'un hub de données opérationnelles, à l'aide d'une base de données de niveau entreprise NoSQL avec fonctions sémantiques pour intégrer l'ensemble de ces silos de données, constitue un moyen beaucoup plus rentable d'identifier et de collecter toutes ces sources de données. Une fois obtenue cette vision unifiée à 360°, il est facile de trouver les données nécessaires à la conformité IDMP et d'identifier les similitudes entre les ensembles de données. Ce principe est extrêmement important pour générer des rapports de sécurité à partir des données enregistrées lors des essais des médicaments ainsi que des données réelles au moment de l'homologation des médicaments, par exemple.

Les compagnies d'assurance

Les taux de détection pour les assureurs restent désespérément bas et pour la plupart, les fraudes ne sont détectées que très longtemps après les délits. Il est alors trop onéreux de demander réparation.
Les taux actuels de détection de fraude reposant uniquement sur l'expertise humaine atteignent au mieux 10 %, mais sont souvent beaucoup plus faibles. En utilisant un hub de données opérationnelles, les assureurs peuvent tirer parti de la puissance du Big Data, ainsi que des fonctions sémantiques et d'inférence pour détecter des comportements frauduleux jusqu'alors inconnus. Avec une vue à 360° des données, il devient possible d'évaluer la demande et son contexte, en comparant la demande à d'autres opérations similaires et à des demandes antérieures afin d'identifier les tendances.
En analysant les données, attribuant un score de risque à chaque demande, alertant les bonnes personnes en temps réel et en retardant les paiements pour toutes les demandes suspectes à score élevé, les assureurs seront en mesure d'optimiser leur taux de détection de manière spectaculaire.

En résumé : une percée stratégique en matière de données

Quel que soit le format ou la source, tout est une question de détail et la capacité d'une entreprise à explorer ses données constitue un facteur de différenciation commerciale déterminant. Un hub de données opérationnelles constitue la plate-forme de données flexible idéale pour résoudre les problèmes d'intégration de données complexes d'aujourd'hui. Il permet aux entreprises de tirer parti de la puissance du Big Data et des fonctions sémantiques et d'inférence pour obtenir ces informations cruciales et subtiles, ainsi que de desserrer l'étau des exigences de conformité réglementaire internationales en évolution constante.
Clichés mis à part, grâce un hub de données opérationnelles, la détection des données devient élémentaire, mon cher Watson.

Autres articles

Enquêtes sur les données ou comment un hub de données opérationnelles optimise les résultats à partir des données

Avec l'essor exponentiel des données créées et stockées au niveau international, dur dur de mener l'enquête par les temps qui courent.

Silos de données : accusés, levez-vous !

Résoudre le casse-tête des données grâce à un hub de données opérationnelles

Les banques d'investissement

L'industrie pharmaceutique

Les compagnies d'assurance

En résumé : une percée stratégique en matière de données

Progress annonce de nouvelles et puissantes fonctionnalités d'IA générative dans sa dernière version de MarkLogic Server

Progress présente MarkLogic FastTrack, pour la création d’interfaces graphiques directement connectées aux données de la plateforme de données Progress MarkLogic

Progress annonce son intention d'acquérir MarkLogic

Les acteurs de la finance misent sur le Data Management pour améliorer leurs décisions en matière d’investissement

Les acteurs de la finance misent sur le Data Management pour améliorer leurs décisions en matière d’investissement

Snowflake renforce la collaboration cross-cloud pour les données d'entreprise et l'intelligence artificielle - 21/11/2024

Snowflake unifie les données transactionnelles et analytiques avec la disponibilité générale des Hybrid Tables - 21/11/2024

Neo4j dépasse les 200 millions de dollars de chiffre d’affaires et accélère son leadership dans le domaine de la GenAI grâce à sa technologie de graphes - 20/11/2024

Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg - 06/11/2024

Se préparer à l’avenir des moteurs de recherche avec l’approche vectorielle - 22/10/2024