Le groupe UBS, l'une des plus importantes institutions financières au monde, a mis au point une plateforme de traçabilité et de gouvernance des données en utilisant Neo4j. L'entreprise peut suivre les données en temps réel pour répondre aux normes du secteur bancaire en matière de gestion et de reporting du risque.
L'entreprise
UBS est une banque d'investissement et une société de services financiers multinationale basée en Suisse. Fondée en 1862, elle est le plus grand acteur du prestigieux secteur bancaire suisse. UBS compte des bureaux dans plus de 50 pays, emploie plus de 66 000 personnes et a déclaré un actif total de plus de 958 milliards de dollars en 2018. UBS opère dans cinq grands secteurs d'activité : services bancaires aux particuliers, gestion de patrimoine, entreprises et clients insti- tutionnels, banque d'investissement et gestion d'actifs.
Le défi
UBS devait se conformer à la réglementation instaurée pour renforcer les systèmes d'agré- gation des données sur le risque et le reporting interne des risques suite à la crise financière mondiale de 2007. En particulier, UBS devait assurer sa conformité au standard 239 (BCBS 239) du Comité de Bâle portant sur la supervision bancaire.
Selon cette réglementation, les banques doivent faire preuve de transparence sur les flux de données qui alimentent le reporting de leurs risques. Cela exige une vaste gouvernance des données et leur traçabilité détaillée.
La traçabilité des données est un composant essentiel de la gestion du risque. Elle implique le suivi des informations sur tout leur cycle de vie - leur origine, leur évolution et leurs déplace- ments dans l'organisation. Grâce à la traçabilité des données, les organisations peuvent suivre l'information au fur et à mesure qu'elle circule dans l'entreprise, superviser sa qualité, détecter les erreurs et remonter à leur source, minimiser les dommages et réduire la duplication des données.
UBS a mis au point une application dénommée Group Data Dictionary (GDD) comme outil de traçabilité et de gouvernance des données.
La première version a été développée sous Oracle, mais UBS a vite constaté les limites d'une approche SGBDR qui s'appuie sur des JOINTURES pour connecter les données de différents tableaux. UBS a voulu se doter d'une meilleure solution capable de générer des visualisations du traçage des données en temps réel et d'exporter les informations de traçabilité en vue d'ana- lyses ad hoc via Excel.
La solution
Le meilleur moyen de résoudre la question de la traçabilité des données consiste à utiliser des données connectées.
« La traçabilité des données est une suite de données hautement connectées dont le suivi se fait plus naturellement dans une base de données de graphes » explique Sidharth Goyal, ingénieur logiciel et responsable technique senior chez UBS.
Neo4j présentait plusieurs avantages par rapport à une base de données relationnelle avec notamment des requêtes utilisant le langage Cypher de Neo4j.
« Cypher nous permet de traverser plus facilement des données non-connectées, en particulier par rapport à PL/SQL qui utilise des JOINTURES entre plusieurs tableaux pour générer le traçage sous forme de base de données relationnelle et y ajoute une couche de traitement pour forma- ter le tout en objet puis le visualiser. Cypher et Neo sont plus naturellement adaptés au type de travail que nous tentons de faire » poursuit Sidharth Goyal.
Le nouvel outil de traçabilité et de gouvernance des données devait s'intégrer aisément avec le système hérité. Tous les flux de travail et les fonctions d'audit d'UBS restant sous Oracle, la synchronisation s'avérait essentielle.
UBS a synchronisé Neo4j avec le système Oracle en commençant par une charge initiale de données, puis a effectué une synchronisation incrémentielle par lecture des transactions dans un tableau Oracle et écriture dans Neo4j en temps réel.
UBS a utilisé Neo4j pour évaluer les suivis des données et décrire les résultats dans GraphJSON. Ces informations passent dans un outil de visualisation D3.js pour représenter les données sous forme de schéma de traçabilité.
Détenir toutes les métadonnées facilite le reporting. Les données peuvent servir à des rapports au cas par cas quand des questions particulières se posent, et l'ensemble de la traçabilité peut être exportée dans Excel.
Les résultats
UBS a pu se mettre en conformité avec ses obligations réglementaires en peu de temps, avec des ressources limitées.
Grâce à Neo4j, UBS peut faire le suivi de l'ensemble des métriques pour toutes les initiatives dans la banque. La solution a cela d'unique qu'elle allie réponses en temps réel et agilité. La traçabilité couvre des dizaines de niveaux d'entités et de dépendances, ce qui aurait été impossible en temps réel avec des technologies traditionnelles.
Quand elle génère un traçage de données, l'entreprise évite le casse-tête d'une traversée de plusieurs tableaux dans une base de données relationnelle. Avec Neo4j, les résultats apparaissent facilement et s'affichent dans un format de graphe intuitif.
Les exigences en matière d'analyse de l'activité évoluent constamment. Neo4j s'appuie peu sur des schémas ou des index prédéfinis, d'où sa capacité à suivre le rythme des changements. Grâce à la synchronisation, l'outil de traçabilité des données reste à jour avec le système de l'entreprise.
« [Neo4j] nous aide à comprendre le flux des données dans l'organisation » indique Sidharth Goyal. « La solution nous aide à cerner comment les modifications dans une application vont impacter toute l'entreprise. Nous saisissons plus facilement comment les erreurs peuvent se propager dans le système. »
L'entreprise
UBS est une banque d'investissement et une société de services financiers multinationale basée en Suisse. Fondée en 1862, elle est le plus grand acteur du prestigieux secteur bancaire suisse. UBS compte des bureaux dans plus de 50 pays, emploie plus de 66 000 personnes et a déclaré un actif total de plus de 958 milliards de dollars en 2018. UBS opère dans cinq grands secteurs d'activité : services bancaires aux particuliers, gestion de patrimoine, entreprises et clients insti- tutionnels, banque d'investissement et gestion d'actifs.
Le défi
UBS devait se conformer à la réglementation instaurée pour renforcer les systèmes d'agré- gation des données sur le risque et le reporting interne des risques suite à la crise financière mondiale de 2007. En particulier, UBS devait assurer sa conformité au standard 239 (BCBS 239) du Comité de Bâle portant sur la supervision bancaire.
Selon cette réglementation, les banques doivent faire preuve de transparence sur les flux de données qui alimentent le reporting de leurs risques. Cela exige une vaste gouvernance des données et leur traçabilité détaillée.
La traçabilité des données est un composant essentiel de la gestion du risque. Elle implique le suivi des informations sur tout leur cycle de vie - leur origine, leur évolution et leurs déplace- ments dans l'organisation. Grâce à la traçabilité des données, les organisations peuvent suivre l'information au fur et à mesure qu'elle circule dans l'entreprise, superviser sa qualité, détecter les erreurs et remonter à leur source, minimiser les dommages et réduire la duplication des données.
UBS a mis au point une application dénommée Group Data Dictionary (GDD) comme outil de traçabilité et de gouvernance des données.
La première version a été développée sous Oracle, mais UBS a vite constaté les limites d'une approche SGBDR qui s'appuie sur des JOINTURES pour connecter les données de différents tableaux. UBS a voulu se doter d'une meilleure solution capable de générer des visualisations du traçage des données en temps réel et d'exporter les informations de traçabilité en vue d'ana- lyses ad hoc via Excel.
La solution
Le meilleur moyen de résoudre la question de la traçabilité des données consiste à utiliser des données connectées.
« La traçabilité des données est une suite de données hautement connectées dont le suivi se fait plus naturellement dans une base de données de graphes » explique Sidharth Goyal, ingénieur logiciel et responsable technique senior chez UBS.
Neo4j présentait plusieurs avantages par rapport à une base de données relationnelle avec notamment des requêtes utilisant le langage Cypher de Neo4j.
« Cypher nous permet de traverser plus facilement des données non-connectées, en particulier par rapport à PL/SQL qui utilise des JOINTURES entre plusieurs tableaux pour générer le traçage sous forme de base de données relationnelle et y ajoute une couche de traitement pour forma- ter le tout en objet puis le visualiser. Cypher et Neo sont plus naturellement adaptés au type de travail que nous tentons de faire » poursuit Sidharth Goyal.
Le nouvel outil de traçabilité et de gouvernance des données devait s'intégrer aisément avec le système hérité. Tous les flux de travail et les fonctions d'audit d'UBS restant sous Oracle, la synchronisation s'avérait essentielle.
UBS a synchronisé Neo4j avec le système Oracle en commençant par une charge initiale de données, puis a effectué une synchronisation incrémentielle par lecture des transactions dans un tableau Oracle et écriture dans Neo4j en temps réel.
UBS a utilisé Neo4j pour évaluer les suivis des données et décrire les résultats dans GraphJSON. Ces informations passent dans un outil de visualisation D3.js pour représenter les données sous forme de schéma de traçabilité.
Détenir toutes les métadonnées facilite le reporting. Les données peuvent servir à des rapports au cas par cas quand des questions particulières se posent, et l'ensemble de la traçabilité peut être exportée dans Excel.
Les résultats
UBS a pu se mettre en conformité avec ses obligations réglementaires en peu de temps, avec des ressources limitées.
Grâce à Neo4j, UBS peut faire le suivi de l'ensemble des métriques pour toutes les initiatives dans la banque. La solution a cela d'unique qu'elle allie réponses en temps réel et agilité. La traçabilité couvre des dizaines de niveaux d'entités et de dépendances, ce qui aurait été impossible en temps réel avec des technologies traditionnelles.
Quand elle génère un traçage de données, l'entreprise évite le casse-tête d'une traversée de plusieurs tableaux dans une base de données relationnelle. Avec Neo4j, les résultats apparaissent facilement et s'affichent dans un format de graphe intuitif.
Les exigences en matière d'analyse de l'activité évoluent constamment. Neo4j s'appuie peu sur des schémas ou des index prédéfinis, d'où sa capacité à suivre le rythme des changements. Grâce à la synchronisation, l'outil de traçabilité des données reste à jour avec le système de l'entreprise.
« [Neo4j] nous aide à comprendre le flux des données dans l'organisation » indique Sidharth Goyal. « La solution nous aide à cerner comment les modifications dans une application vont impacter toute l'entreprise. Nous saisissons plus facilement comment les erreurs peuvent se propager dans le système. »
Autres articles
-
Neo4j transforme son portefeuille de bases de données cloud pour accélérer l'adoption des graphes et de l’IA générative en entreprise
-
Board simplifie la vie des directions financières avec une solution qui réduit de 75% les délais de clôture
-
Podcast : La donnée sous tous les angles, avec Philippe Charpentier, CTO de NetApp France
-
Podcast : Données CSRD et ESG avec Nicolas Letavernier Workiva
-
Podcast : Ethique et responsabilité de l'IA, et si la clef venait des graphes de connaissance