En 2019, la quantité de toutes les données sur Terre est de 2,7 Zettabytes, ce qui équivaut à 200 milliards de films HD. Bien sûr, cet amas de données croit à une vitesse fulgurante et double tous les deux ans. A titre d’exemple, plus de 293 milliards de mails[1] sont envoyés chaque jour dans le monde. Cette multitude d’informations est impossible à suivre à l’échelle humaine.
Pour s’attaquer à cet épineux problème, les entreprises adoptent des systèmes de gestion de l’information, pensant, à tort, que tous leurs problèmes seront alors réglés. Ces systèmes peuvent en effet créer plus de problèmes qu’ils n’en résolvent surtout quand les étagères technologiques sont réparties vers plusieurs référentiels de contenu. Et c’est souvent le cas pour les entreprises qui utilisent en moyenne trois systèmes de gestion de contenu distincts.
Le problème provient également du fait que la moitié des informations stockées au sein de données que l’on nomme les dark data (des données cachées, non analysées et possiblement détentrices d’informations importantes). On estime d’ailleurs que seulement 0,5% des données crées sont analysées pour de la prise de décision opérationnelle. Ce grand nombre de données, en particulier celles qui ne sont pas structurées en rend son utilisation compliquée. D’ailleurs, entre 80 et 90% des données des entreprises ne sont pas structurées. Ces informations se répartissent à travers des emails, des documents ou autres notes et naviguent sans qu’on ne sache ce qu’elles abritent.
Mais depuis l’arrivée du RGPD et d’autres règlements, il existe une forte pression auprès des entreprises pour qu’elles gèrent de manière transparente les informations qu’elles génèrent et reçoivent. Les conséquences de la non-conformité peuvent être dramatiques. Dès lors, comment gérer des données quand elles sont trop nombreuses, non structurées et stockées dans plusieurs systèmes en silo ?
L’intelligence artificielle peut devenir un très bon allié
Tout comme le parfum ou l’alcool qui ont besoin d’être raffinés avant d’être commercialisés, les données doivent subir le même traitement pour devenir utiles. Bien que l’IA fasse office de crainte pour beaucoup, elle s’inscrit, tout comme le machine learning, comme un atout au profit de la gestion de l’information, particulièrement pour le raffinage des données. Surtout, l’IA peut effectuer ce qu’un humain est incapable de faire, comme de trouver des liens de corrélation ou des schémas connus entre les millions de données qui transitent. Il est dès lors plus facile d’identifier des documents qui contiennent par exemple des informations personnelles et des flux en place pour mieux les gérer par la suite.
Cependant, la recherche de modèles n’est pas la seule manière dont l’IA peut aider à automatiser la gestion de contenus.
L’utilisation des métadonnées pour contextualiser les contenus
Les métadonnées peuvent être utilisées pour classer les informations afin de les rendre facilement accessibles. Elles permettent d’ordonner la masse de contenus existantes et à venir. Ainsi, les salariés travaillant dans différentes divisions pourront accéder aux mêmes informations sans avoir à sans cesse créer des duplicatas et engorger la masse de données détenus et à traiter.
Avec la suggestion automatique des métadonnées, notamment grâce à la classification des documents par sujets par exemple, les employés n’auront pas à reclasser ces informations, leur libérant ainsi du temps pour d’autres tâches à plus grande valeur ajoutée.
L’IA ne connait pas de barrière dans sa productivité à ordonner les informations lorsque les bonnes métadonnées sont utilisées, puisqu’elle va puiser sur cette organisation pour avancer dans son travail d’analyse et permettre de s’appuyer sur cette structure pour obtenir des bénéfices dans le futur.
Il existe donc cinq manières concrètes pour que l’application de l’IA aide dans la gestion de l’information :
1. En transformant les informations des dark data en données gérées grâce à l’IA.
2. En utilisant véritablement le contenu produit. Pour cela, une seule version d’un contenu doit être réalisée et être accessible par tous et sur tous les appareils.
3. En créant des workflows de gestion documentaire autour des informations critiques de l'entreprise.
4. En enrichissant les métadonnées avec des suggestions automatiques des métadonnées.
5. En évitant dès que possible les erreurs humaines dans la classification des contenus.
[1] Source : Radicati Group, février 2019.
Pour s’attaquer à cet épineux problème, les entreprises adoptent des systèmes de gestion de l’information, pensant, à tort, que tous leurs problèmes seront alors réglés. Ces systèmes peuvent en effet créer plus de problèmes qu’ils n’en résolvent surtout quand les étagères technologiques sont réparties vers plusieurs référentiels de contenu. Et c’est souvent le cas pour les entreprises qui utilisent en moyenne trois systèmes de gestion de contenu distincts.
Le problème provient également du fait que la moitié des informations stockées au sein de données que l’on nomme les dark data (des données cachées, non analysées et possiblement détentrices d’informations importantes). On estime d’ailleurs que seulement 0,5% des données crées sont analysées pour de la prise de décision opérationnelle. Ce grand nombre de données, en particulier celles qui ne sont pas structurées en rend son utilisation compliquée. D’ailleurs, entre 80 et 90% des données des entreprises ne sont pas structurées. Ces informations se répartissent à travers des emails, des documents ou autres notes et naviguent sans qu’on ne sache ce qu’elles abritent.
Mais depuis l’arrivée du RGPD et d’autres règlements, il existe une forte pression auprès des entreprises pour qu’elles gèrent de manière transparente les informations qu’elles génèrent et reçoivent. Les conséquences de la non-conformité peuvent être dramatiques. Dès lors, comment gérer des données quand elles sont trop nombreuses, non structurées et stockées dans plusieurs systèmes en silo ?
L’intelligence artificielle peut devenir un très bon allié
Tout comme le parfum ou l’alcool qui ont besoin d’être raffinés avant d’être commercialisés, les données doivent subir le même traitement pour devenir utiles. Bien que l’IA fasse office de crainte pour beaucoup, elle s’inscrit, tout comme le machine learning, comme un atout au profit de la gestion de l’information, particulièrement pour le raffinage des données. Surtout, l’IA peut effectuer ce qu’un humain est incapable de faire, comme de trouver des liens de corrélation ou des schémas connus entre les millions de données qui transitent. Il est dès lors plus facile d’identifier des documents qui contiennent par exemple des informations personnelles et des flux en place pour mieux les gérer par la suite.
Cependant, la recherche de modèles n’est pas la seule manière dont l’IA peut aider à automatiser la gestion de contenus.
L’utilisation des métadonnées pour contextualiser les contenus
Les métadonnées peuvent être utilisées pour classer les informations afin de les rendre facilement accessibles. Elles permettent d’ordonner la masse de contenus existantes et à venir. Ainsi, les salariés travaillant dans différentes divisions pourront accéder aux mêmes informations sans avoir à sans cesse créer des duplicatas et engorger la masse de données détenus et à traiter.
Avec la suggestion automatique des métadonnées, notamment grâce à la classification des documents par sujets par exemple, les employés n’auront pas à reclasser ces informations, leur libérant ainsi du temps pour d’autres tâches à plus grande valeur ajoutée.
L’IA ne connait pas de barrière dans sa productivité à ordonner les informations lorsque les bonnes métadonnées sont utilisées, puisqu’elle va puiser sur cette organisation pour avancer dans son travail d’analyse et permettre de s’appuyer sur cette structure pour obtenir des bénéfices dans le futur.
Il existe donc cinq manières concrètes pour que l’application de l’IA aide dans la gestion de l’information :
1. En transformant les informations des dark data en données gérées grâce à l’IA.
2. En utilisant véritablement le contenu produit. Pour cela, une seule version d’un contenu doit être réalisée et être accessible par tous et sur tous les appareils.
3. En créant des workflows de gestion documentaire autour des informations critiques de l'entreprise.
4. En enrichissant les métadonnées avec des suggestions automatiques des métadonnées.
5. En évitant dès que possible les erreurs humaines dans la classification des contenus.
[1] Source : Radicati Group, février 2019.
Autres articles
-
L’importance de l’intelligence artificielle pour diminuer les risques et améliorer la cybersécurité des cabinets comptables
-
Knowledge Work Automation : Késako ? Après les usines, l’automatisation fait son entrée dans les bureaux
-
La gestion de l’information devient la dorsale informatique des entreprises
-
Les solutions M-Files intègrent la technologie d’intelligence artificielle d’ABBYY pour automatiser la gestion de l’information