Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Big Data et Exploitation Analytique des Textes


Rédigé par le 6 Avril 2012

Les entreprises cherchent de plus en plus à tirer parti des Big Data, en particulier des données textuelles, celles générées via les outils utilisateurs par les applications bureautiques ou web. Les analystes spécialisés sur le sujet pensent que 70 % des informations qui intéressent les entreprises sont nichées dans les documents word, excel, les courriels, etc. Ces données ne sont pas prédéfinies dans un modèle et ne peuvent pas être parfaitement rangées dans des tables relationnelles. Elles se présentent le plus souvent sous une forme très libre, mais contiennent des dates, des chiffres, des mots clés, des faits qui peuvent être exploités.



Michel Bruley, Directeur Marketing Teradata Europe de l’Ouest
Michel Bruley, Directeur Marketing Teradata Europe de l’Ouest
Un nouveau défi pour les entreprises en matière d’analyse de données est donc de significativement progresser dans l’exploitation de ce type de données non structurées. En matière de connaissance client par exemple, il s’agit en particulier de mieux exploiter les archives des propositions commerciales et des contrats ou d’écouter les conversations web ou de tirer partie des dialogues via les courriels. La maîtrise des relations, notamment des discussions de l’entreprise avec sa communauté de clients et les acteurs de son écosystème, est une clef du marketing actuel qui est en pleine mutation du fait des nouvelles technologies (mobilité, médias sociaux, ...).

La quantité de ce type de données numériques exploitables est en croissance permanente et comme « l’extraction manuelle » d’informations est extrêmement ardue, voire pratiquement impossible à grande échelle, le recours à des outils informatiques spécifiques pour le traitement de données textuelles non structurées s’impose. C’est ainsi que sont nés, les outils de fouille de données textuelles, qui permettent d’automatiser le traitement de gros volumes de contenus texte, pour répertorier de manière statistique les différents sujets évoqués et en extraire les principales informations.

La fouille textuelle applique sur les textes des traitements linguistiques, notamment morphologiques, syntaxiques, sémantiques, ainsi que diverses techniques d’analyse de données, de statistique, de classification, etc. Concrètement il s’agit de synthétiser (classer, structurer, résumer, …) les textes en analysant les relations, les structures et les règles d’association entre unités textuelles (mots, groupes, phrases, documents). Au final cela permet d’automatiser la production et la gestion de documents (notamment des résumés) ou d’informations (extraction, recherche, diffusion).

La fouille textuelle a de nombreuses applications par exemple dans le domaine de la relation client, elle permet en particulier d’explorer le contenu de documents (par exemple les questions ouvertes dans une enquête, les commentaires et plaintes des clients, l’analyse des réclamations de garantie) ; affecter des documents à des thèmes prédéfinis (redirection, filtrage des courriels, organisation des documents par catégories, classement des contacts au centre d’appel) ; composer des résumés de textes (abstraction et condensation) ; interroger des textes par concepts, mots-clés, sujets, phrases visant à obtenir des résultats triés par ordre de pertinence, à la Google ; et enfin augmenter la performance de modèles prédictifs en combinant des données textuelles et des données structurées.

Teradata qui a un long passé dans l'analyse des données ne pouvait pas manquer ce passionnant domaine. Comme les solutions classiques sont mal adaptées pour certains traitements nécessaires pour ces informations textuelles, Teradata a acquis au début de 2011 la société Aster Data qui dispose d'une solution spécialisée brevetée SQL-MapReduce ™. Avec ce moyen supplémentaire qui permet de mieux exploiter de grands volumes de données non relationnelles, Teradata est en mesure de proposer à ses clients des solutions d'analyse très innovantes.

Les solutions Teradata Aster peuvent aider les entreprises à traiter les données textuelles brutes, appliquer une variété d'approches analytiques et chercher des informations et de la signification dans les textes, afin par exemple de : surveiller les commentaires des clients à travers de multiples canaux pour comprendre leur perception et leur satisfaction ; identifier les domaines de préoccupation et d'intérêt dans les discussions des clients ; identifier les tendances dans le développement de la fraude ; comprendre et influencer la façon dont les marques et les entreprises sont perçues dans les forums en ligne (blogs, médias sociaux, etc.) ; identifier les tendances dans les plaintes et les retours qui révèlent des types de défaillances ; classifier et indexer des documents pour faciliter la recherche et la récupération ; ou enfin analyser les enregistrements des appels et des plaintes pour identifier les clients rencontrant des problèmes de qualité et qui risquent de partir à la concurrence.

Pour conclure, la fouille textuelle est un ensemble de technologies qui permet de détecter des éléments de langage, de les transformer en un type de données qui peuvent être manipulées et faire l’objet de traitement statistiques. Pour aller plus loin, vous pouvez cliquer sur le lien ci-dessous, pour découvrir pourquoi il est nécessaire d'utiliser des outils analytiques avancés tels que ceux de Teradata Aster, pour exploiter pleinement les données non structurées. Des entreprises des secteurs de la distribution ou du web comme Barnes & Noble ou LinkedIn utilisent déjà des solutions Teradata Aster pour obtenir des avantages concurrentiels.
http://www.asterdata.com/product/faq.php




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store