La fouille de données (Data Mining) regroupe un ensemble de techniques et d’outils qui automatise la recherche d’informations dans de gros volumes de données. Le développement du Big Data, à la fois en volume et en complexité, a rendu la recherche manuelle d’informations très difficile. On a donc cherché à l’automatiser. Dès les années 90, on décrivait le Data Mining comme « chercher le diamant caché au fond d’une mine de charbon, sans se salir les mains ». En s’appuyant sur la fameuse anecdote des couches-culottes et de la bière, on expliquait également que le Data Mining permettait de répondre à des questions qu’on ne se pose pas; ou plus exactement que l’on aurait pas imaginer devoir se poser.
Ainsi, en automatisant l’exécution de différents algorithmes statistiques, le système va identifier des corrélations, des comportements (« patterns »), que seule la chance aurait permis à l’analyste humain de trouver.
Depuis le développement de l’apprentissage machine, le Data Mining est moins médiatisé, mais sert encore de base à l’identification de comportements d’achats, de signaux de passage d’un client à la concurrence, etc.
Voir aussi : Data Mining, Mégadonnées (Big Data)