Le concept de données volumineuses s’est développé largement entre 2005 et 2010, même si la plupart des entreprises ont lancé leurs premiers projets dix ans plus tard. Mais il ne correspond pas à une « révolution » technologique qui aurait imposé un nouveau mot. On parle en réalité de mégadonnées depuis les années 90, même si le terme de Big Data était alors peu utilisé.
Théorisé par des analystes américains, le concept de « Big Data » a été caractérisé par les trois « V »: Volume, Vitesse, et Variété. Le volume pour indiquer qu’il s’agit de grandes quantités de données; la vitesse pour souligner que dans le monde des réseaux sociaux, de l’internet des objets, et des applications en ligne, les données sont maintenant générées sous forme d’un flux continu; et la variété pour inclure les données traditionnelles (structurées) et non structurées. D’autres analystes et consultants ont ajouté à cette définition des V supplémentaires tels que la véracité, la valeur, etc.
En français, le terme de « Big Data » est largement utilisé. Il est traduit officiellement par le mot « mégadonnées », pourtant rarement utilisé. On parle parfois également de données massives ou de données volumineuses, mais ces deux traductions insistent trop sur le volume, et sous-valorisent la vitesse et la variété.
Voir aussi : Big Data, Données massives, Données volumineuses, Fouille de données (Data Mining), Lac de données (Data Lake)