Accueil
›
Section C — Données et entraînement
›
Mégadonnées
L’anecdote de Yannick · étape 1 de « L’autre coût de l’IA »
À la centrale, lors d’un dîner de quart, un collègue plus jeune montre à Yannick un graphique : la quantité de données produite chaque jour dans le monde. 400 millions de téraoctets. Vidéos, photos, messages, capteurs, transactions, paroles enregistrées. Yannick essaie de visualiser. Il n’y arrive pas. C’est trop. Tout simplement trop.
Côté machine
Les mégadonnées (en anglais big data ) désignent les volumes de données numériques produits aujourd’hui à une échelle qui dépasse la capacité des outils traditionnels. Elles sont la matière première de toute IA contemporaine : sans mégadonnées, pas de modèles statistiques performants. La quantité a explosé avec l’Internet des objets, les réseaux sociaux et les capteurs partout autour de nous.
Mégadonnées
Équivalent anglais big data
Synonymes :
Analyse des mégadonnées synonyme OQLF
Analytique avancée synonyme OQLF
Exploration de données synonyme OQLF
Data mining anglicisme courant
Ensembles de données numériques d’une ampleur, d’une variété et d’une vitesse de production telles que leur traitement requiert des outils et des méthodes spécialisés, irréalisable avec les techniques classiques de gestion de bases de données.
Note
L’OQLF recommande « mégadonnées » plutôt que l’anglicisme « big data ».
Exemple
L’ensemble des transactions bancaires d’un pays sur une décennie, ou tout le contenu textuel d’une grande encyclopédie en ligne.
Source OQLF, GDT.