Pourquoi dit-on “la data” pour parler des données ?

Formation
blaise-de-carne.jpg
Blaise de Carné
Cofondateur & Directeur technique
En 2012, alors que nous venions tout juste de créer Conjecto, nous nous présentions simplement comme des experts de la donnée et du web sémantique. Aujourd’hui, adieu “donnée” au profit de son équivalent anglais “data”, qu’on associe à une multitude de termes parfois opaques : on voit fleurir un peu partout des smart data, des data scientists et autre data lakes, aux périmètres flous pour ne pas écrire ici “bullshit”.

Évidemment, les métiers évoluent, au rythme des technologies et des tendances du marché. Les jargons métiers, comme le nôtre, n’échappent pas à ce mouvement, même s’ils se diluent parfois pour perdre en sens et créer une forme de distance entre “ceux qui savent” et les autres. “La data” et son champ sémantique en est un exemple frappant. Voici (en partie) pourquoi.

Préambule : le dico de Conjecto

Revenons d’abord à la définition de ces termes. La donnée, ou la data, désigne tout simplement un élément brut, sans contexte, qui n’a pas été analysé. Une date de naissance est une donnée, le nombre de visiteurs dans un lieu en est aussi une. Dès lors qu’on associe plusieurs données pour les interpréter, on parle d’information. Le stade ultime étant la connaissance, lorsque ces informations sont partagées et assimilées par plusieurs personnes (ou machines, car on parle aussi de “knowledge management” depuis fort longtemps).

Aujourd’hui pourtant, le terme “donnée” dans sa VF est limité : on l’associe par défaut au RGPD, aux Systèmes d’Informations (SI) ou à la propriété intellectuelle. Des univers relativement normés et contraints. À l’inverse, “la data” paraît beaucoup plus vaste, presque impalpable avec cette connotation innovante que n’a pas la “donnée”. On notera par ailleurs que le singulier est largement utilisé pour désigner une multitude d’éléments bruts.

Coup d’oeil dans le rétroviseur de la donnée / data 

Comment expliquer cette différence entre deux équivalences ? Par l’arrivée soudaine de deux expressions dans notre quotidien : le Big Data, si important qu’on lui ajoute des majuscules, et la data, qui nous permet d’accéder aux Internets mondiaux via notre smartphone. Des termes qui ont fait leur apparition quasi en simultané, une poignée d’années après la création de Conjecto. Aussi qualifiée d’or noir, la “Grosse Donnée” désignait pour sa part la masse de données disponibles, à exploiter par les entreprises — pour mieux connaitre leurs consommateurs, pour recruter, et pour innover. Un sujet nébuleux pour bon nombre de ces entreprises. Heureusement, les possibilités offertes par “la data” sont bien plus accessibles aujourd’hui qu’elles ne l'étaient hier. 

Bref, le terme “data” s’est progressivement imposé pour détrôner sa traduction française. Et pourquoi pas, tant que les mots sont clairs et largement compris par tous. 

La (vraie) question de l’innovation par la donnée / data

Qu’on parle de data ou de donnée, le potentiel est énorme pour les entreprises privées ou les acteurs publics — mais aussi pour les personnes comme vous et moi. C’est même l’une des clés de l’innovation, tant cette matière brute reste à exploiter. Une matière à détecter (en interne ou en externe, en open data ou monétisée), à raffiner et à adapter aux enjeux de chacun. C’est d’ailleurs la quintessence de notre approche, dans tous les projets sur lesquels nous collaborons : extraire l’enjeu, le besoin, le contexte, la finalité qui donnent toute leur richesse aux données manipulées.

Alors “data” ou "donnée'' ? En Bretons que nous sommes, la réponse sera normande : les deux. Car si nous savons que ce terme “data” largement utilisé est flou, nous devons nous en emparer pour adopter un langage commun avec nos interlocuteurs, et expliquer, transmettre… pour innover ensemble.

DATAtourisme x DGE
Web sémantique
Tourisme
DATAtourisme est l’une de nos plus belles références. Car ce projet initié par la Direction Générale des Entreprises (DGE) était ambitieux, et nécessitait des compétences techniques spécifiques que nous avions déployées en interne, dès les prémisses de Conjecto. La plateforme à concevoir devait à la fois homogénéiser un volume important de données très hétérogènes, tout en répondant à des besoins d'utilisateurs variés — diffuseurs et producteurs de données notamment. Par ailleurs, les exigences techniques étaient fortes, tant du côté des performances, que de l’ergonomie et de la sécurité. Un défi technique que nous avons aimé relever, alors que Conjecto soufflait tout juste sa quatrième bougie, en 2016. DATAtourisme est aussi une collaboration qui s’est inscrite dans la durée, au fil des évolutions techniques de la plateforme, et des échanges avec nos clients — des interlocuteurs dont vous pourrez lire les témoignages ici même.
CRAFT x BDI
Web sémantique
En tant qu’agence de développement économique en Bretagne, BDI — Bretagne Développement Innovation — œuvre à promouvoir le dynamisme des acteurs de tous horizons en région, et à favoriser les synergies. C’est dans cet objectif que Craft a été conçu : une plateforme de mutualisation des données de toutes ces parties prenantes en Bretagne, qu’elles soient issues de la recherche, de l’industrie, du public ou du privé. Craft en est à sa cinquième version, entièrement repensée dans son architecture, dans les technologies déployées et dans ses fonctionnalités. Aujourd’hui, Craft est un outil innovant d’information, de visualisation et de production de connaissances. Retour sur ce projet de refonte, pour lequel nous avons été missionnés en 2020.
Prévost Laboratory Concept
Web sémantique
Dataviz
Scrapping
Prévost Laboratory Concept est un laboratoire breton spécialisé dans la fabrication à façon de produits cosmétiques, de compléments alimentaires liquides et de soins pour animaux. Ses atouts : sa capacité à répondre aux besoins particuliers de ces secteurs d’activités, quels que soient le type de conditionnement et la taille des lots. Une souplesse qui nécessite un suivi pointilleux des process de bout en bout, tant pour la gestion que pour la traçabilité des produits. 25 ans après sa création, l’entreprise grandit et doit optimiser ses outils de travail — notamment dans la gestion de la production. C’est dans ce contexte que nous avons rencontré Prévost Laboratory Concept, pour concevoir une solution sur-mesure et évolutive, baptisée JECTO.
Simatlantic x OFB
Joindre l’utile à l’agréable, la pédagogie à la technique : c’est en somme le challenge que nous avons relevé pour l’OFB, qui dispose aujourd’hui d’un outil de cartographies interactives, à la fois intuitif et accessible à tous.
CNODD x DREAL
La plateforme du CNODD est un projet innovant, aux carrefours de la mise en réseau, des technologies de d’acquisition de l’information (scrapping/crawling) et de classification. Site internet : https://www.cnodd.fr/
PACAuto x DREAL
Conception d’un outil qui génère des documents de Porter À Connaissance (PAC) de manière entièrement automatisée. La plateforme permet de configurer, au sein d’une trame paramétrable, la mise en forme de données issues de sources externes variées. Cette trame permet de proposer des documents ScoT, PLU, PLUi, etc... générés automatiquement à la demande.
Sygefor
Sygefor est un logiciel de gestion de formations pour les organisations publiques. Financé par le Ministère de l’Enseignement, ce projet a été réalisé pour l’ARU (le réseau des Unités Régionales de Formation à l’Information Scientifique et Technique). Il a été déployé par de nombreux établissements publics depuis (CNRS, Université de Bordeaux…).
Savéol
Derrière cette marque bretonne, connue dans tout l’hexagone, se cache une complexité de gestion et d’exploitation des données pour gagner en performance. Un challenge que nous avons aimé relever avec Savéol, pour leur offrir une solution sur mesure et un accompagnement sans couture.
Copyright © 2024 Conjecto