• component (10)

    Blog de l'IoT Valley

    Articles populaires

    Tous nos articles:

    Quelle place pour les données dans un projet IoT ?

    Les données sont le premier vecteur de valeur des projets IoT. Quelles sont les bonnes pratiques à respecter pour en tirer de l’information pertinente ?
    données dans un projet IoT - internet des objets

    Les services conçus autour de l’IoT s’appuient tous sur les données. Pour valoriser ces dernières dans des cas d’usage pertinents, un certain nombre de prérequis s'imposent, depuis la collecte jusqu’à la diffusion.

    Dès que l’on parle d’Internet des Objets (IoT), le sujet des données arrive rapidement sur la table. Tout le monde s’accorde pour évoquer une explosion de la « datasphère » : IDC a par exemple estimé à 90 zettaoctets le volume de données générées par l’IoT en 2025 (1 Zo équivaut à 1 milliard de To). Si ces chiffres peuvent donner le vertige, il ne faut pas perdre de vue l’essentiel : l’intérêt majeur d’un projet d’IoT ne réside pas dans la quantité de données produites mais dans l’usage qu’on en fait.

    Sur le plan purement financier, McKinsey évalue le potentiel des cas d’usage autour de l’IoT entre 3,9 et 11,1 milliards de dollars US d’ici 2025. Parmi les différents modèles économiques possibles, ceux qui tirent profit des données sont de loin les plus pérennes et les plus attractifs, et le marché l’a bien compris. Selon une étude menée par Canonical en 2017, la stratégie de monétisation privilégiée des projets IoT repose en effet sur la création de services à valeur ajoutée (78%), devançant les modèles économiques purement basés sur le matériel (location ou vente d’objets).

    Les clefs pour valoriser les données de l’IoT

    « Pour tirer le maximum de valeur d’un projet IoT, il est important de garder la main sur ses données », souligne Anna Choury, consultante spécialisée dans l’éthique autour de l’intelligence artificielle, auparavant créatrice de la société Alykis. Cette mathématicienne et ingénieure de recherche, experte en big data, a présenté pour la plateforme Genesis les principaux enjeux en matière d’usage des données IoT. « La data permet aux entreprises de se diversifier, en proposant non seulement un capteur mais aussi des services. Avec un même capteur, autour des mêmes données, on peut imaginer des services très différents. Par exemple, dans un projet IoT sur le réseau électrique, l’entreprise peut créer des services BtoB, comme la maintenance prédictive des installations ou la prévision de flux, et des services BtoC, comme le suivi de sa consommation d’énergie. »

    Déployer ce type de cas d’usage ne s’improvise pas : un certain nombre de bonnes pratiques doivent être mises en œuvre en amont, afin de pouvoir exploiter les données IoT dans des modèles d’analyse pertinents. Au moment où le capteur les enregistre, il s’agit en effet de données brutes, qui nécessitent tout un travail de raffinage avant de pouvoir fournir une information valorisable.

    Comprendre le cycle de la donnée dans un projet IoT permet de faire les bons choix dès le départ, afin de réduire au maximum le délai de mise sur le marché des solutions et des services. Ce cycle se découpe classiquement en six étapes : la collecte, le nettoyage, le stockage, la transformation, l’analyse et enfin la diffusion.

    Capturer les bonnes données

    La première étape est la collecte. Pour construire un modèle d’analyse robuste, il faut s’assurer de capturer les bonnes données, dans des conditions aussi proches que possible de l’usage envisagé. « Le plan d’expérience est une notion qui désigne la suite d’essais à mener pour couvrir le champ des possibles. Il doit être délimité avec soin, afin de minimiser le coût et la durée du projet, tout en restant pertinent », prévient Anna Choury. « Tester un capteur destiné à des pneus de tracteur sur un véhicule personnel n’a pas de sens », illustre-t-elle. En effet, collecter des données qui ne sont pas représentatives de la réalité ne permettra pas d’extrapoler, de prédire et donc de valoriser le projet IoT.

    Connaître le contexte dans lequel les données sont collectées facilite également leur compréhension : une température seule n’apprendra pas grand-chose, si l’on ne sait pas où, quand et dans quelles conditions elle a été mesurée.

    Un autre paramètre à prendre en compte lors de la collecte est le pas de mesure : trop large, le risque est de perdre de l’information. Trop fin, celui-ci va générer du bruit, ce qui rendra l’analyse plus difficile. « Le pas de mesure peut évoluer en fonction des circonstances. Il doit être resserré quand la mesure évolue, élargi quand la mesure stagne », précise Anne Choury.

    Le nettoyage constitue l’étape suivante. Il ne prend que peu de temps quand des règles précises sont établies en amont, pour le nommage, l’encodage ou les données manquantes, à condition bien sûr que ces conventions soient documentées et respectées. En revanche, en présence de données très hétérogènes et de qualité médiocre, cette tâche peut demander jusqu’à 80% de temps supplémentaire.

    Rester agile au niveau du stockage

    Pour choisir une solution de stockage, il faut garder à l’esprit que les données IoT sont un actif de l’entreprise. À cet égard, les héberger sur de grandes plateformes de cloud peut s’avérer risqué, la moindre modification à apporter sur l’architecture risquant de se traduire par des coûts supplémentaires. La vigilance est aussi de mise sur la réversibilité des données, afin de pouvoir facilement récupérer celles-ci en cas de changement de plateforme. Se contenter d’une clause écrite dans le contrat n’est pas suffisant : dans l’idéal, le processus de récupération doit être testé.

    Le choix du système de gestion de base de données (SGBD) est également un aspect important, qui dépend du type de données collectées : taille, quantité, format, relations éventuelles… Les bases non relationnelles (NoSQL) ont le vent en poupe pour les projets IoT, notamment les solutions Open Source : « MongoDB est plutôt orientée documents, mais assez polyvalente dans les faits ; Couchbase et Cassandra conviennent aux modèles de données simples ; Neo4J est adapté aux données en graphe. Enfin, Elastic est intéressante pour les données purement textuelles », détaille Anna Choury. Celle-ci précise néanmoins qu’il faut savoir rester agile au niveau du SGBD, les besoins pouvant évoluer en cours de route. « Une entreprise qui veut développer un modèle temps réel sur une base qui ne le permet pas ne doit pas hésiter à changer d’architecture, même si cela prend du temps ».

    Enfin, la loi comporte un certain nombre d’obligations en matière de stockage des données. Avec l’entrée en vigueur du RGPD (Règlement Général sur la Protection des Données) le 25 mai 2018, toute entreprise doit pouvoir indiquer la provenance des données qu’elle utilise, expliquer pourquoi elle les a collectées et quels traitements leur sont appliqués. « Cela revient à tenir une comptabilité de la donnée », explique Anna Choury. Les projets IoT n’y échappent pas, en particulier ceux qui capturent des données personnelles auprès des usagers : consommation électrique, conduite de véhicule, données de santé...

    Vigilance sur l’éthique des algorithmes

    Les solutions pour le traitement et l’analyse des données prolifèrent, chacune avec ses points forts et ses limites. « Il n’y a pas d’outil miracle capable de répondre à l’ensemble des problématiques », avertit Anna Choury. « Par exemple, établir une moyenne, un traitement classique dans le Machine Learning, n’a pas de sens sur des signaux décalés en phase : toute l’information est alors perdue ». Pour bien choisir, il faut regarder les données : qu’observe-t-on ? Que veut-on obtenir ? Quel est leur type ? Leur granularité ? Quelle puissance de calcul faut-il ?

    L’éthique est également une dimension essentielle pour les traitements apportés aux données, portée par la discipline émergente du Fair Learning. « Quand on innove, on crée le monde de demain », rappelle Anne Choury. Pour chaque traitement envisagé, il faut réfléchir à sa légitimité et à son caractère équitable, pour éviter de bâtir des modèles qui reproduisent, voire accentuent les discriminations. De plus en plus, les entreprises qui ne tiennent pas compte de ces enjeux vont s’exposer à des sanctions. « La loi prévoit le droit pour les personnes d’obtenir, auprès de celui qui en est responsable, des informations sur la logique de fonctionnement de l’algorithme », écrit ainsi la CNIL dans un rapport sur les enjeux éthiques des algorithmes et de l’intelligence artificielle, publié en 2017. « Même dans les projets BtoB, il faut s’assurer que les algorithmes utilisés ne comportent pas de biais, car les clients sont obligés de s’assurer de la conformité de tous leurs fournisseurs. Ne pas s'en soucier revient de fait à perdre des opportunités », souligne Anna Choury.

    Une fois l’information extraite et utilisée, la plupart des projets basés sur les données s’arrêtent là. Il est pourtant souhaitable de documenter les résultats obtenus, afin de tracer à quoi ont servi les données et les traitements. Enfin, toute donnée possède une durée de vie, qui peut d’ailleurs être assez courte dans certains projets IoT. « Inutile de laisser des données obsolètes sur des serveurs de production », prévient Anne Choury, qui conclut : « parfois, il faut savoir laisser mourir ses données ».

    À retenir

    Les données sont la principale source de valeur des projets IoT

    Pour transformer les données IoT en information, un ensemble d’étapes sont nécessaires.

    Les conditions de collecte des données nécessitent une attention particulière

    Les projets IoT doivent prendre en compte la dimension éthique

     

     

    Intéressé.e par l'IoT ?

    Contactez-nous