A grand pouvoir, grande responsabilité : le Big Data vs. la protection des données
L’année 2018 est marquée par une augmentation encore plus importante de l’exploitation des données avec l’apparition notamment de plusieurs nouvelles technologies. Bien que l’ère de la transformation digitale ait débuté depuis plusieurs années déjà, celle-ci continue à affecter largement les industries et entreprises plus traditionnelles qui se tournent progressivement vers l’exploration et l’exploitation de la donnée, et deviennent de plus en plus “data-driven”.
Paradoxalement, l’opinion publique est plus consciente que jamais de la sensibilité des données, et ce notamment à travers l’entrée en vigueur de réglementations comme le RGPD, ou encore à cause de scandales tels que celui de Cambridge Analytica. C’est ainsi que la problématique éthique que posent certains aspects du Big Data inquiète les entreprises qui doivent désormais se conformer à la réglementation, sans pour autant dégrader la qualité des traitements élaborés et mis en place sur leurs systèmes d’informations.
Les technologies du Big Data : un développement toujours aussi prononcé
Les technologies du Big Data ont permis l’émergence de l’intelligence Artificielle (IA) : celle-ci demande en effet, à la fois une grande puissance de calcul et de gros volumes de données pour entrainer et tester les modèles.
Les entreprises cherchent désormais à intégrer l’IA dans leurs processus métiers et SI. Sur des problématiques comme la reconnaissance d’images et de voix, les innovations de l’IA ont atteint un niveau avancé, essentiellement en laboratoire et sous forme de POC (Proof Of Concept). Cependant, ces technologies innovantes dépassent aujourd’hui rarement les phases d’exploration et de tests, et ne sont pas souvent industrialisées. En effet, moins de 13% des entreprises ont opté pour leur usage (d’après la théorie de la diffusion de l’innovation d’Everett Rogers).
Si les contraintes techniques d’analyse de données se dissipent au fur et à mesure, l’inquiétude autour de la collecte et l’utilisation des données personnelles ne fait qu’augmenter. C’est notamment le cas avec l’entrée en vigueur en mai 2018 du règlement général sur la protection des données (RGPD) mis en place pour réguler le traitement et la circulation des données personnelles, et qui cadre les usages du Big Data dans un écosystème où la volumétrie et l’accessibilité des données personnelles sont plus importantes que jamais.
RGPD et protection des données
La problématique de la protection des données est un sujet qui est présent depuis la directive relative à la protection des données de 1995. Initialement, et avant l’expansion des usages d’Internet, la typologie des données présentes sur le Web ou dans le cloud était limitée et ne concernait pas tous les aspects de la sphère privée comme c’est le cas aujourd’hui, à travers notamment des réseaux sociaux.
Facebook, par exemple, est l’une des entreprises les plus impactées par le RGPD et des plus attentives à son bilan financier depuis l’entrée en vigueur de cette réglementation. Pour l’entreprise californienne, le second trimestre de 2018 a enregistré une diminution du nombre d’utilisateurs européens, essentiellement due à l’entrée en vigueur de ce nouveau règlement en mai. Les investisseurs, quant à eux, sont de plus en plus inquiets en particulier depuis la chute de 19% de la valeur de l’action Facebook en juillet dernier, l’équivalent de 120 milliards de dollars en capitalisation boursière.
Malgré l’augmentation des utilisateurs du réseau social à l’échelle mondiale, ses dirigeants se penchent réellement sur la problématique de la sécurité des données personnelles surtout après le scandale Cambridge Analytica, où les données de 87 millions d’utilisateurs ont été détournées pour alimenter la campagne présidentielle américaine de 2016.
“Privacy by design” ou le mode opératoire du SI conforme au RGPD
Pour les entreprises dont le cœur de métier est intimement lié à la collecte de données à caractère personnel, l’une des solutions permettant de ne pas limiter l’usage des technologies du Big Data est le “privacy by design”. Cette nouvelle façon de penser le SI implique l’intégration de la problématique "Informatique et Libertés" dès les phases amont, ainsi que son maintien tout au long du cycle de vie du projet. Ce sont notamment les différents processus de gouvernance des données qui sont revisités pour adopter les six axes suivants :
Il est vrai que la protection des données personnelles est le driver majeur des changements appliqués à la gouvernance des données. Ainsi, pour continuer à intégrer les nouvelles technologies du Big Data, une réflexion s’impose dès la phase de conception pour produire des systèmes d’information à la fois conformes au RGPD et répondant aux attentes des utilisateurs finaux.