La Blockchain et le Big Data pour une nouvelle révolution
Pour de nombreux spécialistes, la Blockchain est l’outil qui révolutionnera bientôt le numérique. Les gouvernements et les grandes entreprises, notamment du secteur Banque ou Assurance, y voient déjà le moyen de modifier en profondeur leur organisation et de sécuriser leurs transactions de façon optimale.
Si pour certains domaines, l’application de cette technologie parait comme une évidence, il l’en est un peu moins pour d’autres, c’est le cas notamment du Big Data.
Comment la Blockchain adresse-t-elle les problématiques du Big Data ?
Les GAFA (Google, Apple, Facebook et Amazon) ont été les précurseurs dans la création et l’utilisation d’outils innovants permettant la gestion de fortes volumétries de données. Des projets Open-sources ont suivis et ont permis le développement d’outils de traitement des données en temps réel.
Cependant les pratiques liées aux traitements des données par les outils de Big Data soulèvent de nombreuses interrogations, comme par exemple :
- Qui est propriétaire des données utilisateurs ?
- Comment les « utilisateurs client » peuvent savoir dans quel but et de quelle manière leurs données vont être utilisées ?
- Qui peut y avoir accès ?
- Les données sont-elles anonymes ou au contraire nominatives ?
Ces problématiques peuvent être mises en lumière lorsque nous installons une application sur nos smartphones, et les récents scandales l’illustrent bien, notamment avec des applications telles que Pokemon Go qui, au début, possédait un accès total à l’ensemble des déplacements de ses utilisateurs et de leurs comptes Google associés.
La technologie Blockchain est à même d’apporter une réponse à ces questions, et de replacer « l’utilisateur client » au centre du système. Prenons l’exemple du Bitcoin et de la circulation des informations sur sa Blockchain.
Bitcoin utilise les propriétés de la cryptographie asymétrique afin de permettre à n’importe quel utilisateur de crypter une transaction via une clé publique, et d’en décrypter une autre qui lui est adressée via sa clé privée. Cette technique permet ainsi la protection et l’anonymat des données des utilisateurs.
Avec le développement de nouveaux usages pour les Blockchains, les utilisateurs reprennent de plus en plus le pouvoir sur leurs données d’utilisation et de comportement. En effet, il devient aujourd’hui possible pour les utilisateurs de choisir les informations qu’ils acceptent de dévoiler.
Par conséquent, nous pouvons imaginer le développement de projets de type « Machine Learning » permettant une réelle évolution du modèle Big Data tout en garantissant la protection des données personnelles des utilisateurs. Par exemple, les données finales résultant de ces études pourront être anonymisées et ainsi cibler des « profils type » plus que des personnes.
Ceci ouvrirait la porte à un nouveau modèle d’infrastructure : un stockage décentralisé garantissant l’immuabilité des données via la Blockchain et un traitement distribué des données via les outils de l’écosystème Big Data.
Comment lier Blockchain et architecture Big Data ?
Les points majeurs qui ralentissent actuellement le développement des Blockchains au niveau des entreprises sont la performance et la scalabilité de la technologie : nombre de transactions par seconde limité, latence d’une opération d’écriture, copie intégrale de la Blockchain, et mise à jour en temps réel sur chaque nœud.
Ces performances sont bien en dessous de celles des bases de données NoSQL modernes, qui, elles, peuvent excéder plusieurs centaines de milliers de transactions par seconde, et offrir des stockages de plusieurs pétabytes avec une latence de l’ordre d’une fraction de seconde.
C’est sur ce constat que le projet BigchainDB a mis en place une base de données distribuée et scalable, autrement dit une base de données capable d’adapter la puissance nécessaire en fonction du besoin. Pour y parvenir, elle utilise la Base de données MongoDB (première base de données en NoSQL) à laquelle s’ajoute une couche technologique supplémentaire, celle de la Blockchain. Cela permet ainsi de bénéficier de ses avantages tels que le contrôle décentralisé, le transfert d’actifs digitaux et la garantie de disposer de données sécurisées.
Mais alors, comment la Blockchain peut-elle modifier en profondeur l’usage d’une base de données de type « Big Data » ?
A l’inverse d’une base de données classique de grande envergure, il n’est plus besoin de se demander si l’information partagée est à jour, si elle a été retraitée, et par qui. Que ce soit pour une société ayant des bureaux à travers le monde, ou une entreprise partageant des données avec d’autres entreprises, la Blockchain permettra à tous les utilisateurs de disposer d’un même niveau de contrôle sur leurs données (via un contrôle et un accès décentralisés), de tracer chaque transaction/information, chaque traitement effectué, et enfin d’identifier l’acteur concerné.
Au travers ce nouveau cas d’utilisation, la Blockchain illustre une fois de plus son potentiel d’application et les gains importants qu’elle permettrait de réaliser.