La sobriété numérique est-elle une menace pour la donnée et son exploitation ?

Face au constat de plus en plus alarmant du réchauffement climatique, la sobriété numérique est un concept apparu ces dix dernières années avec une ambition simple : promouvoir une éco-conception des produits et services numériques en réduisant l’empreinte écologique du numérique.
Les travaux et rapports publiés par the Shift Project ou GreenIT proposent des pratiques visant à diminuer des impacts environnementaux des entreprises sur l’ensemble de l’écosystème numérique : choix des équipements, usage des réseaux, gestion des consommations électriques, stockage des données…
De nombreuses études (Shift project, GeenIT) estiment qu’en 2020, la part du numérique dans la consommation mondiale d’énergie s’élève à environ 4%, avec une croissance annuelle d’environ +9%. La démocratisation des usages d’analyse de données et l’accélération des technologies Big Data et l’IA (Intelligence Artificielle) avec de puissants algorithmes de Machine Learning ne font qu’amplifier cette tendance. Cependant il est souvent très difficile d’en mesurer l’impact réel car il faut considérer l’ensemble du cycle de vie de la donnée, de son stockage à son analyse. Certaines études comme celle de l’université de Massachusetts affirment que l'entraînement de certains modèles d’IA (Intelligence Artificielle) consommerait autant que 5 voitures américaines sur tout leur cycle de de vie.
Si l’exploitation des données consomme toujours plus d’énergie c’est qu’il y a deux facteurs aggravants. Le premier est le volume, de plus en plus d’usages et d’usagers dans tous les domaines même dans des domaines que nous n'imaginions pas il y a seulement quelques mois.... Tout d’abord, il y a l’augmentation des usagers et des usages. Cela est causé par la démocratisation des technologies du numérique et l’intégration de la donnée dans les chaînes d’analyse et de décision, c’est à ce titre que la donnée est considérée comme le pétrole du XXIe siècle. Corollaire de ce premier point, il y a l’augmentation du volume de données, les organisations et les consommateurs à collecter de plus en plus de volumes (par l’IoT notamment) pour améliorer les résultats et enrichir les cas d’usage. Sur ce deuxième point, les systèmes BI traditionnels laissant la place à des technologies Big Data comme la mise en place de Data Lakes, leur besoin en stockage est bien plus conséquent. En effet, le principe étant de pouvoir gérer à la fois des données structurés (base de données et référentiels) ainsi que des données non-structurés comme des documents, des images ou des vidéos, on comprends vite que cela fait exploser le demande en infrastructure pour stocker, traiter et restituer des agrégats pertinents. De plus, la fiabilité des solutions étant aujourd'hui un critère différenciant, il n'est pas rare de concevoir un système redondant qui du même coup accélère notre empreinte écologique...
Par ailleurs, l'IA (Intelligence Artificielle) demande de plus en plus de puissance de calcul notamment lors des phases d'apprentissage des algorithmes. En effet, les techniques de Deep Learning ont longtemps été impossibles par manque de puissance de calcul et de volume de données. Or, cette limite est désormais dépassée par les possibilités offertes par les solutions Cloud et les outils associés. En même temps, la tension actuelle sur l’approvisionnement et la production de semi-conducteurs nous apporte une nouvelle contrainte matérielle : certes les composants nécessaires existent mais ils ne sont pas produits en quantité suffisante.
Pourtant si l'on fait un parallèle avec la consommation d’énergie fossile, on se rend compte que les techniques évoluent et qu'il est désormais possible de trouver de nouveaux gisements de pétrole et de gaz, de produire différemment certains carburants (exemple avec le biogaz) et d’en réduire la consommation (nos moteurs sont plus efficients qu’auparavant). Concernant l'IA et les données en général, il est évident que les métaux et les terres rares aujourd'hui très consommatrices en énergie pour leur extraction et raffinage seront demain produites via d'autres techniques moins énergivores et plus vertueuses comme le recyclage. Par ailleurs, on peut espérer que le stockage et l’exploitation de données soient plus efficients (l’ordinateur quantique entend répondre à cet espoir). On observe en effet, des rationalisations dans la production d'algorithmes : certains modèles d'apprentissage produits en open source sont déjà en open source et ne nécessitent que d’un ajustement de paramètres pour être réutilisés.
Par ailleurs, la sobriété pose toujours la même question : l’usage que je vais faire est-il nécessaire ? Pour répondre à cette question, il faut souvent consentir à faire un calcul coût bénéfice. Par exemple : certes, mon modèle d’apprentissage a consommé énormément d’énergie, mais peut être que cela en valait la peine car il permet à l'agriculteur de fertiliser ou traiter ses terres au plus juste. En évitant une surconsommation d'engrais ou de pesticides, le recours à l'IA offre, sans nul doute, un gain vis-à-vis de l’environnement. Ou encore : dans le secteur bancaire, on retrouve encore beaucoup de traitements manuels de documents papier ou numérisés, traditionnellement saisis et sauvegardés dans des applications par les gestionnaires. Or, une technologie de réseau de neurones convolutif (CNN) permet aujourd’hui de traiter un document signé par le client, s’assurer de son authenticité et l’archiver dans une application automatiquement. Les pratiques de sobriété numérique nous pousseraient à penser que ce processus devrait rester manuel pourtant on pourrait considérer que le bénéfice apporté est trop important pour s’en passer.
Face aux périls climatiques et aux pénuries potentielles de matières premières, la sobriété numérique nous invite à questionner l’exploitation de la donnée en nous faisant prendre conscience de son empreinte écologique. Cette approche est tout d’autant pertinente que l’avenir du numérique laisse entrevoir une empreinte de plus en plus lourde sur l’environnement. Nos espoirs reposent alors sur la capacité de l’écosystème numérique déjà très innovant à intégrer l'empreinte environnementale dans la conception des nouvelles technologies.
Le sujet vous intéresse ? Nos experts vous répondent

Avec la création d’un pôle spécialisé en Data/IA, mc2i se positionne comme un partenaire de confiance en Data Transfo au service de la démocratisation de la donnée et d’un usage responsable.
