Le député Eric Bothorel, qui s’était entouré de la directrice du HEALTH DATA HUB et du coordinateur national pour l’IA, a rendu, en cette fin décembre, le rapport de la mission confiée par le Premier Ministre (voir lien en annexe) en juin dernier.
Deux sujets y sont traités : la donnée publique mais aussi les codes sources des administrations et des institutions publiques dans leur degré d’ouverture libre ou sécurisée pour mise en qualité, échange, régularité, unicité, véracité, observabilité ou encore auditabilité. L’objectif est de conduire à de meilleures synergies entre services de l’état, en y associant le privé, tout en assurant une meilleure transparence des données pour les citoyens.
En relation, ce 1er janvier 2021, les données publiques de l’IGN (entre autres, topographie et relief du territoire) ont été rendues libres et gratuites.
En ce qui concerne les codes sources, l’exemple probant, repris dans ce rapport, fut la mise en ligne de l’algorithme implémentant les règles de gestion des choix des options de l’application, du site, Parcoursup qui permet de répondre au choix post-bac des élèves de terminale.
Prémices d’une démarche qui demandera motivation et perspicacité, se pose toujours l’avenir de tels rapports à l’image de celui réalisé par Cédric Villani sur l’Intelligence Artificielle il y a presque trois ans maintenant.
Ce rapport soulève bien les nécessités et dérives potentielles de telles ouvertures de la donnée. Entre nécessité pour alimenter les informations nécessaires au public et au privé (en l’occurrence les startups pour inventer de nouveaux cas d’usage), permettre une amélioration des vitesses de traitement de l’administration et le non-échange ou partage de données parfois freiné à tort certes, il y a cependant une sorte de candeur vis-à-vis d’un patrimoine matériel et immatériel de notre nation qui risque directement ou indirectement de profiter à des acteurs non français. Il ne faudrait pas que l’état finance une mise en qualité et une ouverture pour que la suite soit majoritairement un profit tiers, d’organes étrangers ou même privés français menacés de rachats en cas de succès …
L’enjeu mondial est donc que nos données personnelles ou moins sensibles soit hébergées, traitées, exploitées par des tiers, à court ou moyen termes une fois qu’elles auront été façonnées à nos frais, puis confiées pour qu’au final elles nous soient revendues sous formes de services avec application d’une double peine pour notre administration, nos chercheurs, nos entrepreneurs, notre souveraineté …
Si la destination de ces traitements est louable avec, par exemple, l’amélioration de diagnostics, la prévention médicale, de façon anonymisée ou identifiée, de meilleures traçabilités des remboursements ou de paiements d’aides sociales, il y a potentiellement des dérives sécuritaires et des déviances dans l’utilisation de ces données pour tracer et ficher les individus. Des dites “bonnes causes” comme la transition écologique peuvent devenir des outils terroristes sur l’individu (analyse de la consommation électrique ou d’eau, bilan carbone individuel de ses déplacements quotidiens ou annuels, surfacturation de pratiques non essentielles …).
Qui doit héberger et opérer sur ces données ? Est-ce un accélérateur à la mondialisation des services ? Les sujets à cautions sont connus : télémédecine et diagnostics radiographiques ou des scanners en Inde et par de l’IA des GAFAMI, formations des étudiants à la carte par des universités étrangères, propositions de produits par connaissance intime de l’état (cas du handicap) des goûts et besoins par le biais de la connaissance des individus croisée avec la data des réseaux sociaux …
Le risque est de financer, de construire cette démarche pour mieux rendre vendables et collectables par des tiers, nos données privées, celles manquantes justement. Le sujet est louable, brillant et motivant mais il faut raison garder des risques et dérives néfastes pour ce qui reste du statut de puissance de notre nation, tant menacée et en chute mondiale. Ce sujet risque d’être une porte dérobée, une brèche pour le vol du patrimoine que représente la connaissance de nos concitoyens.
DEBOUT LA FRANCE retient ou propose donc que :
- – la data est bien l’or du XXIème siècle (ce sont des “Actifs Numériques Essentiels”) mais que cette donnée est souveraine de l’individu vu comme citoyen d’un état protecteur de ces données,
- – notre pays a certes besoin de plus d’ouverture et de connaissance de ce sujet pour le dominer, s’en protéger, le contrôler, le dompter pour notre avantage national,
- – La CADA doit, en effet, être renforcée comme la CNIL (voir son rôle confirmé par le Conseil d’Etat vis-à-vis du Heath Data Hub, voir le lien en annexe) et l’ANSSI qui seront bien parties prenantes dans le fait de motiver les différentes administrations dans la collecte et l’identification des données et des codes partageables,
- – cette data est monétisable et enviée, lorgnée par des acteurs surpuissants extraterritoriaux,
- – sur les 37 recommandations, soulève que la recommandation 27 (création de « hubs ») ne soit pas un moyen détourné et à vocation à lancer des appels d’offres faisant partir l’exploitation et les services associés à des offres extra-françaises (secteur médical et agricole évoqués, moyens de transport et infrastructures routières, aériennes, …)
- – l’agrégation des données publiques / privées, évoquée dans ce rapport, est en effet capitale, que les spécificités françaises peuvent être regardées mais sans perte de prérogatives vis-à-vis, à terme, d’un établissement central de l’UE (dénaturation de l’INSEE pouvant devenir une simple succursale d’une agence fédérale …)
- – la captation des données adéquates est aussi un outil de mesure des efficacités ou défauts des politiques publiques,
- – la coopération entre services de l’état doit être certes améliorée pour empêcher les rétentions ou la duplication de données pour simplifier les freins existants, d’accès aux données pour nos chercheurs notamment,
- – la ségrégation et la segmentation de ces données collectées soient accompagnées d’une étude des transformations de la société pour préparer notre avenir : métiers de demain, impact des données sur les services gratuits ou monétisés et sur la souveraineté des services possibles derrières (médecine de ville de demain condamnée, quid des universités, quid de la dépendance des commerces de proximité des plateformes d’intermédiation / places de marchés des places de marchés comme Amazon ou Google Shopping),
- – nos états doivent devenir des “Country As A Service” (modèle estonien) pour améliorer l’administration publique, le traitement de la vie quotidienne à condition de ne pas nous rendre dépendant de sous-traitance étrangère qui ne ferait qu’aggraver le ratio de paiement de services du citoyen entre services français et extranationaux souvent avantagé de façon déloyale et non-compétitive par l’hébergement de ces acteurs dans les paradis fiscaux européens (Irlande, Luxembourg, Pays Bas, …),
- – la recommandation 34 (réquisition de données privées pour motifs impérieux et d’urgence …) devra être extrêmement bordée (réquisition des données individualisées d’un opérateur télécom par exemple …)
- – la recommandation 37 du rôle de l’état comme facilitateur d’échange entre acteurs privés (rajout de dernière minute ?) est sensible.
- – Il y a risques à fragiliser nos organismes sur la vente de données (IGN, SHOM, Météo France, exemples donnés dans le rapport) face à des démarches mondiales, que ces organismes ne deviennent pas seulement des collecteurs de données pour que la valorisation soit faite par un acteur tiers, ce qui aboutirait en quelques années à leur disparition bien évidemment.
- – la distance à avoir vis-à-vis des classements internationaux (souvent argumentation pour lancer ce type d’action de refonte) est parfois nécessaire, leur objectif et leurs intérêts globaux étants flous : classement OCDE dont PISA, classement Shangaï des universités qui forcent à des choix courts-termistes plus délétères qu’efficaces quand ces classements cachent des points positifs ou des spécificités non valorisées pour ne faire qu’apparaître leurs critères négatifs …
- – l’ontologie des données, y compris celle construite de façon européenne ou mondiale soit bilingue (multilingue), avec une traduction systématique des termes pour stockage en français en nos systèmes et en plus, en anglais le cas échéant.
Le rapport BOTHOREL pose, dans sa synthèse introductive, que : ” …, la France peut aussi revoir plus fondamentalement les principes de son droit et maintenir son rang de patrie d’audace et d’innovation”. Que cela est bien dit mais avec tant de candeur ou de soumission consciente ou pas d’ailleurs… Alors que les travaux européens (Data Gouvernance Act et Digital Services Act en particulier) s’accélèrent, que ce nième sujet présenté comme national ne soit pas une aggravation du démontage total de la nation française pour son phagocytage par l’Union Européenne, processus assez irrémédiable en l’état actuel.
Le Néolibéralisme a besoin de limites et pas d’autoroutes pour débrider le peu de patrimoine matériel et immatériel qu’il nous reste.
Lionel Mazurié
Délégué National au Numérique
ANNEXES
Le rapport BOTHOREL :
https://www.mission-open-data.fr/uploads/decidim/attachment/file/36/Mission_Bothorel_Rapport.pdf
Garanties demandées au HEALTH DATA HUB par le Conseil d’Etat :
https://www.cnil.fr/fr/le-conseil-detat-demande-au-health-data-hub-des-garanties-supplementaires
Notre article sur le HEALTH DATA HUB :
https://www.debout-la-france.fr/actualite/le-health-data-hub-la-plateforme-des-donnees-de-sante-francaise-hebergee-chez-microsof