Retour aux articles

Stratégie française en matière d’intelligence artificielle : de l’urgence d’améliorer l’accès aux données

Tech&droit - Intelligence artificielle
21/02/2019
Au cours de la 1re édition de l’AI France summit, organisée le 19 février, à Bercy, par la Direction générale des entreprises, le Commissariat général à l'égalité des territoires (CGET) et Tech’IN France, a été rendue publique l’étude Pipame « Intelligence artificielle – État de l’art et perspectives pour la France », réalisée par le cabinet Atawao. Le point sur les recommandations de ce rapport.
Un constat, tout d'abord : la France est le 2e acteur au sein de l’Union européenne en matière d’intelligence artificielle, derrière le Royaume-Uni, et loin derrière les USA et la Chine. Avec un fort tropisme parisien : Paris localise en effet les deux tiers des start-ups IA (73 sur 109), mais se situe loin derrière Londres, qui en compte plus de 200.
 
Autre élément important, l’Europe et la France en particulier, accusent un retard manifeste sur l’utilisation de grandes infrastructures de calcul. Le rapport révèle ainsi que, pour faire une analogie avec la géographie, les États-Unis, l’Europe ou la Chine représentent chacun autour de 7 % de la superficie du globe. Or, « en géographie numérique représentée par les centres de données hyperscales, sur 400 infrastructures de ce type dans le monde, 44 % sont aux États-Unis, 20 % en Europe, 8 % en Chine et moins de 1 % en France. Les États-Unis numériques représentent plus de six fois leur taille géographique réelle ». Et pour répondre aux besoins d’entraînement de très grands réseaux de neurones, le rapport recommande la création d’une infrastructure de data science hyperscale souveraine, capable d’adresser tous les problèmes d’IA : « Le projet ne vise pas à créer une nouvelle infrastructure de données, mais à s’appuyer sur des initiatives et moyens déjà largement disponibles. Concrètement, le projet pourrait reposer sur un partenariat entre la structure de TERALAB et l’infrastructure de la société OVH, chacun disposant des expertises complémentaires nécessaires ».
 
Pour tenter de gagner des places dans ce classement, l’heure est désormais à la déclinaison du volet économique du rapport Villani (v. Les grands axes du rapport de Cédric Villani sur l’intelligence artificielle, Actualités du droit, 29 mars 2018). L’objectif : passer de la réflexion aux actions concrètes. Cette étude va donc être une source d’inspiration, destinée à enrichir la stratégie nationale pour le développement de l’IA (pour laquelle 1,5 milliard d’euros seront consacrés sur l’ensemble du quinquennat).
 
Quatre secteurs prioritaires
Même approche que dans le rapport Villani : la détermination de secteurs dans lesquels les efforts doivent être portés en priorité.
 
Ce rapport propose ainsi un classement et une analyse des 14 secteurs économiques français potentiellement les plus impactés par l’IA (administrations publiques, services financiers, agriculture, services juridiques, sécurité des biens et des personnes, commerce de détail, professions libérales et services professionnels, télécommunications, loisirs et médias, santé, industrie, transport et mobilité ainsi qu’énergie et environnement).
 
Parmi ces 14 secteurs, quatre particulièrement touchés par l’IA ont été plus précisément étudiés :
  • Le secteur de la santé : c’est l’un des plus dynamiques en matière d’IA, notamment dans le domaine de la médecine préventive ou du diagnostic médical : l’étude recommande de créer des zones d’expérimentation à l’échelle d’un hôpital ou d’un réseau de soins, et met l’accent sur la nécessité d’accéder à d’importants volumes de données de qualité pour permettre l’innovation ; sur ce point, le gouvernement a déjà lancé le Health Data Hub en octobre 2018, dispositif unique de partage entre producteurs et utilisateurs de données de santé ; l’objectif : faire de la France un des leaders mondiaux des données de santé ; 
  • Le secteur de la mobilité : avec notamment, la conduite autonome ; plusieurs freins à son développement ont été identifiés et doivent être levés rapidement : par exemple, la création de zones d’expérimentation à l’échelle d’une ville ou d’une situation de transport à risque telle qu’une autoroute ou une zone montagneuse ; 
  • Les secteurs de l’énergie et de l’environnement : les effets de l’IA y ont déjà été constatés, à travers le pilotage des réseaux électriques intelligents, les stratégies d’efficacité énergétique ou encore l’anticipation des chocs liés au changement climatique ; la France dispose de nombreux atouts grâce à la présence sur son territoire de groupes d’ampleur mondiale et de PME et start-ups innovantes dans ce domaine. Il s’agit à présent de stimuler la production de données environnementales chez les industriels ; 
  • Le secteur industriel : le potentiel d’applications de l’IA, variable selon le type d’industrie, peut offrir un fort potentiel à des start-ups ou des PME françaises, par exemple dans le contrôle qualité ou la maintenance prédictive. 
Dans ces quatre secteurs (et celui de la sécurité des personnes et des biens), pour le rapport, la France a encore son épingle à tirer du jeu et peut légitimement développer une stratégie de leadership mondial. Et ce d’autant que, comme le souligne Mustapha Derras, directeur exécutif R&D, Berger-Levrault, si les GAFA sont efficaces sur les sujets grand public grâce à nos données du quotidien, c'est bien sûr les applications professionnelles et/ou très pointues que nous devons parier en France et en Europe.
 
De grands progrès à faire pour améliorer l’accès aux données
712. C’est le nombre d’occurrence du mot « donnée » au sein de ce rapport. Un chiffre plus que révélateur. Quels que soient les secteurs, le problème d’accès à cette donnée est identifié depuis longtemps (silot, données non structurées, chinese wall données publiques/privées, etc.). Or, c’est bien connu, « l’accès à des données massives, corrélées, complètes, qualifiées, historisées, est une clé technologique majeure de mise au point de technologies d’intelligence artificielle aujourd’hui », souligne ainsi le rapport. Et, « sans volonté publique ou privée majeure pour lever l’ensemble des restrictions ou complications d’accès à ces données (pendant toute la phase expérimentale), aucune technologie d’intelligence artificielle ne sera développée durablement en France ».
 
Une donnée qui, en France, est excellemment protégée par rapport aux autres pays dans le monde grâce au RGPD. Mais l’accès à ces données est parfois beaucoup trop long.
 
Pourquoi ces données sont-elles essentielles ? Comme l’indique le rapport, en matière d’intelligence artificielle, les technologies algorithmiques sont très largement "open source". Pour l’ensemble des secteurs économiques, « l’accès à des données métier de qualité (images, texte ou données numériques) est (donc) le principal facteur d’accélération ou de limitation des innovations ».
 
Une étude qui suggère de distinguer le besoin de données à des fins d’expérimentation/innovation, de l’usage qui pourrait en être fait après la commercialisation d’un produit ou d’un service. Faute de quoi, le fossé continuera à se creuser.
 
Accès aux données : les suggestions du rapport
– les données existantes dans le domaine de la santé, par exemple, doivent être accessibles à des fins d’expérimentation de manière beaucoup plus simple et rapide qu’aujourd’hui (c’est-à-dire en quelques jours) ;
– pour les données manquantes, l’État doit encourager la création de bases de références sectorielles (transport, industrie, énergie par exemple) pour les mettre à disposition des acteurs innovants et pour pouvoir comparer la performance des algorithmes d’intelligence artificielle entre eux.
 
Un enjeu mis également en exergue par Emmanuel Bacry, directeur de recherche au CNRS, attaché à l’université Paris-Dauphine et responsable de l’Initiative Data Science de l’École polytechnique, pour qui, « on parle du risque d'ouverture des données, mais on ne parle jamais du risque de la non-ouverture des données. Il y a un vrai risque » et par Fabrice de Salaberry, directeur général de Sinequa, qui relève que « les travailleurs de la donnée passent jusqu'à 70 % de leur temps à trouver la donnée ».
 
Mais souvent, avant même de se poser la question de quand/comment ouvrir l’accès à ces données, manque déjà l’étape préalable : la génération de celles-ci : « dans une ville, on n’imagine pas la quantité de données non produites. On va devoir numériser tout cela à un moment donné », remarque Mustapha Derras.
 
Des données qui soulèvent aussi la question d’une éventuelle rétribution. Les données de santé, par exemple, sont pseudonymisées avant tout traitement algorithmique (et non anonymisées). Ce sont des attributs de la personne, qui en tant que telles ne sont pas cessibles. Pourtant, certaines start-ups rémunèrent l’accès à ces données.
 
Synthèse des recommandations
Cette étude propose de :
  • privilégier une approche sectorielle ;
  • d’accentuer rapidement l’effort de formation des entreprises ;
  • de développer les expérimentations ;
  • de réfléchir à la transformation complète de l’organisation du travail.
 
Pour cela, le rapport formule plusieurs recommandations destinées à :
  • favoriser la création de jeux massifs de données et faciliter l’accès à ces données aux acteurs économiques ;
  • et soutenir le développement d’expertises nationales en IA.
 
Voici quelques-unes de ces recommandations :
  • créer un cadre légal d’expérimentation à partir de données afin de faciliter l’accès en temps et en procédure ;
  • créer des zones d’expérimentation à grande échelle pour tester en « grandeur nature » des solutions innovantes basées sur l’IA : un hôpital pour les solutions en santé, une ville pour les solutions de mobilité, un quartier pour les solutions de gestion de l’énergie ;
  • créer un marché protégé pour les startups afin de favoriser l’émergence de sociétés viables économiquement ;
  • encourager des projets centrés sur les assistants intelligents, dans le but de proposer une solution de facilitation des besoins quotidiens du grand public.
 
Pour aller plus loin
– le point sur les stratégies des autres États en matière d’IA : v. l'étude comparative internationale de la DGTrésor : https://www.tresor.economie.gouv.fr/Articles/2018/03/28/etude-comparative-internationale-sur-les-strategie-nationales-en-matiere-d-intelligence-artificielle …
– pour une synthèse des acteurs français en matière d’intelligence artificielle, v. http://www.francedigitale.org/franceisai
Source : Actualités du droit