La Direction générale du trésor vient de publier une note déprimante mais réaliste sur les capacités de la France, et plus largement de l’Europe, à se tailler une place dans le secteur de l’intelligence artificielle, dominé par les GAFAMS. Cette note a fait l’objet de critiques de la part du monde de la culture car elle suggère, de manière peu argumentée, de minimiser l’obligation de transparence des données d’entraînement des IA génératives qui vient d’être adoptée au niveau européen.
La Direction générale du trésor du Ministère de l’économie a publié une note intitulée « la chaîne de valeur de l’intelligence artificielle : les enjeux économiques et la place de la France ». Loin des grandes déclarations et des discours de France 2030, la note présente une photographie froide, et pour tout dire presque désespérante de la place de la France, et plus largement de l’Europe, dans ce secteur d’avenir. Pour schématiser d’un trait, la conclusion que l’on peut tirer de la note est que la France et l’Europe seront utilisatrices d’IA, mais probablement pas actrices du secteur, et encore moins bénéficiaires des retombées économiques de l’IA, sauf peut-être dans les modèles spécialisés. Certes, les entreprises peuvent espérer augmenter leur productivité en tant qu’utilisatrices, c’est déjà ça. Bref, nous sommes ici à la Direction du Trésor, un organe sérieux, et le réalisme est de mise, pas la communication politique. Et ce réalisme, que l’on pourrait rapprocher des constats du rapport Draghi, est le bienvenu, car en effet comment construire sans avoir fait une étude honnête du terrain ? Là où le bât blesse, c’est que la note formule très peu de recommandations, et que sa seule recommandation d’envergure – limiter l’obligation de transparence des IA mise en place par l’IA Act – montre qu’une fois encore, la culture est la variable d’ajustement de Bercy. Or on voit mal comment réviser les droits des auteurs et interprètes à la baisse pourrait permettre à la France de se tailler une place dans l’IA.
Train de l’investissement
Sur les constats de marché, les trois auteurs de la note relèvent que la chaîne de valeur de l’IA se divise en trois parties, et que la France ne peut prétendre aujourd’hui qu’à une part substantielle de la dernière. La première est composée des intrants aux systèmes d’IA, soit la puissance de calcul, les données et la main d’œuvre qualifiée. Les auteurs soulignent que concernant ces intrants « la France ne dispose pas d’acteurs d’envergure comparable aux leaders mondiaux sur les marchés de la fabrication de puces et la location de capacités de calcul » mais qu’elle « bénéficie toutefois d’une main d’œuvre qualifiée et du dynamisme de son système d’innovation. » La seconde partie du secteur est le développement de modèles. Là, la note déclare que « quelques acteurs français émergent, mais ce segment est dominé par les grands acteurs du numérique, qui préexistaient à l’arrivée de cette technologie ». Cela n’est pas sans rappeler le constat de la Cour des Comptes européenne, dont nous avions parlé la semaine dernière, selon lequel le fait pour l’Europe d’avoir raté le train de l’investissement dans les plateformes aboutit à l’absence sur le vieux continent de sociétés à même de financer les innovations suivantes, dont l’IA. La note du Trésor parle ici de « quelques acteurs », mais constate ensuite que « le développement des modèles de fondation d’IA est directement ou indirectement dominé par les grandes entreprises du numérique de la Silicon Valley, même si la France dispose d’une start-up (Mistral AI) ». A noter, Mistral développe des modèles de qualité, et est parvenue à obtenir une valorisation louable de 6 milliards d’euros, et un accord avec Microsoft, mais reste un nain économique à côté de ses congénères. Selon Sifted, les revenus 2024 de Mistral avoisineront 30 millions d’euros. On est loin des 3,7 milliards d’Open AI.
82% se financent hors d’Europe
La note souligne ensuite que les capacités d’investissement en Europe étant plus que limitées, les capacités de développement des modèles français qui émergeraient ne seraient pas suffisantes. « Si l’écosystème de capital-risque français et européen contribue de façon importante à ces levées de fonds, et semble performant pour les start ups en amorçage, la disponibilité de fonds français et européens reste limitée pour les levées de fonds supérieures à 50 ou 100M€ qui sont en général nécessaires pour accélérer le passage à l’échelle internationale », écrivent les auteurs, qui ajoutent que 82% des scale ups européennes, entre 2013 et 2023, avaient un investisseur principal situé en dehors de l’UE. L’Europe a donc les talents individuels, mais les bénéfices économiques qui découlent des innovations de ces talents vont souvent à l’étranger faute de soutien.
« Pas un acteur majeur du calcul »
De même, pour la capacité de calcul : la France dispose des talents – informaticiens, ingénieurs, mathématiciens – mais « n’est pas pas aujourd’hui un acteur majeur du calcul », selon la note. La raison en est connue : le marché des GPU est trusté par Nvidia (85%) et AMD (10%). Le marché de la location des infrastructures de calcul est également le terrain de jeu des grands acteurs américains, « face auxquels les acteurs français existants jouent un rôle marginal. » La note souligne cependant que « Scaleway a annoncé des investissements dans les infrastructures de calcul pour l’IA et une partenariat avec Nvidia pour office des services pour l’entraînement de modèles d’IA. » Pour le reste « les autres acteurs français se positionnent sur l’inférence, i.e. le déploiement et l’utilisation d’un modèle une fois qu’il a déjà été entrainé. »
Données
Après ce constat que le marché est la plaine de jeu des GAFAMs, on en arrive ensuite à la thématique des données qui nourrissent les IA. Et, là aussi, les GAFAMs sont en position de force, puisque, comme le dit la note, « les acteurs disposant de données propres sont avantagés dans le développement de modèles de fondation ou d’applications. C’est le cas des grandes entreprises, telles que Google, Apple, Facebook, Amazon ou Microsoft (les GAFAM), qui disposent à la fois d’un accès privilégié à de larges volumes de données via les contenus qu’ils hébergent (YouTube offre par exemple à Google une source majeure de données d’entraînement pour les modèles d’IA) ou via les données associées à l’utilisation de leurs services. » Il n’y a rien à redire sur ce constat, qui est réaliste, même si l’on pourrait souligner qu’il y a à l’heure actuelle des litiges sur la légalité de l’utilisation de certaines de ces données – telles que les oeuvres protégées par le droit d’auteur – par ces sociétés pour entraîner leurs outils d’IA. La note n’en parle pas.
Droit d’auteur : un obstacle
Pour permettre aux acteurs – quasiment inexistants, donc – européens d’avoir accès à des données de qualité, tout comme les GAFAMs, la note suggère le déploiement de bases de données publiques. Mais elle parle également de l’accès à ce qu’elle appelle les « données culturelles », ce par quoi on comprend qu’il s’agit des données protégées par le droit d’auteur. La solution que la note propose à cet effet a fait bondir plus d’un représentant de la culture. Les auteurs de la note affirment tout d’abord que « négocier individuellement avec chaque propriétaire de données ou ayant-droit peut constituer un coût important pour les producteurs d’IA ». Puis elle relève que « l’IA Act européen voté en février 2024 prévoit une obligation de transparence s’agissant des sources d’entraînement des systèmes d’IA. Comme les données constituent un élément de différenciation important pour les fournisseurs de systèmes d’IA, cette transparence est susceptible de nuire à leur développement. » On pourrait leur rétorquer que l’obligation de transparence n’est pas encore applicable et que pourtant, aucun modèle d’IA européen d’envergure commerciale n’est arrivé sur le marché … Il ne semble donc pas qu’il y ait là un frein substantiel. La note conclut que la mise en oeuvre de l’obligation de transparence « devra trouver un équilibre. » La Ministre de la culture elle-même n’a pas apprécié cette suggestion de minimiser les droits d’auteur. Parlant de la note du Trésor sur son compte X, elle a écrit : « ceux qui opposent la transparence et le développement de l’IA n’ont rien compris. C’est au contraire en garantissant les droits des créateurs que nous offrirons aux IA l’accès à des contenus authentiques, qui sont la clé pour se différencier. »