TRIBUNE : Pourquoi l’IA/ML mise sur l’ouverture

Le 09/11/2023

L’Open Source s’est solidement implanté au cœur de l’IA/ML, touchant tout ou presque, du code aux architectures, en passant par les données et parfois même les modèles. Cette ouverture, plus qu’une simple tendance, est devenue un pilier pour les avancées du domaine. Autrement dit, il existe un effet d’entraînement, l’ouverture appelle davantage d’ouverture en IA/ML.

Plusieurs raisons expliquent cette dynamique. D’abord, l’origine même de la révolution actuelle en IA réside dans la recherche académique, qu’elle soit soutenue par des fonds publics ou privés. C’est dans ces enceintes que les réseaux de neurones ont connu leur renaissance, propulsée par une combinaison de théories novatrices, la persévérance de chercheurs dévoués, la réduction des coûts de calcul et la disponibilité croissante des données.

La publication scientifique est souvent l’étincelle de chaque innovation. Mais, puisque le ML repose largement sur la statistique, reproduire et valider des résultats est un défi. Pour pallier cela, l’ouverture du code devient indispensable. L’émergence du code issu de laboratoires de recherche et des géants comme les GAFAs sur des plateformes comme Github, et plus récemment Huggingface, illustre cette transition.

Publier du code ouvert offre de multiples avantages. Pour les laboratoires, cela renforce leur notoriété. Pour les entreprises, c’est un outil de recrutement puissant. En effet, une publication accompagnée d’un code efficace accroît la visibilité, attire une plus grande communauté, simplifie l’orientation des recherches, facilite le recrutement, et attire davantage de financements. L’Open Source devient un moteur accélérant la recherche et le développement, consolidant par la même occasion les infrastructures de production.

Si le code et les architectures sont ouverts, qu’en est-il des données et des modèles pré-entraînés? Si les licences de données sont bien établies, celles des modèles demeurent en terrain plus vague. Un modèle peut être vu comme une réinterprétation des données, donc potentiellement sous la même licence. Toutefois, la création de certains modèles peut être onéreuse, positionnant ces derniers comme des éléments stratégiques sur le marché, surtout dans le cas des LLMs. Cependant, le ML vise également à répondre à des besoins spécifiques, ce qui favorise l’apparition de modèles spécialisés, souvent basés sur des modèles fondationnels génériques ouverts.

L’Open Source a revigoré l’IA/ML, remplaçant d’anciennes méthodes. Cette transformation n’est pas sans conséquences. Les chercheurs font face à une compétition intense, avec des avancées rapides, rendant la spécialisation ardue. Il est donc essentiel d’accompagner la nouvelle génération de chercheurs. Quant aux ingénieurs, rester à jour exige une passion et une curiosité sans cesse renouvelées, parfois en dehors des heures et lieux de travail. Les entreprises, quant à elles, rencontrent des défis en termes de recrutement, de qualité de code et de ressources, de calcul notamment.

En conclusion, l’IA/ML se tourne résolument vers l’Open Source par nécessité, et c’est une évolution positive. Cette approche bouleverse les conventions, amplifie les possibilités et accélère la recherche, tout en incitant à davantage d’ouverture. C’est un cercle vertueux qu’il faut nourrir, tout en accompagnant ses acteurs. Car, indubitablement, l’avenir de l’IA est Open Source.

Une tribune proposée par

Emmanuel BENAZERA – CEO – JOLIBRAIN

« Précédent Suivant »

TRIBUNE : Pourquoi l’IA/ML mise sur l’ouverture

SPONSORS 2026

Premium Sponsors

Gold Sponsors

Silver Sponsors