Guide du débutant en Machine Learning [interview d'expert]

MACHINE LEARNING OU APPRENTISSAGE AUTOMATIQUE : ENTRETIEN AVEC UN EXPERT INDÉPENDANT EN INTELLIGENCE ARTIFICIELLE

Le machine learning (apprentissage automatique), deep learning (l’apprentissage en profondeur), l’intelligence artificielle … tout le monde semble en parler, mais en quoi consiste réellement l’apprentissage automatique et quelle valeur apporte-t-il? Nous avons demandé à un expert indépendant en intelligence artificielle et en apprentissage automatique de nous aider à mieux comprendre ce sujet complexe. Jonathan Prom Scharff travaille actuellement sur son propre projet dans le but de réduire la consommation d’énergie nationale en exploitant les derniers développements en matière d’apprentissage automatique. En tant que consultant en machine learning, Jonathan peut également être engagé pour des projets d’apprentissage machine dans d’autres secteurs.

1. Comment les entreprises exploitent-elles l’apprentissage automatique à des fins commerciales et quelle est la vitesse de développement dans ce domaine?

Telle est la question standard que les gens aiment aborder lors de conférences professionnelles. En règle générale, cette diapositive est suivie d’une diapositive disant «L’IA est la nouvelle électricité» et probablement de citations d’un rapport de McKinsey indiquant qu’un pourcentage énorme d’emplois sera automatisé dans les années à venir. L’orateur regardera probablement le public avec gravité et prononcera les mots redoutés : «Si vous n’agissez pas maintenant, c’est une question de temps avant que vous ne soyez dérangé». Même s’il s’agit probablement d’une bonne tactique de vente – il n’y a rien de tel que la peur pour convaincre les gens -, d’après mon expérience personnelle, la réalité quotidienne est bien différente. Oui, Google, Facebook et autres déploient des solutions d’apprentissage automatique à grande échelle. Et, effectivement, de nombreux emplois seront indéniablement automatisés, mais, selon mon expérience, la plupart des grandes entreprises utilisent l’apprentissage automatique à un degré étonnamment limité. Dans les cas où une solution d’apprentissage automatique est utilisée, elle est généralement extrêmement simple ou extrêmement complexe et ne fonctionnant pas très bien. Ces deux extrêmes ont tendance à ne pas très bien fonctionner. Le premier pour des raisons évidentes et le second, parce que faire fonctionner une solution d’apprentissage automatique n’est généralement pas un exercice théorique. Il s’agit vraiment d’obtenir les bonnes données, de reformuler le problème pour qu’il s’intègre dans la boîte à outils standard d’apprentissage automatique, puis d’utiliser les outils standard. Donc, pour résumer, l’apprentissage automatique aura probablement un impact considérable sur de nombreux secteurs, mais, à quelques exceptions près, les choses ne vont pas aussi vite. Même si une start-up avait tout compris, en ce qui concerne l’apprentissage automatique, elle n’aurait généralement pas accès aux données nécessaires au fonctionnement des algorithmes d’apprentissage.

2. Où le Machine Learning génère-t-il déjà de la valeur?

Pour déterminer s’il est judicieux d’utiliser l’apprentissage automatique pour automatiser une tâche donnée, il faut déterminer si le problème peut être décomposé en “boîtes bien définies”. Supposons que vous souhaitiez automatiser le processus de détermination de l’opportunité de fournir une assurance à une personne. Cela pourrait être transformé en un problème bien défini en disant « compte tenu de ces points de données, prédisez le numéro 1 si la personne doit obtenir une assurance et le numéro 0 si la personne ne doit pas obtenir une assurance ». Une telle description du problème rendrait probable le succès d’une solution d’apprentissage automatique. Si, en revanche, le problème était formulé de la manière suivante : « compte tenu de ces données, rédigez un contrat d’assurance », il serait alors presque impossible d’automatiser le processus à l’aide de l’apprentissage automatique.

D’après mon expérience, on peut souvent transformer un problème très difficile en un problème bien défini en le divisant en plusieurs sous-problèmes et en compromettant un peu.

Ainsi, au lieu de formuler le problème comme suit: «rédigez un contrat d’assurance», on pourrait dire que le premier sous-problème est «prédire, lequel de ces 7 contrats types serait le bon à utiliser». Les sous-problèmes suivants pourraient alors consister à prévoir les nombres appropriés à certains endroits pré-spécifiés dans le contrat type choisi.

De cette manière, en divisant un problème complexe en sous-problèmes quelque peu standardisés, on peut automatiser de grandes quantités de travail en utilisant l’apprentissage automatique.

La chose importante à considérer est de savoir si la tâche que vous souhaitez automatiser peut-être transformée en une prédiction bien définie. Ainsi, « lequel de ces sept contrats types possibles est le bon contrat ?», « Quel devrait être le prix pour assurer cette situation particulière ?», Etc.

Je pense qu’un autre point important est de ne pas essayer d’automatiser une trop grande partie du flux de travail. Vous vous retrouverez souvent dans une situation où vous pouvez automatiser 70/80% du flux de travail assez rapidement et au lieu d’essayer de supprimer complètement l’humain de l’équation mieux vaut vous arrêter à 70/80% de l’automatisation. Couvrir les derniers 30/20% est généralement très coûteux et souvent sujet aux erreurs.

3. Pouvez-vous expliquer le Machine Learning avec un exemple précis ?

Très bien, imaginez que vous êtes un juge et que vous envisagez d’automatiser votre travail. Le problème de l’automatisation du processus de détermination de la peine est essentiellement «qu’il existe une exception à chaque règle». Donc, si une personne devait écrire un programme informatique qui condamnait automatiquement les personnes condamnées, il faudrait alors une énorme quantité de code pour prendre en compte tous les cas particuliers imaginables. De plus, le moindre changement de loi rendrait le programme inutile.Mais que se passe-t-il si, au lieu d’avoir un humain écrivant toutes les règles dans un programme informatique, nous laissions une machine le faire? Ne pouvons-nous pas simplement donner à un ordinateur un grand nombre d’affaires criminelles avec les peines qui en résultent, puis l’ordinateur calcule les règles par lui-même? Il s’avère que nous pouvons, et ce processus est communément appelé apprentissage automatique.L’apprentissage automatique peut donc être considéré comme un ensemble d’algorithmes pouvant apprendre à copier le comportement observé. Par conséquent, dans le cas de la création d’un juge automatique, vous devrez alors compiler un ensemble de données sur des affaires précédentes et les verdicts qui l’accompagnent. Les cas historiques constitueraient alors le comportement observé et un algorithme d’apprentissage automatique essaierait maintenant de mettre au point un système de règles élaboré lui permettant de copier le comportement des juges en matière de condamnation dans les cas historiques.

Alors, que se passerait-il si vous essayiez cela dans la vraie vie? En fait, cela a déjà été fait aux États-Unis. Le premier problème rencontré par les personnes lors du déploiement du juge d’intelligence artificielle était que celui-ci semblait légèrement raciste dans sa détermination de la peine. Ce comportement était le résultat de décisions judiciaires historiques ayant tendance à donner des peines plus longues aux Noirs. Par conséquent, le juge de l’IA a copié ce comportement.

Donc, l’idée que les algorithmes d’une machine ne soient pas sujets à des biais humains est généralement fausse. Mais disons que nous sommes intéressés à créer un juge non raciste pour l’IA. Comment pouvons-nous supprimer sa tendance à donner aux Noirs des sentences plus longues?

C’est là que la création d’un système d’apprentissage automatique devient plus un art qu’une science. La solution consiste à supprimer les règles racistes de l’ensemble de données ou à fournir à l’algorithme d’apprentissage automatique des informations lui permettant d’apprendre que cette phrase est légèrement raciste et que cette phrase ne l’est pas.

Une solution pourrait consister à supprimer toutes les décisions défavorables aux Noirs. Une autre solution consisterait simplement à former le juge d’Amnesty International aux données relatives aux préjugés raciaux et, lorsque le juge d’Amnesty International est utilisé dans la pratique, il faut toujours lui dire que c’est une personne de race blanche qui doit être jugée. De cette façon, tout le monde serait jugé comme s’il était blanc.

4. Mais, quels algorithmes devriez-vous utiliser pour créer votre juge d’intelligence artificielle ?

Supposons donc que vous ayez assemblé votre ensemble de données d’histoires historiques et de décisions correspondantes qui présente le comportement que vous souhaitez copier. Par conséquent, vous êtes maintenant prêt à faire en sorte que le juge AI soit opérationnel.

La plupart des gens se tournent immédiatement vers les réseaux de neurones et les techniques d’apprentissage en profondeur dont on parle beaucoup. (Rouge: Les réseaux de neurones sont une classe spécifique d’algorithmes d’apprentissage automatique qui ont récemment été renommés apprentissage approfondi.) Mais j’arguerais que les utilisateurs inexpérimentés seraient en mesure d’obtenir facilement des résultats de pointe en utilisant un technique connue sous le nom incroyablement peu sexy : arbres de décision pour l’amélioration du gradient.

En dehors des compétitions d’apprentissage automatique, personne n’a vraiment entendu parler des méthodes d’arbre décisionnel favorisant l’incrustation, mais s’agissant des concours d’apprentissage automatique gagnants, cet algorithme est l’un des plus performants de tous les temps.

5. Cela signifie-t-il que le deep learning est complètement surestimé ?

Bonne question, vous serez peut-être tenté de dire: «Pourquoi tout le monde parle-t-il alors de cette question d’apprentissage en profondeur? Ils ne peuvent pas tous être idiots? »

La version simple de la réponse est liée à ce que l’on appelle des données non structurées. Ainsi, lorsque vous créez votre ensemble de données de cas historiques, vous créez généralement une représentation structurée des cas historiques. Cela signifie essentiellement que vous créez un résumé de feuille de calcul pour chaque cas. Ainsi, le résumé de la feuille de calcul peut contenir des variables telles que la race, le nombre de condamnations antérieures, un nombre indiquant le degré de gravité de l’infraction, etc. Pour chaque cas historique, vous devez ensuite saisir le nombre correct pour toutes les variables de votre résumé.

Par conséquent, vous convertissez une série de cas historiques en une feuille de calcul, où chaque ligne correspond à un cas historique.

Cette représentation structurée est ensuite transmise à un algorithme d’apprentissage automatique, qui apprend ensuite les règles sous-jacentes reliant les cas historiques aux phrases correspondantes.

Le problème est qu’il est parfois très difficile de créer un résumé sous forme de feuille de calcul de vos données d’entrée. Les exemples les plus importants de telles données sont les images et le texte.

Ainsi, même s’il est très facile pour l’homme de reconnaître les objets présents dans une image, cette tâche était très difficile pour les algorithmes d’apprentissage automatique. C’est toutefois avant l’apprentissage en profondeur qui a complètement transformé la capacité des systèmes d’apprentissage automatique à interpréter les données d’image et les données de texte.

Notez que l’apprentissage en profondeur fonctionne également très bien sur des données structurées, mais il existe des algorithmes beaucoup plus faciles à utiliser pour utiliser des algorithmes avec des performances comparables.

6. Comment recommanderiez-vous de démarrer avec le Machine Learning ?

Croyez-le ou non, mais il est en fait étonnamment facile de se lancer rapidement dans l’apprentissage automatique. Certains cours merveilleux sur la manière d’obtenir rapidement des résultats de pointe avec l’apprentissage automatique sontdisponibles gratuitement sur course.fast.ai. Ces cours sont principalement axés sur l’apprentissage en profondeur, mais un nouveau cours, axé sur des techniques d’apprentissage automatique plus traditionnelles, sera bientôt publié. Le site Web kaggle.com est un autre excellent point de départ. Les praticiens de l’apprentissage automatique partagent leurs approches en matière de résolution de concours d’apprentissage automatique.

L’intelligence artificielle peut-elle donner de la valeur à votre entreprise? Laissez un consultant indépendant vous aider.

Si vous recherchez un expert en IA ou un chef de projet en intelligence artificielle, un ingénieur en apprentissage automatique, un développeur en automatisation ou un autre consultant dans ce domaine, contactez-nous pour une offre gratuite d’un profil soigneusement sélectionné pour votre projet.

Téléphone	+45 2629 5568
E-mail	[email protected]
Carte	Google Maps
Site	Consultant Freelance de IT
LinkedIn	Suivez nous
Politique de confidentialite	Nous traitons vos données avec soin
Adresse	Right People Group Digital GmbH Weidenweg 61, D-10247 Berlin