Après l’introduction de la journée, j’ai suivi 2 conférences autour du thème comprendre.Tout d’abord un sujet pointu présenté par David Bessis, sur les algorithmes utilisés dans tout ce qui est machine learning. Ensuite une présentation de John Clark, ancien de Nokia, expert au BCG, sur les nouveaux modèles organisationnels de l’IT.
Introduction au machine learning : des algorithmes à la pratique par David Bessis
David Bessis, Ecole Normale Sup, docteur en Mathématiques Pures, ancien professeur à Yale et chercheur au CNRS a créé la société TinyClues. L’exposé porte sur les principes de base des algorithmes utilisés pour qu’un logiciel apprenne et soit capable de prédire. Première chose que je retiens : la qualité d’un modèle ne peut être évalué que sur des données de tests. Autrement dit, ce n’est pas parce que votre algo traite vos données de test et qu’il sort un résultat satisfaisant, que ceci sera applicable sur vos vraies données. Un logiciel ne peut apprendre que le « passé » sur des données, mais n’est pas capable de prédire le futur. Alors comment faire pour mettre en oeuvre des systèmes d’apprentissages ? Tout d’abord, il faut un échantillon pour apprendre, et un échantillon pour tester l’apprentissage. L’écart entre les résultats appliqués sur l’échantillon d’apprentissage et l’échantillon témoin permet de déterminer la qualité du modèle et de votre algo. Je vous épargne les formules mathématiques qui n’apportent pas grand chose à l’exposé, surtout pour un public aussi mauvais en math, fraichement cueilli après un café et un croissant. Mais cependant l’exposé était vraiment intéressant et accessible pour celui qui avait un bagage en mathématique. Disons un petit sac à main. Bref. Je m’égare.
Lors de la construction d’un système d’apprentissage, j’ai aussi retenu qu’il était important d’ajouter des variables, afin de diminuer l’erreur. Plus il y a de variables et plus le système sera juste. Plutôt que de parler d’intelligence artificielle, David Bessis évoque l’idée d’Intuition Artificielle. Sans atteindre le cerveau humain, nous pouvons aujourd’hui coder des systèmes capables de trier vos courriers électroniques et d’éliminter le spam, avec un taux de réussite assez important. Voyez comment fonctionne GMail par exemple.
Pour appliquer ces principes à de vrais projets, ce champ de recherche permet aujourd’hui d’améliorer l’expérience de ventes des grands sites internet. Prenez Amazon par exemple : le système de vente lié augmente fortement le taux de transformation, c’est devenu un système indispensable pour Amazon. Ces algo prennent tellement d’importance que des sociétés comme Netflix, location de film via internet, a offert 1 millions de dollars à celui capable d’améliorer l’algo de recommendation des films. Vous avez aimé la série « Vampire Diaries » ? Vous devriez aimer le film « Twilight ». David Bessis explique le principe de fonctionnement de ces algos. Il s’agit tout d’abord de taguer le plus finement possible les films, avec des mots clés. Ceci permet vraiment de proposer un résultat qualitatif à l’internaute. En partant des caractéristiques du film, des attributs intraseques, il est possible de définir une fonction qui est le produit scalaire entre le vecteur des attributs de ce qu’aime l’utilisateur et le vecteur des attributs des films. Bon, jeté comme cela dans un article d’un blog, je sens que vos yeux ne brillent pas… mais croyez moi c’était intéressant. Autre chose que j’ai noté : contrairement à une idée reçue, les algos qui se basent sur ce que les internautes ont acheté ne marchent pas. Ce n’est pas parce que votre épouse a acheté Twilight 4 que la mienne n’achètera pas le 5ème épisode. C’est parce qu’il n’existe pas. Bref. Je m’égare
Globalement je suis reparti avec quelques idées pour notre startup, je vous dois un article pour vous raconter ce que je fais en ce moment (en plus de l’eXpress-Board). Mais bon, bref, on verra plus tard.
Un nouveau modèle organisationnel pour la fonction IT par John Clark
Bon. Sur cette session j’ai pas accroché. Le fond était vraiment trop pour les Boss. J’aurai dû aller dans une autre salle, mais bon, tant pis. John Clark est un bon speaker, Senio Advisor au BCG, avec des slides du BCG aussi d’ailleurs. Pour commencer, un petit retour sur l’IT : jeune industrie, celle-ci connaît des cycles qui s’accumulent, plus qu’ils ne se suivent :
- MainFrame
- Client Serveur
- Web 1.0
- Industrialisation
D’un point de vue du DSI, celui-ci a deux courbes à gérer pour piloter son S.I : d’une part les investissements pour le futur, ce que John appelle « Change » et d’autre part une courbe pour gérer l’existant, le « Run ». Il y a quelques années, le Run était encore à 80%, mais avec l’arrivée du Cloud, John pense que le Run, l’argent consacré à faire tourner l’existant, devrait baisser dans les 5 ans qui suivent. Nous sommes en 2012 sur un ratio 70/30, avec 70% pour le Run. Faire tourner l’existant coûte un bras à la DSI.
Pour améliorer notre industrie, nous disposons aujourd’hui d’un bon nombre de pratiques, de standardisations et de méthodes. La standardisation avec les solutions globales comme par exemple SAP, les CRM du marchée, l’architecture J2EE il y a 10 ans. L’optimisation des processus avec CMMi, Scrum, l’Agilité, le Lean. Ensuite ce beau mouvement qu’est l’offshore, où ton logiciel est marqué « Made In India By Stupid Ingenior That Doesn’t Speak French » et enfin l’outsourcing avec l’appel aux SSII. Tout ceci piloté par le Directeur des Systèmes d’Information.
Les entreprises ont standardisé l’informatique dans l’organigramme. Aujourd’hui elle est partout, sous différentes formes. L’infrastructure et l’opérationnel joue le rôle de distributeur d’énergie. Le Business joue le rôle du client, et dirige la stratégie produit. Le Customer Service est chargé de prendre en compte le retour du client final et de l’intégrer au SI. Mais c’est encore très compliqué. Chaque entreprise met en oeuvre sa stratégie, et lorsque le DSI dégage, bien souvent l’ensemble est réorganisé en conséquence.
Bon cher lecteur, à cet instant j’ai décroché. J’ai compris de quels maux la DSI souffrait, mais je n’ai rien compris aux solutions. Il m’a manqué un bagage de Boss pour apprécier cette session.
Allez, next.
Direction la keynote passionnante « Business des données illégales : des innovations issues du monde criminel » par Marc Goodman, ancien d’Interpol. C’était génial.