Interview : « DataMB », quand la data prend le pouvoir dans le football

Supporter du FC Metz et fondateur du réputé site « DataMB », spécialisé dans le football data, Olivier nous dévoile tout. Interview.

Pour ceux qui ne vous connaitraient peut-être pas, vous êtes le fondateur et directeur de DataMB, un site web réputé (41k followers sur X) spécialisé dans la data dans le football. Comment vous est venu l’idée d’un tel projet ?

« Il y a un peu moins d’un an, j’étais en recherche d’emploi après une expérience au Luxembourg dans un domaine qui ne me convenait pas. Je postulais à des jobs dont je n’étais pas convaincu, et je m’ennuyais beaucoup. Forcément sans travail, ma consommation de football a triplé. Alliant mes deux passions (les mathématiques et le football), la data de foot a toujours été un mes plaisirs. Je me suis souvent amusé à créer des modèles, des analyses de joueur, d’équipe, de match, etc. Mais je n’avais jamais appris à coder, que ce soit un site web ou même des visualisations de données. Avec du temps sur mes mains, je me suis dit que ce serait intéressant d’apprendre.

J’ai bêtement commencé par apprendre à créer des graphiques pour comparer des joueurs -localement sur mon ordinateur-, que j’ai postés à mes ~50 followers sur X. J’ai tout de suite remarqué qu’il existait un appétit pour ces choses-là mais que de devoir prendre des requêtes à chaque fois, ce n’était pas idéal. Et j’avais beau chercher, je ne trouvais pas de site qui proposait ce genre d’outil de comparaison en format graphique, du moins gratuitement. Alors j’ai décidé de ne pas juste apprendre à créer ces visuels moi-même, mais aussi d’essayer de créer un outil pour que d’autres qui n’ont pas forcément le temps ou l’envie d’apprendre puissent générer les graphiques qu’ils veulent. »

Quels étaient vos objectifs en créant votre site ? Qu’en est-il désormais ?

« Je pourrais dire que le but était de faciliter l’accès à la visualisation de données pour tout le monde, mais à vrai dire au début c’était vraiment juste un challenge, et un moyen d’apprendre des choses et de passer le temps. Je ne pensais pas que je réussirais à produire un outil fonctionnel, sachant que je n’avais jamais codé auparavant. Mais une fois que le site était lancé -même sans nom, et sur mon twitter personnel- les choses ont très vite pris une ampleur à laquelle je ne m’attendais pas du tout. C’est là qu’est né DataMB. Dix mois et de nombreuses étapes plus tard le but est de continuer cette belle croissance, que ce soit en termes d’utilisateurs, d’abonnés à la version Pro ou même de présence sur les réseaux sociaux. »

Pouvez-vous nous expliquer, et élucider sans aucun doute un certain nombre de supporters, la manière dont sont calculées toutes ces statistiques ? Comment gère-t-on une base de données aussi grande ?

« Les données statistiques dans le football sont majoritairement collectées à la main. Les fournisseurs de données ont des équipes qui scrutent chaque action, mais la technologie vient aujourd’hui alléger ce travail-là à l’aide par exemple de caméras de “tracking”. On peut mentionner également l’important développement de de l’intelligence artificielle pour la collecte de données de football, qui pourrait jouer un rôle prépondérant à l’avenir. Ces points de données de base sont ensuite utilisés pour calculer toute sortes de statistiques, de la longueur des passes à la précision des tirs mais aussi des métriques plus “avancées” comme les expected goals (dont les modèles, eux, prennent en compte un grand nombre de données historiques pour estimer certaines probabilités). 

Pour ce qui est de la gestion de grandes bases de données, je pense que c’est quelque chose de familier à plus de gens qu’on ne le pense, car cette idée de ‘Big Data’ revient dans beaucoup de domaines. Le ‘Director of Data Science’ de Manchester United, par exemple, vient du monde du prêt-à-porter. Il “suffit” d’avoir un esprit mathématique mais surtout d’être organisé. »

sociosfcmetz
« on se rend compte que dépenser gros ne sert plus à rien et qu’il faut dépenser “bien” ou intelligemment ».

Comment estimeriez-vous l’ampleur qu’a prise la data dans le football d’aujourd’hui ?

« Sur les dix dernières années, l’impact est presque exponentiel. Il y a encore beaucoup de progrès à faire tant d’un point de vue éducationnel que d’un point de vue technique, et il y aura toujours des réticents, mais tout cela se démocratise rapidement. Ceux qui méprisent encore la data sous-estiment vivement l’ampleur qu’elle a déjà prise au sein des clubs et l’impact qu’elle a sur notre sport en général. Un exemple tout bête, mais pratiquement toutes les équipes ont arrêté de tirer de loin. »

Lorsque l’on sait que Toulouse, via son président, se focalise grandement sur la data pour son recrutement, peut-on s’attendre à ce que ce modèle se démocratise de plus en plus dans les clubs dans les années venir ?

« Tout à fait. On le voit déjà se multiplier au sein des clubs plus “petits” (avec le TFC de Comolli et le Brighton de Bloom en tête du peloton) pour des raisons qui n’échappent à personne : ça peut être très intéressant financièrement. Mais c’est un modèle de plus en plus apprécié au sein de l’élite, qui se rend compte que dépenser gros ne sert plus à rien et qu’il faut dépenser “bien” ou intelligemment. Et cela passe bien souvent par, entre autres, l’utilisation de la data. On peut mentionner Liverpool (qui avaient déjà auparavant fait confiance à Comolli, par ailleurs) dont le “decision-making” sous Michael Edwards était très en avance là-dessus. Si les clubs veulent être les meilleurs dans chaque domaine, dans un univers ou chaque avantage compte, ils se doivent d’exceller aussi en termes d’utilisation des statistiques. »

sociosfcmetz
« il y a toute sortes d’autres contraintes qui peuvent entrer en jeu. »

Un détail de votre vie vous relie aux supporters du FC Metz, c’est que vous êtes originaire de la région et vous-même supporter du club à la Croix de Lorraine. Que pensez-vous de la saison du FC Metz en Ligue 1 ?

« Tout d’abord je trouve ça un peu triste ce qu’il s’est passé cet été. L’équipe monte en Ligue 1 et au lieu de se renforcer, elle perd deux de ses meilleurs éléments. On savait tous ce qu’il allait se passer, personne n’était confiant en août et malgré ça, le maintien est encore possible. S’ils le font, c’est un magnifique exploit. S’ils descendent, je ne pense pas qu’on puisse en vouloir au groupe. »

Le travail de Bob Tahri, chargée du recrutement data au sein du club grenat, devrait donc vous être plutôt familier. L’été dernier, il a été principalement à l’origine de plusieurs erreurs de casting, telles que Oscar Estupinan ou Benjamin Tetteh pour ne citer qu’eux. Comment expliqueriez-vous de telles défaillances dans ce système ?

« Il est difficile de commenter une situation dont je ne connais pas tous les tenants et aboutissants. C’est vrai qu’il est possible de faire preuve d’inventivité et de prendre des risques sur le marché qui peuvent s’avérer payants, mais il y a toute sortes d’autres contraintes qui peuvent entrer en jeu. »

Quel œil portez-vous sur les estimations de montées et de descentes que l’on voit fleurir chaque année à 10 journées de la fin ? L’année passée, Metz n’avait que 2,3% de chances de montée finalement… Une nouvelle fois, les chiffres ne semblent pas parler en faveur d’un maintien à l’issue de la saison. On peut tout de même y croire ?

« Ce genre de statistiques, c’est pour les parieurs ! Je préfère rester dans le descriptif, on ne peut jamais prédire un résultat à l’avance. Et pour les fans : tant que c’est possible, on y croit. »

 

Merci à Olivier d’avoir répondu à nos questions, son site est à retrouver en cliquant sur ce lien : https://datamb.football/plotteam/

Propos recueillis par Arnaud M. et Max. G 

www.socios-fcmetz.com

Crédits photos : Icon Sport ; X DataMB  

Les derniers articles :
P