Le chemin vers la simplicité : construire Veo Go
Frederik Hvillum

Comment l'évolution de Veo depuis des configurations matérielles complexes vers une simple application smartphone révèle la réalité expérimentale et désordonnée derrière l'innovation révolutionnaire.
Dans un bureau exigu dans une arrière-cour à Nørrebro, Copenhague, les imprimantes 3D bourdonnaient dans les toilettes tandis que huit personnes se serraient autour de bureaux, travaillant acharnement sur ce qui allait devenir l'une des technologies les plus révolutionnaires du football.
Aujourd'hui, des millions connaissent Veo comme la caméra IA qui filme automatiquement les matchs de football. Le parcours sinueux qui a mené à la plus récente innovation de Veo, Veo Go, l'application smartphone qui met cette même technologie dans la poche de tout le monde, a impliqué des expériences ratées, des doigts gelés et le type de persistance qui transforme la "magie noire" en réalité quotidienne.
"Tout fonctionnait localement sur un ordinateur. Donc on livrait un laptop de gaming, on livrait toutes sortes de câbles, des batteries supplémentaires - c'était très complexe", se souvient Kawus Nouri, Chef de Produit chez Veo, en repensant à la configuration matérielle initiale de l'entreprise.
L'ironie était claire pour l'équipe. La vision originale avait en fait été beaucoup plus simple : utiliser des smartphones pour enregistrer les matchs de football. Mais à l'époque, la technologie n'était tout simplement pas prête. "Tu ne pouvais pas enregistrer des vidéos 4K - la batterie n'était pas aussi bonne. Capacité de stockage, champ de vision, tu n'avais pas ça à l'époque", explique Kawus Nouri. "Il y avait tout simplement trop de points de défaillance."
Alors Veo a pris le chemin long. Ils ont construit des caméras spécialisées, développé des modèles d'IA sophistiqués et créé un système qui fonctionnait - mais qui nécessitait des laptops de gaming, des caméras d'action montées dans des supports en plastique et assez de câbles pour alimenter un petit concert.

Kawus Nouri se souvient clairement des premiers jours : "J'étais le premier employé qui n'était pas programmeur. J'étais probablement un peu un outsider. C'était une belle façon d'arriver en tant que débutant et d'être : 'balancez-moi de la tech, et je vais essayer de la transformer en produit'."
La fondation IA qui a rendu cela possible
Pendant que Veo construisait du matériel complexe, Kawus Nouri et son équipe ont discrètement résolu un problème encore plus complexe : apprendre aux machines à comprendre le football.
"Quand on parle d'IA, on doit décomposer ça en quelque chose de facile à digérer", explique Kawus Nouri. "Quand tu lui montres une banane, et que tu montres différents exemples d'une banane - alors elle sait que c'est une banane. Si tu peins une des bananes en rouge et que tu lui montres ça, alors soudain elle ne sait plus que c'est une banane."
Le défi d'entraîner l'IA à reconnaître un ballon de football est étonnamment complexe. "Si un ballon est quelque chose qui est blanc, alors tout ce qui est blanc serait reconnu comme un ballon", note Kawus Nouri.
L'équipe a dû nourrir leurs modèles avec des milliers d'exemples : différents ballons, différents terrains, différentes conditions d'éclairage. "On a reçu quelques enregistrements d'un terrain complètement bleu. C'était très, très bleu. Et nos modèles ont été perturbés par ça", se rappelle Kawus Nouri en riant.
Le pipeline IA qu'ils ont développé inclut trois composants principaux : Suivi du Ballon ("entraîner un modèle pour garder une trace de où se trouve le ballon"), Détection d'Événements ("trouver des horodatages dans l'enregistrement où des événements spécifiques se produisent") et Follow Cam ("l'expérience de diffusion que tu obtiens, où une caméra virtuelle suit l'action").
Retour à la simplicité
Des années plus tard, alors que la technologie smartphone rattrapait les ambitions de Veo, l'équipe s'est retrouvée dans une position familière : tester des idées folles dans de petits laboratoires.
"Veo Labs ressemble aux premiers jours de Veo", note Kawus Nouri. "Il y a quelques personnes dans un bureau, trouvant des solutions à des idées folles."
Le moment de vérité est arrivé lors d'une journée glaciale de janvier au Danemark. "Je me souviens d'être sorti et d'avoir fait des enregistrements en janvier au Danemark. Il faisait un froid glacial", se souvient Zamzam Farzamipooya, Responsable Ingénierie chez Veo. "Et puis regarder le résultat en pensant 'Ça pourrait vraiment marcher, c'est vraiment bon'."

Mais même avec une technologie prouvée, de nouveaux défis ont émergé. Est-ce que les gens prêteraient vraiment leurs téléphones ? Est-ce que ce serait quelque chose que les gens pourraient comprendre comment utiliser ?
La philosophie de design : complexité invisible
Pour Caglar Araz, Directeur Design Produit de Veo Go, l'objectif était ambitieux : rendre la complexité invisible. "Mon boulot c'est de rendre ça aussi facile que possible pour qu'ils utilisent notre produit. Idéalement, je ne veux pas que tu remarques quand on a fait un bon produit, tu vois ?"
La philosophie de design est devenue radicalement simple. "Tu mets deux téléphones dans un support. Tu lèves le trépied, et ça enregistre, et tu n'as pas besoin d'y penser", explique Kawus Nouri. "Tu es là pour entraîner. Ou juste te détendre et profiter du match et attendre les moments fun dans la vidéo que tu peux partager avec tes potes."
Cette simplicité était un choix délibéré. "Tu pourrais sur-ingénier et t'assurer que ça marche par tous les temps et tout. Ce n'était pas le choix. Le choix était la simplicité", souligne Zamzam Farzamipooya.
Mais atteindre cette simplicité nécessitait d'embrasser l'échec. "Tu dois être assez courageux pour passer par beaucoup d'échecs jusqu'à ce que tu atteignes quelque chose qui soit vraiment bon", note Caglar Araz.
La magie derrière le rideau
Ce qui rend Veo Go remarquable c'est comment il exploite des années de développement complexe pour livrer quelque chose qui semble magique. "Ça ressemble à de la magie noire. On ne sait pas vraiment ce qui se passe sous le capot", admet Zamzam Farzamipooya.
La percée est venue en réalisant qu'ils n'avaient pas besoin de tout reconstruire de zéro. "Un truc cool avec Veo Go pour moi c'est que ça ne demandait pas plus", explique Zamzam Farzamipooya. "On avait les caméras, on avait les lentilles, on avait toute cette information. On avait des modèles assez robustes que l'équipe Go pouvait prendre sur l'étagère et commencer à utiliser. On devait juste comprendre les iPhones et la partie enregistrement."
Toutes ces années à construire du matériel complexe et entraîner des modèles IA sophistiqués avaient créé quelque chose d'inestimable : une fondation qui pouvait fonctionner partout.

L'histoire humaine
Derrière la technologie se cache une mission profondément personnelle. "Voir des joueurs de football s'amuser, c'est juste une mission et un produit dont je suis passionné moi-même", dit Tobias Lindberg, Directeur Ingénierie Machine Learning. "J'ai pas mal joué au football moi-même, mais je ne suis pas allé aussi loin que j'espérais finalement."
Cette connexion au jeu pilote tout ce qu'ils font. "Et même maintenant, quand je joue avec Veo quelques fois par semaine, c'est fantastique de pouvoir juste enregistrer tes matchs. Capturer les temps forts et les partager avec les collègues après."
Veo Go représente plus qu'un accomplissement technologique. Il démocratise l'accès à quelque chose qui était auparavant seulement disponible aux clubs d'élite. "Veo Go est un des produits qu'on a qui est fidèle à la mission de Veo", explique Tobias Lindberg. "Il y a des milliards de téléphones là-bas. Et on peut les exploiter, pour que tout le monde ait l'opportunité de se voir jouer au football."
La vraie validation est venue de rencontres inattendues quand Kawus Nouri et son équipe testaient Veo Go dans un club local. "Quelques parents sont passés et ont dit : 'C'est quoi ça ?'", se souvient Kawus Nouri. "Parce qu'ils voulaient vraiment faire des enregistrements, mais ils ne pouvaient pas se permettre une caméra. Et j'ai dit : 'Mec, on sera là bientôt'."

L'évolution depuis les laptops de gaming vers les apps smartphone illustre comment parfois les solutions les plus élégantes nécessitent le chemin le plus complexe pour être atteintes. En maîtrisant d'abord les problèmes difficiles - IA, vision par ordinateur, design matériel - Veo a créé la fondation pour quelque chose d'apparemment magique.
"Le Veo que tout le monde connaît est un morceau complexe de matériel. Go est basiquement une simplification de ça", conclut Kawus Nouri. Mais l'appeler une "simplification" sous-estime l'accomplissement. Ce n'est pas juste plus simple. C'est accessible à des milliards de personnes qui n'auraient jamais pu se permettre le matériel original.
Des tables de baby-foot à l'échelle globale
L'évolution a même eu ses moments bizarres. Les premiers prototypes ont été testés sur des tables de baby-foot, un détail qui semble maintenant à la fois charmant et prophétique. "Ce n'était jamais vraiment l'intention de faire des vidéos sur des tables de baby-foot. C'est juste une façon que les gars ont pu prouver que la technologie pouvait faire ce qu'on promettait qu'elle ferait", se souvient Kawus Nouri.
Cette table de baby-foot représente quelque chose d'important : la volonté de commencer petit, tester des idées et itérer sans relâche. De cette petite preuve de concept à une plateforme globale utilisée par des millions représente le type de mise à l'échelle qui n'arrive que quand la technologie, le timing et le besoin humain s'alignent parfaitement.
Aujourd'hui, Veo Go met l'analyse professionnelle de match dans la poche de chaque parent sur la touche, chaque entraîneur de base et chaque joueur qui veut juste se voir s'améliorer. C'est la démocratisation d'une technologie qui nécessitait autrefois un investissement significatif et une expertise technique.
L'histoire de Veo Go se concentre sur construire de meilleurs logiciels et démontre la patience, la persistance et la croyance que les problèmes complexes nécessitent parfois des solutions complexes pour finalement livrer des expériences simples.