Droga do prostoty: budowanie Veo Go
Frederik Hvillum

Jak ewolucja Veo od złożonych konfiguracji sprzętowych do prostej aplikacji na smartfona ujawnia eksperymentalną i chaotyczną rzeczywistość stojącą za przełomowymi innowacjami.
W ciasnym biurze na podwórku w Nørrebro w Kopenhadze, drukarki 3D brzęczały w toaletach, podczas gdy osiem osób ściskało się wokół biurek, intensywnie pracując nad tym, co miało stać się jedną z najbardziej rewolucyjnych technologii w piłce nożnej.
Dziś miliony znają Veo jako kamerę AI, która automatycznie nagrywa mecze piłkarskie. Kręta droga, która doprowadziła do najnowszej innowacji Veo, Veo Go, aplikacji na smartfona, która wkłada tę samą technologię do kieszeni każdego, obejmowała nieudane eksperymenty, zmrożone palce i rodzaj wytrwałości, który przekształca "czarną magię" w codzienną rzeczywistość.
"Wszystko działało lokalnie na komputerze. Więc dostarczaliśmy laptopa do gier, dostarczaliśmy wszelkiego rodzaju kable, dodatkowe baterie - to było bardzo złożone", wspomina Kawus Nouri, Menedżer Produktu w Veo, patrząc wstecz na wczesną konfigurację sprzętową firmy.
Ironia była jasna dla zespołu. Oryginalna wizja była w rzeczywistości znacznie prostsza: używanie smartfonów do nagrywania meczów piłki nożnej. Ale wtedy technologia po prostu nie była gotowa. "Nie mogłeś nagrywać filmów 4K - bateria nie była tak dobra. Pojemność pamięci, pole widzenia, nie miałeś tego wtedy", wyjaśnia Kawus Nouri. "Było po prostu zbyt wiele punktów awarii."
Więc Veo poszło długą drogą. Zbudowali specjalistyczne kamery, opracowali wyrafinowane modele AI i stworzyli system, który działał - ale wymagał laptopów do gier, kamer sportowych zamontowanych w plastikowych uchwytach i wystarczającej ilości kabli, żeby zasilić mały koncert.

Kawus Nouri jasno pamięta wczesne dni: "Byłem pierwszym pracownikiem, który nie był programistą. Prawdopodobnie byłem trochę outsiderem. To był miły sposób na to, żeby po prostu przyjść jako początkujący i być: 'rzućcie na mnie trochę technologii, a spróbuję z tego zrobić produkt'."
Fundamenty AI, które to umożliwiły
Podczas gdy Veo budowało złożony sprzęt, Kawus Nouri i jego zespół po cichu rozwiązali jeszcze bardziej złożony problem: nauczenie maszyn rozumienia piłki nożnej.
"Kiedy mówimy o AI, musimy to rozłożyć na coś, co jest łatwe do strawienia", wyjaśnia Kawus Nouri. "Kiedy pokażesz mu banana i pokażesz różne przykłady banana - wtedy wie, że to banan. Jeśli pomalujesz jednego z bananów na czerwono i mu to pokażesz, to nagle nie wie, że to banan."
Wyzwanie trenowania AI do rozpoznawania piłki nożnej jest zaskakująco złożone. "Jeśli piłka to coś, co jest białe, to wszystko, co jest białe, zostałoby rozpoznane jako piłka", zauważa Kawus Nouri.
Zespół musiał nakarmić swoje modele tysiącami przykładów: różnymi piłkami, różnymi boiskami, różnymi warunkami oświetlenia. "Otrzymaliśmy nagrania z całkowicie niebieskiego boiska. Było bardzo, bardzo niebieskie. I nasze modele były tym zdezorientowane", wspomina Kawus Nouri ze śmiechem.
Pipeline AI, który opracowali, zawiera trzy główne komponenty: Śledzenie Piłki ("trenowanie modelu do śledzenia, gdzie znajduje się piłka"), Wykrywanie Zdarzeń ("znajdowanie znaczników czasowych w nagraniu, gdzie występują określone wydarzenia") i Follow Cam ("doświadczenie transmisji, które otrzymujesz, gdzie wirtualna kamera podąża za akcją").
Powrót do prostoty
Lata później, gdy technologia smartfonów dorównała ambicjom Veo, zespół znalazł się w znanej pozycji: testowania szalonych pomysłów w małych laboratoriach.
"Veo Labs wygląda jak wczesne dni Veo", zauważa Kawus Nouri. "Jest kilka osób w biurze, znajdując rozwiązania dla szalonych pomysłów."
Moment prawdy nadszedł podczas mroźnego styczniowego dnia w Danii. "Pamiętam, jak wyszedłem i robiłem nagrania w styczniu w Danii. Było przenikliwie zimno", wspomina Zamzam Farzamipooya, Menedżer Inżynierii w Veo. "A potem patrzenie na wynik myśląc 'To może naprawdę zadziałać, to jest naprawdę dobre'."

Ale nawet z sprawdzoną technologią pojawiły się nowe wyzwania. Czy ludzie naprawdę pożyczaliby swoje telefony? Czy to byłoby coś, czego użytkowania ludzie mogliby się dowiedzieć?
Filozofia designu: niewidzialna złożoność
Dla Caglar Araza, Głównego Designera Produktu Veo Go, cel był ambitny: uczynić złożoność niewidzialną. "Moja praca polega na tym, żeby uczynić to tak łatwym jak to możliwe dla nich do użycia naszego produktu. Idealnie, nie chcę, żebyś zauważył, kiedy zrobiliśmy dobry produkt, prawda?"
Filozofia designu stała się radykalnie prosta. "Wkładasz dwa telefony do uchwytu. Podnosisz statyw, i nagrywa, i nie musisz o tym myśleć", wyjaśnia Kawus Nouri. "Jesteś tam, żeby trenować. Albo po prostu się rozluźnij i ciesz się meczem i czekaj na zabawne momenty w filmie, którymi możesz podzielić się ze znajomymi."
Ta prostota była świadomym wyborem. "Mogłbyś to przegineerować i upewnić się, że działa w każdej pogodzie i tak dalej. To nie był ten wybór. Wyborem była prostota", podkreśla Zamzam Farzamipooya.
Ale osiągnięcie tej prostoty wymagało przyjęcia porażki. "Musisz być wystarczająco odważny, żeby przejść przez wiele porażek, aż osiągniesz coś, co jest naprawdę dobre", zauważa Caglar Araz.
Magia za kurtyną
To, co czyni Veo Go niezwykłym, to sposób, w jaki wykorzystuje lata złożonego rozwoju, aby dostarczyć coś, co wydaje się magiczne. "To wygląda jak czarna magia. Nie wiemy naprawdę, co dzieje się pod maską", przyznaje Zamzam Farzamipooya.
Przełom nastąpił z uświadomienia sobie, że nie muszą wszystkiego odbudowywać od zera. "Fajna rzecz w Veo Go dla mnie była taka, że nie wymagało więcej", wyjaśnia Zamzam Farzamipooya. "Mieliśmy kamery, mieliśmy obiektywy, mieliśmy wszystkie te informacje. Mieliśmy dość solidne modele, które zespół Go mógł wziąć z półki i zacząć używać. Musieliśmy tylko wymyślić iPhone'y i część nagrywania."
Wszystkie te lata budowania złożonego sprzętu i trenowania wyrafinowanych modeli AI stworzyły coś bezcennego: fundament, który mógł działać wszędzie.

Historia ludzka
Za technologią kryje się głęboko osobista misja. "Widzenie piłkarzy bawiących się, to po prostu misja i produkt, którym sam jestem pasjonatem", mówi Tobias Lindberg, Główny Inżynier Machine Learning. "Sam grałem sporo w piłkę nożną, ale nie zaszedłem tak daleko, jak ostatecznie miałem nadzieję."
To połączenie z grą napędza wszystko, co robią. "I nawet teraz, kiedy gram z Veo kilka razy w tygodniu, to fantastyczna rzecz móc po prostu nagrywać swoje mecze. Uchwycić najważniejsze momenty i podzielić się nimi z kolegami później."
Veo Go reprezentuje więcej niż osiągnięcie technologiczne. Demokratyzuje dostęp do czegoś, co wcześniej było dostępne tylko dla klubów elitarnych. "Veo Go to jeden z produktów, które mamy, który jest wierny misji Veo", wyjaśnia Tobias Lindberg. "Jest miliardy telefonów tam na zewnątrz. I możemy je wykorzystać, żeby każdy miał szansę zobaczyć siebie grającego w piłkę nożną."
Prawdziwa walidacja przyszła z nieoczekiwanych spotkań, kiedy Kawus Nouri i jego zespół testowali Veo Go w lokalnym klubie. "Jacyś rodzice podeszli i zapytali: 'Co to jest?'", wspomina Kawus Nouri. "Bo naprawdę chcieli robić nagrania, ale nie mogli sobie pozwolić na kamerę. A ja powiedziałem: 'Koleś, wkrótce tam będziemy'."

Ewolucja od laptopów do gier do aplikacji na smartfony ilustruje, jak czasami najbardziej eleganckie rozwiązania wymagają najbardziej złożonej drogi, żeby je osiągnąć. Najpierw opanowując trudne problemy - AI, computer vision, design sprzętu - Veo stworzyło fundament dla czegoś pozornie magicznego.
"Veo, które wszyscy znają, to złożony kawałek sprzętu. Go to w zasadzie uproszczenie tego", konkluduje Kawus Nouri. Ale nazywanie tego "uproszczeniem" niedoszacowuje osiągnięcie. To nie jest tylko prostsze. To jest dostępne dla miliardów ludzi, których nigdy nie byłoby stać na oryginalny sprzęt.
Od stołów do piłkarzyków do globalnej skali
Ewolucja miała nawet swoje dziwaczne momenty. Wczesne prototypy były testowane na stołach do piłkarzyków, szczegół, który teraz wydaje się zarówno czarujący, jak i proroczy. "To nigdy nie było naprawdę intencją robienia filmów na stołach do piłkarzyków. To tylko sposób, w jaki chłopaki mogli udowodnić, że technologia może zrobić to, co obiecaliśmy, że zrobi", wspomina Kawus Nouri.
Ten stół do piłkarzyków reprezentuje coś ważnego: gotowość do rozpoczynania od małego, testowania pomysłów i nieustannego iterowania. Od tego małego proof of concept do globalnej platformy używanej przez miliony reprezentuje typ skalowania, który zdarza się tylko wtedy, gdy technologia, timing i ludzkie potrzeby idealnie się wyrównają.
Dziś Veo Go wkłada profesjonalną analizę meczów do kieszeni każdego rodzica na linii bocznej, każdego trenera podstawowego i każdego gracza, który po prostu chce zobaczyć siebie poprawiającego się. To demokratyzacja technologii, która kiedyś wymagała znaczących inwestycji i technicznej ekspertyzy.
Historia Veo Go koncentruje się na budowaniu lepszego oprogramowania i demonstruje cierpliwość, wytrwałość i przekonanie, że złożone problemy czasami wymagają złożonych rozwiązań, aby ostatecznie dostarczyć proste doświadczenia.