
W laboratorium inżynierii na Uniwersytecie Columbia powstał robot humanoidalny, który nauczył się poruszać wargami w sposób zaskakująco zbliżony do ludzkiego. Co istotne, nie zaprogramowano go ręcznie do wypowiadania konkretnych dźwięków. Wszystkiego nauczył się, oglądając wideo w serwisie YouTube.
To ważny moment, wszak mimika twarzy od lat jest jednym z największych problemów w robotyce humanoidalnej opartej na AI. Urządzenia coraz lepiej chodzą, chwytają przedmioty i poruszają się w przestrzeni, ale ich twarze pozostają nienaturalne. Ruchy ust bywają sztywne i mechaniczne, co szybko burzy wrażenie obcowania z czymś niemal żywym. Ludzie są na ten aspekt wyjątkowo wyczuleni, więc bardzo zwracają na to uwagę.
W związku z tym zespół z Creative Machines Lab postanowił odejść od klasycznego podejścia. Nie tworzył bowiem list reguł opisujących każdą głoskę, którą robot humanoidalny miałby wypowiadać na bazie zaprogramowanego kodu. Zamiast tego dostał twarz z miękkiej syntetycznej skóry, poruszanej przez 26 małych silników i zaczął naukę. Najpierw ustawiono go przed lustrem. Przez długi czas wykonywał losowe miny i obserwował, jak konkretne ruchy silników zmieniają kształt ust. Dzięki temu humanoid oparty o AI nauczył się, jak działa jego własna twarz.
Dopiero potem przyszła pora na naśladowanie ludzi. Robot humanoidalny analizował wiele godzin nagrań, ucząc się zależności między dźwiękiem a ruchem warg. Wykorzystano model, który bezpośrednio zamienia to, co słyszy, na polecenia dla silników twarzy. Nie ma tu wiedzy zapisanej w kodzie. Jest natomiast statystyka, obserwacja i uczenie się na przykładach.
Efekty okazały się zaskakująco dobre. Podczas testów humanoid opracowany przez Creative Machines Lab potrafił synchronizować ruchy ust z mową w różnych językach, a nawet śpiewać. Nie wszystko jednak działało idealnie. Głoski wymagające mocnego zamknięcia lub zaokrąglenia warg wciąż sprawiały mu trudność. Mimo to postęp był wyraźny. Jak podkreśla Hod Lipson, robot będzie się poprawiał wraz z kolejnymi interakcjami z ludźmi.
Twórcy podkreślają, że nie chodzi im o widowiskowe sztuczki. Realistyczna twarz robota humanoidalnego może zmienić jakość kontaktu między człowiekiem a maszyną. Połączenie naturalnej mimiki z zaawansowaną sztuczną inteligencją konwersacyjną może sprawić, że rozmowy staną się bardziej naturalne i emocjonalnie czytelne. W obszarach takich jak edukacja, opieka zdrowotna czy wsparcie osób starszych wiarygodna twarz może być równie ważna, co sprawne dłonie.
Badacze zwracają też uwagę na ryzyko. Im bardziej roboty przypominają ludzi, tym łatwiej o emocjonalne nieporozumienia i fałszywe poczucie relacji. Dlatego rozwój tej technologii opartej na sztucznej inteligencji powinien iść w parze ze świadomością jego konsekwencji.