Automatyczne napisy w YouTube

YouTubeBez wątpienia największym wydarzeniem w Google w ciągu ostatnich dni było zaprezentowanie systemu operacyjnego Chrome OS. Tymczasem w czwartek firma z Mountain View uruchomiła nową, bardzo ciekawą i użyteczną usługę w serwisie YouTube, która ma szansę przyciągnąć do niego jeszcze więcej użytkowników. Jest to możliwość automatycznego generowania napisów do filmów.

Do tej pory napisy można było dodawać manualnie, co było zarówno męczące, jak i zabierało sporo czasu.  Google podaje, że w ciągu minuty na YouTube ładowane jest 20 godzin filmów (sic!), więc napisy w praktyce należą do rzadkości – jest nimi opatrzonych nieco ponad 100 tys. filmów, co stanowi odsetek zawartości serwisu, liczonego w setkach milionów filmów. Dzięki możliwości automatycznego generowania napisów ma to szansę się zmienić.

Inżynierowie projektu połączyli system tworzenia napisów na YouTubie z technologią rozpoznawania mowy, wykorzystując dokładnie ten sam algorytm, co w Google Voice. Na razie projekt znajduje się w fazie początkowej i jest dostępny tylko na 13 kanałach, głównie edukacyjnych (m.in. Google, YouTube, National Geographic, uniwersytetów Yale i Kalifornijskiego etc.), lecz jeśli zostanie pozytywnie oceniony przez użytkowników, Google planuje zacząć stopniowe jego rozszerzanie.

Teraz YouTube jest w stanie wygenerować automatycznie napisy tylko z filmów anglojęzycznych, ale w przyszłości usługa będzie dostępna również w innych językach. Tymczasowym, ale funkcjonalnym rozwiązaniem jest włączenie do tej usługi Tłumacza Google, który umożliwi przełożenie napisów na 51 języków. Samo Google przyznaje, że tłumaczenie jest na razie niedoskonałe – o czym wiedzą wszyscy, którzy korzystają z Google Translate – ale wystarczające, żeby zrozumieć podstawową treść filmu.

Usługa jest przeznaczona dla osób niesłyszących i mających problemy ze słuchem (należą do nich kierownik projektu Ken Harrenstien i wiceprezes firmy Vint Cerf), ale także dla osób słabo znających język angielski, przez co jest też narzędziem edukacyjnym.

Google usprawniło również proces manualnego dodawania napisów. Wprowadzona została funkcja “auto-timing”, która także korzysta z technologii rozpoznawania mowy. Teraz po załadowania filmu na YouTube’a serwis porówna stworzone przez użytkownika napisy ze ścieżką dźwiękową filmu i sam przetworzy tekst na listę dialogową. Manualne wprowadzanie napisów zostanie więc częściowo zautomatyzowane.

Oba projekty są na razie we wczesnej fazie rozwojowej (w filmie demo słowa “sim card” komputer tłumaczy jako “salmon”, czyli łosoś…). Jednak jeśli zostaną zastosowane na szerszą skalę, mogą być wręcz rewolucyjne: wystarczy wyobrazić sobie YouTube’a, w którym każdy film można opatrzyć napisami i przetłumaczyć je na 51 języków.

  • RSS
  • Wykop
  • Gwar
  • Twitter
  • Facebook

Dodaj komentarz


XHTML: Możesz używać tagów: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>