Szybkie tłumaczenie w czasie rzeczywistym to jeden z kluczowych atutów wykorzystywanych przez gigantów technologicznych do promowania generatywnej sztucznej inteligencji, a Microsoft wkrótce umieści je w swojej przeglądarce Edge. Podczas gdy YouTube od jakiegoś czasu rozwija usługi tłumaczeniowe, Microsoft zamierza rozszerzyć tłumaczenia wideo AI na wiele innych stron i usług.
Microsoft zaprezentował w tym tygodniu funkcję tłumaczenia wideo opartą na sztucznej inteligencji, która wkrótce pojawi się w Edge. Ta funkcja automatycznie generuje transkrypcje i dubbingi w językach obcych dla filmów wideo na coraz większej liczbie stron, w tym między innymi na YouTube, LinkedIn (własność Microsoft), Bloomberg, Reuters i Coursera.
Microsoft zaprezentował w tym tygodniu funkcję tłumaczenia wideo opartą na sztucznej inteligencji, która wkrótce pojawi się w Edge.
Gigant z Redmond opublikował krótki klip demonstrujący tę funkcję. Film pokazuje, jak użytkownik Edge klika ikonę tłumaczenia u góry filmu na LinkedIn przedstawiającego przemówienie dyrektora generalnego Microsoft Ignite, Satyi Nadelli. Pojawia się menu wyświetlające opcje tłumaczenia dźwięku lub napisów z języka angielskiego na kilka innych języków (jak się domyślacie, polskiego na razie tam nie ma). Po wybraniu z menu rozwijanego języka angielskiego i hiszpańskiego jako języków wejściowych i wyjściowych, użytkownik klika „Tłumacz”. Film zostaje na chwilę wstrzymany, a oryginalny dźwięk zostaje zastąpiony hiszpańskim dubbingiem.
Po debiucie tej funkcji Edge będzie obsługiwał tłumaczenia z hiszpańskiego na angielski oraz z angielskiego na hiszpański, włoski, rosyjski i hindi. Prawdopodobnie w ślad za nimi pójdą inne języki. Ponadto planowane jest tłumaczenie w czasie rzeczywistym dla serwisów informacyjnych, takich jak Reuters, CNBC i Bloomberg.
Tłumacz Edge’a proponuje udostępnienie funkcji, którą YouTube testuje od lat, w całej przeglądarce. Niezależni YouTuberzy i firmy już od jakiegoś czasu udostępniają w serwisie filmy tłumaczone przez ludzi i z dubbingiem, ale w zeszłym roku YouTube ogłosił oficjalne wsparcie dla tego trendu. Od zeszłego roku YouTuberzy mogą przesyłać filmy z wieloma ścieżkami dźwiękowymi, a niewielka branża startupów pomaga niektórym z najpopularniejszych twórców treści dubbingować swoje filmy w wielu językach.
Chociaż niektóre z tych tłumaczeń korzystają z narzędzi sztucznej inteligencji w celu zapewnienia dokładności, są one również realizowane przez ludzi, by zapewnić precyzję. Ponieważ rozwiązanie firmy Microsoft będzie obsługiwać dowolny plik wideo na wielu stronach, prawdopodobnie będzie ono w pełni automatyczne, co może budzić wątpliwości dotyczące dokładności. Wiadomo, że ta w przypadku Tłumacza Google różni się znacznie w zależności od języka, a generatywna sztuczna inteligencja wciąż nie rozwiązała tzw. problemu halucynacji.
Na YouTube pojawiły się także podsumowania generowane przez sztuczną inteligencję, zarówno od Google, jak i Microsoftu. YouTube zaczął w zeszłym roku eksperymentować z podsumowaniami filmów, aby uzupełniać oficjalne opisy, a Edge może obecnie używać sztucznej inteligencji do podsumowywania oficjalnych transkrypcji filmów.
Zgłoś naruszenie/Błąd
Oryginalne źródło ZOBACZ
Dodaj kanał RSS
Musisz być zalogowanym aby zaproponować nowy kanal RSS