Jeszcze nigdy perspektywa zostania międzynarodowym prezenterem telewizyjnym nie była tak realna jak dziś. Za sprawą odpowiednich narzędzi możemy dzielić się z innymi swoją wiedzą i to w kilku językach, bez potrzeby ich dobrej znajomości. Pamiętacie magiczne obrazy z książek o Harrym Potterze, które mogły się ruszać i mówić? Wszystko to jest zaledwie częścią funkcjonalności HeyGen, czyli przełomowego rozwiązania bazującego na sztucznej inteligencji (AI) do tworzenia i modyfikowania wideo. W tym artykule przyjrzymy się możliwościom tego programu, omówimy jego działanie i dostępne opcje oraz przeanalizujemy szanse dot. generowania filmów wideo za pośrednictwem AI.
Generator wideo AI – Rewolucja w tworzeniu filmów AI
Narzędzie to swoje powstanie zawdzięcza Wayne’owi Liangowi oraz Joshui Xu, którzy w listopadzie 2020 roku stworzyli platformę o nazwie HeyGen. Pierwotnie nazywała się ona “Movio”, ale panowie szybko postanowili dokonać jej rebrandingu. Od początku zamysł był taki, by dać użytkownikom możliwość tworzenia animacji wideo przy udziale generatywnej sztucznej inteligencji (AI). Przełom nastąpił niecałe 3 lata później, gdy we wrześniu 2023 roku ich startup zaprezentował światu nową funkcję.
Była to opcja zmiany języka mowy na nagraniu oraz modyfikowania ruchu ust i mimiki twarzy w taki sposób, by wyglądało to jak najbardziej autentycznie. Ale to tylko jedno z rozwiązań, które stały się gamechangerem dla wielu twórców – rzućmy więc okiem na pozostałe.
Jak działa generator wideo AI?
Pierwszą rzeczą, którą robimy po wejściu na oficjalną stronę HeyGen, jest rejestracja naszego konta. Możemy założyć konto podając nasz adres mailowy lub dokonać tego przy pomocy naszego profilu na Facebook (Meta), jeżeli taki posiadamy. Następnie wybieramy jeden z 10 celów, na potrzeby którego chcemy generować nasze wideo. System będzie kazał nam także wybrać, w jakiej branży zawodowej działamy na co dzień, ile osób jest zatrudnionych w firmie, w której pracujemy oraz jakiego rodzaju treści zamierzamy tworzyć. Dość powszechna procedura, której w tym przypadku nie da się obejść.
Pozwala ona oczywiście na lepsze dopasowanie dostępnych zasobów programu do naszych preferencji. Później przyjdzie nam stworzyć swój awatar i zapoznać się z instrukcją – w formie pisanej lub z nagrania, na którym przez proces ten przeprowadza nas nikt inny, jak tylko Joshua Xu, czyli CEO firmy stojącej za tym narzędziem, a dokładnie jego wygenerowany awatar AI. W tym celu musimy wgrać na platformę nasz pierwowzór, czyli nagranie z naszą osobą.
Ważne jest, by nasze nagranie było w dobrej jakości, więc nie zaleca się korzystania z kamerki internetowej przy jego realizacji. Jego minimalna długość powinna wynosić przynajmniej 2 minuty, w trakcie nagrywania musimy patrzeć prosto w stronę kamery, a wypowiadane przez nas słowa powinny zawierać odpowiednie przerwy czasowe, by AI było w stanie jak najlepiej odwzorować ruch naszych ust. Potem musimy przesłać jeszcze jedno nagranie, na którym wygłaszamy oświadczenie w języku angielskim, że posiadamy prawo do naszego wizerunku i wyrażamy zgodę, aby system platformy HeyGen wygenerował na jego podstawie awatara AI.
Oczywiście mamy tu także możliwość korzystania z gotowych szablonów postaci, które jesteśmy w stanie modyfikować według własnych preferencji. Platforma oferuje 100 różnych wariantów z podziałem na grupy etniczne czy wiek naszego awatara. Możemy je także ubierać w zależności od potrzeb uwarunkowanych charakterem naszego nagrania. No dobra, to skoro mamy już swojego przedstawiciela w cyfrowym świecie, to możemy przejść do omawiania funkcji, jakie oferuje to narzędzie.
Do czego możemy używać generatora wideo AI?
Tworzenie wideo przy pomocy sztucznej inteligencji (AI) pozwala nam generować materiały multimedialne w różnych formatach, z każdego miejsca na Ziemi, nie ruszając się z domu.
Klonowanie głosu
Ta funkcja staje się coraz powszechniejsza wśród tego typu narzędzi, ale w przypadku HeyGen jej działanie nie pozostawia żadnych wątpliwości w stosunku do finalnego efektu. Wystarczy, że dostarczysz programowi próbki głosu w formie nagrania, które trwa od 2 do 10 minut i jest pozbawione niepotrzebnych szumów czy innych przeszkadzających dźwięków. Po przetworzeniu naszego głosu przez AI możemy go wykorzystywać do generowania kolejnych nagrań z naszym awatarem. Jest to doskonałe rozwiązanie, jeśli pracujemy na co dzień z głosem, a nagle dopada nas choroba, która czasowo wyłącza nas z gry.
Aktualnie (stan na luty 2024) mamy do wyboru 8 języków, w których możemy zarejestrować nasz głos: angielski, niemiecki, polski, hiszpański, włoski, francuski, portugalski oraz… hindi. Myślę, że to tylko kwestia czasu, aż twórcy dodadzą do platformy chociażby chiński (który zresztą właśnie został dodany, przyp. red. dn. 12.03.2024) czy japoński, by zwiększyć jej użyteczność.
Twórz nagrania wideo w obcych językach
Wspominałem już o zmianie języka mowy, jakim operujemy na naszym nagraniu. Dzięki tej funkcji możemy przełamywać bariery językowe i docierać ze swoim contentem wideo w najdalsze zakątki świata. Nie musimy już zatrudniać lektorów czytających w obcych językach ani generować napisów z tłumaczeniem tego, co mówimy w filmie. Wszystko to zrobi za nas AI, idealnie synchronizując ruch naszych awatarowych ust oraz mimikę twarzy z mową w zagranicznym języku. Do wyboru mamy aż 50 różnych języków, więc świat stoi przed nami otworem. Jedyne, co musimy zrobić, to napisać skrypt tekstu, który sztuczna inteligencja przetłumaczy na obcy dialekt, w którym nasz awatar będzie mówić na nagraniu.
Zamiana twarzy
Ta opcja pozwala nam przedstawić swojego awatara w zupełnie nowej roli. Chcesz zobaczyć się na ekranie jako superbohater z ulubionej kreskówki, który ratuje świat? Nic prostszego. W tym wypadku wystarczy wgrać dobrej jakości zdjęcie naszej twarzy, a AI podłoży ją i perfekcyjnie połączy z sylwetką dostępnych awatarów.
Tchnij nowe życie w postacie na zdjęciach
Skoro jesteśmy w stanie stworzyć własnego awatara, który będzie mówić naszym głosem w obcych językach na nagraniu wideo, logiczne jest, że technologia pozwala też na ożywianie zdjęć czy portretów. Wyobraź sobie zdjęcie swojego idola, który zwraca się do ciebie z komputera w wybranym języku. Brzmi jak dobra zabawa, prawda?
HeyGen nie jest perfekcyjny
Jak widać na załączonych próbkach, HeyGen nie jest perfekcyjny, ale do stworzenia takich filmów wymagana jest w zasadzie jedynie krótka próbka głosu i twarzy, którą na dodatek oczywiście można udoskonalać w zależności od potrzeb. My byliśmy zaskoczeni przede wszystkim tym, że HeyGen, z zaledwie dwuminutowego wideo, w którym opowiadaliśmy o pożarach lasów szyszkowych i pogodzie panującej na Wenus, zdołał przy pomocy dedykowanego scenariusza wygenerować… wszystko. A powiemy więcej – więcej niż wszystko, ponieważ nie miał absolutnie żadnych problemów z konwersją danej próbki na… inne języki. W trakcie testów próbka języka niemieckiego i angielskiego wypadły wyśmienicie.
Ile kosztuje generator wideo AI?
HeyGen, na bazie którego tworzyliśmy ten artykuł, jest narzędziem płatnym, ale wiele z jego funkcji możemy przetestować na naszym koncie całkowicie za darmo. Dostęp do określonych opcji jest zależny od pakietu, jaki zdecydujemy się wykupić. Poniżej omówię po kolei zakres możliwości uwarunkowany każdym z nich.
- Darmowa wersja
Dużą zaletą jest fakt, że rozpoczęcie korzystania z HeyGen w bezpłatnej wersji nie wymaga od nas podpięcia karty kredytowej. W tym przypadku otrzymujemy na start do wykorzystania jeden kredyt, który umożliwia wygenerowanie jednego wideo, które nie będzie przekraczało długością 1 minuty. Możemy przy tym skorzystać z któregoś ze 120 gotowych awatarów, które mają do wyboru aż 300 wariantów głosowych we wszystkich dostępnych językach. Za darmo możemy stworzyć jednego awatara na podstawie dostarczonych materiałów. Gdy takie nagranie jest już gotowe, możemy je od razu udostępnić na naszych kanałach społecznościowych, dodać do niego napisy czy po prostu pobrać na nasze urządzenia. Co ważne, nie jesteśmy ograniczeni do słabej jakości, tylko mamy do wyboru download w rozdzielczości 720P oraz 1080P. Jedyną wadą będzie tutaj znak wodny, którego nie ma już w przypadku wersji płatnych.
- Creator (29 dolarów miesięcznie/ 24 dolary przy subskrypcji rocznej)
Z tym pakietem otrzymujemy 15 kredytów, co jest równoznaczne z taką samą liczbą filmów do wygenerowania w danym miesiącu. W tym przypadku maksymalny czas ich trwania to jednak aż 5 minut. Możemy stworzyć do 3 awatarów i dopiero na tym poziomie cenowym skorzystać z opcji klonowania głosu.
- Biznes Plan (89 dolarów miesięcznie/ 72 dolary przy subskrypcji rocznej)
Ta opcja jest dedykowana twórcom działającym zespołowo, bo z jednego konta mogą korzystać aż 3 osoby. Nie sprawia to jednak, że łącznie możemy wygenerować aż 9 awatarów, tylko nadal możemy ich stworzyć wyłącznie 3. Miesięczna ilość kredytów to 30, a nasze filmy mogą już trwać nawet 20 minut i być eksportowane w rozdzielczości 4K. Ponadto otrzymujemy indywidualne API oraz zestaw marki.
Generatory wideo AI – HeyGen vs. Synthesia
Każdy z nas lubi mieć wybór, warto więc zbadać alternatywne rozwiązania. W przypadku generatorów wideo AI takim godnym uwagi wyborem jest Synthesia. Jak wypada w porównaniu z HeyGen?
Awatary
Jeżeli chodzi o awatary, to HeyGen posiada o kilkadziesiąt postaci więcej do wyboru, bo Synthesia zamyka się w 100 awatarach. Ma jednak pewną przewagę nad rywalem, gdyż jej awatary są zdolne do wykonywania pewnych gestów w trakcie mowy, czego brakuje w HeyGen. To z kolei w naprawdę małym stopniu, ale jednak, wypada lepiej, jeśli chodzi o synchronizację ust z mową. Dodatkowym atutem jest opcja Face Swap, czyli wspomnianej zamiany twarzy, czego w przypadku Synthesia nie uświadczymy.
Głos
Na wstępie trzeba zaznaczyć, że Synthesia posiada o wiele bogatszą ofertę, jeśl chodzi o wybór języków obcych. HeyGen ma ich tylko 50, a jego rywal 70. Jednakże przy tym pierwszym narzędziu mamy większe pole manewru, jeśli chodzi o modyfikację akcentów, bo oferuje ich ono aż 300, podczas gdy Synthesia tylko 130. W przypadku Synthesia nie ma także możliwości wgrania swojej próbki głosu, co jest sporym minusem.
Cena
Jeżeli chodzi o kwestię ceny za jeden i drugi generator, to pod względem testowania wygrywa HeyGen. Powód? W przypadku Synthesii nie możemy w ogóle wypróbować za darmo możliwości tego narzędzia, nawet w wersji demo. Pakiet “Starter” kosztuje miesięcznie 29 dolarów miesięcznie, a w przypadku subskrypcji rocznej 22 dolary. W jego ramach możemy stworzyć tylko jednego awatara, który może korzystać ze 120 dostępnych języków.
Ochrona danych osobowych. Kto ma prawa do naszego wizerunku?
Na koniec omówimy jeszcze kwestię zgodności z prawem w przypadku generowania wideo przy pomocy sztucznej inteligencji. Nietrudno jest się domyślić, że wraz postępem technologicznym pojawiają się nowe zagrożenia ze strony cyberprzestępców i dochodzi do nadużyć z wykorzystaniem AI. Chociaż na świecie dopiero powstają pierwsze regulacje dotyczące technologii generatywnej sztucznej inteligencji, to dostawcy tego typu rozwiązań, tj. producenci takich narzędzi jak HeyGen, są zobowiązani przestrzegać zasad dot. ochrony danych osobowych swoich klientów w danym regionie.
Sami musimy zadbać o swój wizerunek
Jak możemy przeczytać na oficjalnej stronie tej firmy, jej polityka prywatności nie obejmuje swoim zasięgiem zewnętrznych stron internetowych ani platform obsługiwanych przez osoby trzecie, do których mogą nas zaprowadzić łącza internetowe z ich platformy (niezależnie od tego, czy są one udostępniane przez zespół firmy, czy przez użytkowników platformy). Tak więc dostawca tego typu rozwiązań nie ponosi odpowiedzialności za to, do czego w przyszłości zostaną wykorzystywane treści generowane za pośrednictwem jego platformy.
– Nie ponosimy odpowiedzialności za prywatność, bezpieczeństwo lub informacje znalezione na tych stronach lub platformach, ani za dokładność, kompletność lub wiarygodność materiałów stron trzecich i nie mamy kontroli nad sposobem gromadzenia, przechowywania lub wykorzystywania Twoich danych przez inne strony internetowe. Zamieszczenie przez nas jakichkolwiek łączy do witryn internetowych lub platform stron trzecich samo w sobie nie oznacza żadnego poparcia treści takich platform ani ich właścicieli lub operatorów – możemy przeczytać w zakładce dot. prywatności.
Z powyższego jasno wynika, że tworząc swojego awatara, który może przedstawiać nasz wizerunek, a następnie publikując w Internecie nagranie wideo z jego udziałem, sami jesteśmy odpowiedzialni za dalszy los naszego wizerunku w mediach.
Generatory wideo to przyszłość… i to niedaleka
Dzięki sztucznej inteligencji możemy dziś przekraczać kolejne bariery, z jakimi dotychczas musieliśmy się mierzyć w kwestii tworzenia profesjonalnych nagrań wideo. Nie potrzebujemy już wysokobudżetowego sprzętu do rejestrowania obrazu i nie musimy nadawać ze studia filmowego. Najważniejsze wydaje się jednak przełamywanie barier językowych, które ograniczały dotąd zasięg naszego contentu i dotarcie z materiałami do szerszej grupy odbiorców.
Dzięki technologii tworzenia awatarów AI jesteśmy również w stanie przygotować tzw. “plan B” na wypadek, gdyby nasz wygląd zewnętrzny czy kwestie emisji głosu miały nas w danym momencie zawieść. Jestem pewny, że z czasem sztuczna inteligencja będzie poszerzać zakres naszych możliwości przy generowaniu filmów wideo, a jedynym ograniczeniem pozostanie nasza wyobraźnia.
Dodaj kanał RSS
Musisz być zalogowanym aby zaproponować nowy kanal RSS