OpenAI zaliczyło poślizg, ale wyczekiwana funkcja wreszcie jest. Choć na razie nie dla wszystkich.
W maju światło dzienne ujrzała nowa wersja modelu GPT o oznaczeniu 4o, a wraz z nią całkowicie przeprojektowany tryb głosowy.
Pierwotnie debiut usługi zaplanowano na czerwiec, ale został przesunięty na lipiec. Terminu udało się dotrzymać rzutem na taśmę.
Zaawansowany tryb głosowy w ChatGPT. Sprawdź, czy możesz korzystać
OpenAI informuje, że póki co zaawansowany tryb głosowy znajduje się w fazie alpha i został udostępniony jedynie “niewielkiej grupie użytkowników” płatnego planu ChatGPT Plus. Ten kosztuje 99,99 zł miesięcznie.
Jeśli znaleźliście się w gronie szczęśliwców, otrzymacie od OpenAI maila z informacją o możliwości dołączenia do testów. Komunikat pojawi się także w aplikacji ChatGPT na telefon.
Niestety przed aktywacją planu ChatGPT Plus nie ma możliwości sprawdzenia, czy dane konto kwalifikuje się do testów zaawansowanego trybu głosowego. Jeśli więc planujecie wykupić abonament tylko dla tej funkcji, ryzykujecie “wtopieniem” 100 zł.
OpenAI planuje udostępnić zaawansowany tryb głosowy wszystkim użytkownikom ChatGPT Plus jesienią. Firma nie ujawniła pełnej listy wspieranych języków, ale jest ich 45, więc jest wysoce prawdopodobne, że wśród nich znajduje się polski.
Prezentacja zaawansowanego trybu głosowego ChatGPT wywołała spore zamieszanie
Po prezentacji nowej funkcji sieć została zalana filmami, na których użytkownicy, dziennikarze i celebryci prowadzą rozmowy głosowe z ChatGPT i zachwalają rzekomy przełom. Sęk w tym, że dotychczas mieli dostęp jedynie do podstawowej wersji trybu głosowego, która dostępna jest w aplikacji od 2023 roku.
Na zamieszanie w dużej mierze wpłynął fakt, że OpenAI nie nadało nowej funkcji żadnej wdzięcznej marketingowo nazwy, która wyraźnie odróżniłaby ją od starej. W nomenklaturze twórców podstawowy tryb głosowy to “Voice Mode”, a nowy to “advanced Voice Mode”.
- Mimo zbliżonych nazw, różnice między tymi funkcjami są diametralnie: Voice Mode to relatywnie prosty model, który transkrybuje zapytania na tekst, wysyła je do ChatGPT, a następnie zamienia odpowiedź na mowę za pomocą wbudowanego syntezatora.
- Advanced Voice Mode bazuje na jednej sieci neuronowej zbudowanej od podstaw z myślą o komunikacji głosowej. Dzięki temu ChatGPT jest w stanie odróżnić głosy kilku rozmówców i reagować na zmiany tonu czy zawahania. Innymi słowy – rozmawianie ze sztuczną inteligencją ma w większym stopniu przypominać rozmawianie z człowiekiem.
To jak, macie już nowy tryb głosowy?
Zgłoś naruszenie/Błąd
Oryginalne źródło ZOBACZ
Dodaj kanał RSS
Musisz być zalogowanym aby zaproponować nowy kanal RSS