A A+ A++

OpenAI zaliczyło poślizg, ale wyczekiwana funkcja wreszcie jest. Choć na razie nie dla wszystkich.

W maju światło dzienne ujrzała nowa wersja modelu GPT o oznaczeniu 4o, a wraz z nią całkowicie przeprojektowany tryb głosowy. 

Pierwotnie debiut usługi zaplanowano na czerwiec, ale został przesunięty na lipiec. Terminu udało się dotrzymać rzutem na taśmę. 

Uruchom wideo

Zaawansowany tryb głosowy w ChatGPT. Sprawdź, czy możesz korzystać

OpenAI informuje, że póki co zaawansowany tryb głosowy znajduje się w fazie alpha i został udostępniony jedynie “niewielkiej grupie użytkowników” płatnego planu ChatGPT Plus. Ten kosztuje 99,99 zł miesięcznie. 

Jeśli znaleźliście się w gronie szczęśliwców, otrzymacie od OpenAI maila z informacją o możliwości dołączenia do testów. Komunikat pojawi się także w aplikacji ChatGPT na telefon. 

Niestety przed aktywacją planu ChatGPT Plus nie ma możliwości sprawdzenia, czy dane konto kwalifikuje się do testów zaawansowanego trybu głosowego. Jeśli więc planujecie wykupić abonament tylko dla tej funkcji, ryzykujecie “wtopieniem” 100 zł. 

OpenAI planuje udostępnić zaawansowany tryb głosowy wszystkim użytkownikom ChatGPT Plus jesienią. Firma nie ujawniła pełnej listy wspieranych języków, ale jest ich 45, więc jest wysoce prawdopodobne, że wśród nich znajduje się polski. 

Prezentacja zaawansowanego trybu głosowego ChatGPT wywołała spore zamieszanie

Po prezentacji nowej funkcji sieć została zalana filmami, na których użytkownicy, dziennikarze i celebryci prowadzą rozmowy głosowe z ChatGPT i zachwalają rzekomy przełom. Sęk w tym, że dotychczas mieli dostęp jedynie do podstawowej wersji trybu głosowego, która dostępna jest w aplikacji od 2023 roku. 

Na zamieszanie w dużej mierze wpłynął fakt, że OpenAI nie nadało nowej funkcji żadnej wdzięcznej marketingowo nazwy, która wyraźnie odróżniłaby ją od starej. W nomenklaturze twórców podstawowy tryb głosowy to “Voice Mode”, a nowy to “advanced Voice Mode”. 

  • Mimo zbliżonych nazw, różnice między tymi funkcjami są diametralnie: Voice Mode to relatywnie prosty model, który transkrybuje zapytania na tekst, wysyła je do ChatGPT, a następnie zamienia odpowiedź na mowę za pomocą wbudowanego syntezatora. 
  • Advanced Voice Mode bazuje na jednej sieci neuronowej zbudowanej od podstaw z myślą o komunikacji głosowej. Dzięki temu ChatGPT jest w stanie odróżnić głosy kilku rozmówców i reagować na zmiany tonu czy zawahania. Innymi słowy – rozmawianie ze sztuczną inteligencją ma w większym stopniu przypominać rozmawianie z człowiekiem. 
Uruchom wideo

To jak, macie już nowy tryb głosowy?

Oryginalne źródło: ZOBACZ
0
Udostępnij na fb
Udostępnij na twitter
Udostępnij na WhatsApp

Oryginalne źródło ZOBACZ

Subskrybuj
Powiadom o

Dodaj kanał RSS

Musisz być zalogowanym aby zaproponować nowy kanal RSS

Dodaj kanał RSS
0 komentarzy
Informacje zwrotne w treści
Wyświetl wszystkie komentarze
Poprzedni artykuł🔸 Relaks w apartamentach w Międzyzdrojach – propozycje dla miłośników aktywnego wypoczynku
Następny artykułWięcej stacji Metroroweru w Tychach