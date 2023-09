Jeżeli jesteś jednym z użytkowników Plus lub Enterprise, już w ciągu najbliższych dwóch tygodni zyskasz dostęp do opisywanych poniżej nowości w ChatGPT. Dla pozostałych użytkowników aktualizacja ma być dostępna "wkrótce", choć firma nie podała jeszcze konkretnej daty.

Głos i obraz w jednym

W nowej wersji ChatGPT dostępny będzie nowy, bardziej intuicyjny typ interfejsu, obejmujący możliwość prowadzenia rozmowy z botem za pomocą głosu oraz obrazów. Możesz na przykład zrobić zdjęcie punktu orientacyjnego podczas swojej podróży i porozmawiać z ChatGPT na żywo o tym, co jest w tym miejscu interesującego. Możliwości są praktycznie nieograniczone, od planowania obiadu, np. wysyłając do bota zdjęcie produktów w lodówce po pomoc w zadaniach domowych dla dzieci.

OpenAI wdrożyło i udostępni za dwa tygodnie również nowy model zamiany tekstu na mowę, który jest w stanie generować „ludzki głos” na podstawie tekstu i krótkiej próbki mowy. Firma współpracuje w tym obszarze z profesjonalnymi aktorami głosowymi.

Funkcje głosowe będą dostępne na systemach iOS i Android, a możliwość analizy obrazów na wszystkich platformach.

Klonowanie głosów podcasterów w Spotify

OpenAI współpracuje również ze Spotify nad tłumaczeniem podcastów na inne języki, zachowując jednocześnie unikalne brzmienie głosów podcasterów. Narzędzie, które ma zostać wykorzystane do tego celu, to OpenAI Whisper, które może zarówno transkrybować mowę angielską, jak i tłumaczyć inne języki na angielski. Firma informuje, że te działania będą jednak ograniczone do konkretnych przypadków i partnerstw, aby zminimalizować ryzyko niewłaściwego użycia.

Podsumowując, nowa wersja ChatGPT zaoferuje funkcje głosowe i obrazowe, co sprawi, że bot OpenAI stanie się jeszcze bardziej interaktywny i użyteczny w codziennym życiu.

Foto: Freepik