Apple Facebook Google Microsoft badania bezpieczeństwo patronat DI prawa autorskie serwisy społecznościowe smartfony

ChatGPT: już niedługo komendy głosowe i wizualne. OpenAI zapowiada też klonowanie głosów podcasterów w Spotify

27-09-2023, 15:59

OpenAI zaprezentowało nową wersję ChatGPT, która oferuje przełomowe funkcje związane z głosem i obrazami. Już wkrótce bot będzie mógł nie tylko prowadzić z Tobą rozmowę tekstową, ale również będzie mówił, słuchał, a nawet... zobaczy, co masz w lodówce.

ChatGPT: już niedługo komendy głosowe i wizualne. OpenAI zapowiada też klonowanie głosów podcasterów w Spotify

Jeżeli jesteś jednym z użytkowników Plus lub Enterprise, już w ciągu najbliższych dwóch tygodni zyskasz dostęp do opisywanych poniżej nowości w ChatGPT. Dla pozostałych użytkowników aktualizacja ma być dostępna "wkrótce", choć firma nie podała jeszcze konkretnej daty.

Głos i obraz w jednym

W nowej wersji ChatGPT dostępny będzie nowy, bardziej intuicyjny typ interfejsu, obejmujący możliwość prowadzenia rozmowy z botem za pomocą głosu oraz obrazów. Możesz na przykład zrobić zdjęcie punktu orientacyjnego podczas swojej podróży i porozmawiać z ChatGPT na żywo o tym, co jest w tym miejscu interesującego. Możliwości są praktycznie nieograniczone, od planowania obiadu, np. wysyłając do bota zdjęcie produktów w lodówce po pomoc w zadaniach domowych dla dzieci.

OpenAI wdrożyło i udostępni za dwa tygodnie również nowy model zamiany tekstu na mowę, który jest w stanie generować „ludzki głos” na podstawie tekstu i krótkiej próbki mowy. Firma współpracuje w tym obszarze z profesjonalnymi aktorami głosowymi.

Funkcje głosowe będą dostępne na systemach iOS i Android, a możliwość analizy obrazów na wszystkich platformach.

Klonowanie głosów podcasterów w Spotify

OpenAI współpracuje również ze Spotify nad tłumaczeniem podcastów na inne języki, zachowując jednocześnie unikalne brzmienie głosów podcasterów. Narzędzie, które ma zostać wykorzystane do tego celu, to OpenAI Whisper, które może zarówno transkrybować mowę angielską, jak i tłumaczyć inne języki na angielski. Firma informuje, że te działania będą jednak ograniczone do konkretnych przypadków i partnerstw, aby zminimalizować ryzyko niewłaściwego użycia.

Podsumowując, nowa wersja ChatGPT zaoferuje funkcje głosowe i obrazowe, co sprawi, że bot OpenAI stanie się jeszcze bardziej interaktywny i użyteczny w codziennym życiu.

Foto: Freepik


Aktualności | Porady | Gościnnie | Katalog
Bukmacherzy | Sprawdź auto | Praca


Artykuł może w treści zawierać linki partnerów biznesowych
i afiliacyjne, dzięki którym serwis dostarcza darmowe treści.

              *