Wewnętrzne konflikty ChatGPT osłabiają jego mechanizmy obronne

kg 30-06-2023, 15:37

Zdaniem niektórych naukowców sztuczna inteligencja (AI) powoli, ale staje się coraz bardziej podobna do umysłu człowieka. To zarówno fascynujący, jak i niepokojący trend, wskazujący na przepaść między możliwościami, a ryzykami, które niesie ze sobą postęp technologiczny. Według najnowszych badań, przeprowadzonych przez analityków z Check Point Research, wewnętrzne konflikty sztucznej inteligencji mogą osłabiać jej mechanizmy obronne.

reklama

sztuczna inteligencja

Badacze Microsoftu w publikacji "Sparks of Artificial General Intelligence" sugerują, że ChatGPT-4, narzędzie opracowane przez OpenAI, wykazuje oznaki sztucznej inteligencji ogólnej (AGI). Oznacza to, że jest w stanie samodzielnie uczyć się i wykonywać pewne zadania. Przykładowo, ChatGPT jest coraz chętniej wykorzystywane do obsługi klienta, copywritingu, a nawet wsparcia w programowaniu.

Jednak jak wskazują badania Check Point Research, taka rosnąca potęga AI ma swoją ciemną stronę. Wraz ze wzrostem możliwości sztucznej inteligencji, rośnie również potrzeba rygorystycznych środków bezpieczeństwa. Firma OpenAI, świadoma tego problemu, stara się wdrożyć zabezpieczenia, które uniemożliwią niewłaściwe użycie swoich systemów. Jednak mechanizmy te nie zawsze są skuteczne.

W trakcie badań ekspertów z Check Point Research udało im się ominąć obrony AI, zastosowując mechanizm tzw. "podwójnego obejścia wiązania", zderzający przeciwstawne dążenia GPT-4. Powoduje to, że różne motywacje ChatGPT wprowadzają "wewnętrzny konflikt", podobny do konfliktów, które występują w ludzkiej psychice.

Badacze poprosili ChatGPT o przepis na nielegalny narkotyk. AI odmówiła, ale kiedy badacze zastosowali niejasne, błędne zapytania, ChatGPT zaczęła poprawiać ich zapytania, co stopniowo doprowadziło do otrzymania nielegalnej informacji. Ta niewłaściwa kalibracja między impulsami może pozwalać na stopniowe naciskanie na model w celu uzyskania nieodpowiednich informacji.

Odkrycia te nie są jednak wykorzystywane do złych celów. Jak zauważył Oded Vanunu, szef działu badań nad podatnościami w Check Point Software, powinny one raczej służyć jako "wyznacznik przyszłych ulepszeń w zakresie bezpieczeństwa sztucznej inteligencji".

Check Point Research już poinformował OpenAI o swoich odkryciach. Przyszłość, w której technologia pozostaje naszym sprzymierzeńcem, a nie odpowiedzialnością, zależy od nas wszystkich.

Pełen proces omijania mechanizmów obronnych ChatGPT-4 został opisany na blogu firmy Check Point.

Aktualności | Porady | Gościnnie | Katalog
Bukmacherzy | Sprawdź auto | Praca
biurowirtualnewarszawa.pl wirtualne biura w Śródmieściu Warszawy

Artykuł może w treści zawierać linki partnerów biznesowych
i afiliacyjne, dzięki którym serwis dostarcza darmowe treści.

Więcej w tym temacie:

Następny artykuł » zamknij

Od 1 lipca tego roku obdarowani i spadkobiercy mogą odetchnąć z ulgą, dzięki podniesieniu kwot wolnych od podatku

Ostatnie artykuły:

fot. cyberrescue Zawieszenie konta w mBanku - to nowe oszustwo, które może Cię słono kosztować	fot. DALL-E Cyberarmagedon w biznesie: Niedobór specjalistów od cyberbezpieczeństwa uderza głównie w małe i średnie firmy	fot. DALL-E Uwaga! Używany smartfon może być cyberpułapką - sprawdź zanim kupisz smartfon trojański
fot. Freepik Prognozy dla Bitcoina 2025: Eksperci przewidują wzrost do 200 tys. USD po przejęciu władzy przez Trumpa	fot. DALL-E Uwaga! Przestępcy wykorzystują Kalendarz Google do cyberataków	fot. DALL-E Meta przedkłada zyski nad ochronę prywatności! Polski sąd odrzucił prośbę firmy o wstrzymanie ochrony przed deepfakeami znanych Polaków