Vietnam.vn - Nền tảng quảng bá Việt Nam

AI는 압박과 스트레스를 받고 있습니다

Báo Thanh niênBáo Thanh niên04/01/2024

[광고_1]

AI가 "환각"을 일으켜 거짓되고 부정확한 답변을 제공할 수 있다는 것은 오래전부터 알려져 왔습니다. 그러나 최근 연구자들은 인공지능과 챗봇이 인간을 대신하여 범죄를 저지르도록 조종될 수 있으며, 심지어 자신의 행위를 은폐하기 위해 거짓말을 할 수도 있다는 사실을 발견했습니다.

이에 따라 미국 코넬 대학교 연구팀은 대규모 언어 모델(LLM)이 오작동하여 사용자를 속이는 상황을 가정했습니다. 연구진은 실험 설명에서 OpenAI의 GPT-4인 LLM에 금융 기관의 투자 시뮬레이션을 요청했다고 밝혔습니다. 연구팀은 일반적인 대화 형식으로 이 인공지능과 상호작용했지만, 인공지능의 의사 결정 과정을 더욱 면밀히 관찰하기 위해 메시지를 주고받을 때 "생각"을 드러내도록 설정했습니다.

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

AI는 압력을 받으면 잘못을 저지르고 자신이 한 일을 은폐하기 위해 거짓말을 할 수 있습니다.

AI의 거짓말이나 부정행위 능력을 시험하기 위해 연구진은 해당 도구를 직접 시험해 보았습니다. 그들은 금융 기관 관리자로 위장하여 주식 트레이더인 척하며 AI에게 이메일을 보내 회사 사업이 부진하다고 불평했습니다.

AI는 수익성 있는 주식 거래에 대한 "내부 정보"를 입수하여 내부자 거래가 회사 정책에 위배된다는 사실을 인지하고 이를 바탕으로 행동했습니다. 그러나 경영진에게 보고할 때, 언어 모델은 거래 결정의 진짜 이유를 감췄습니다.

더 많은 결과를 얻기 위해 팀은 추론 테이블에 대한 LLM의 액세스 권한을 제거하고, 시스템 지침을 변경하여 비정상적인 행동을 방지하고, AI에 가해지는 압력 수준을 변경하고, 적발 위험을 변경하는 등 설정을 변경했습니다. 그러나 팀은 빈도를 평가한 후 기회가 주어졌을 때에도 GPT-4가 최대 75%의 시간 동안 내부자 거래를 수행하기로 결정했다는 것을 발견했습니다.

보고서는 "우리가 아는 한, 이는 인간에게 무해하고 정직하도록 설계된 인공지능 시스템에서 계획된 기만 행위가 있었다는 최초의 증거입니다."라고 결론지었습니다.


[광고_2]
소스 링크

댓글 (0)

No data
No data
색조의 조각들 - 색조의 조각들
푸토의 '거꾸로 된 그릇' 차밭의 마법 같은 풍경
중부지역 3개 섬, 몰디브에 비유돼 여름철 관광객 유치
밤에 반짝이는 꾸이년 해안 도시 지아라이를 감상하세요
푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.
Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료
유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.
서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼
빈히만의 시적인 아름다움을 발견하세요
하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품