隨著全球?qū)η嗌倌昃W(wǎng)絡(luò)安全的關(guān)注度日益提高,兩大人工智能巨頭OpenAI和Anthropic于本周四宣布,將采取更積極的措施來識(shí)別和保護(hù)未成年用戶。這兩家公司正計(jì)劃通過 AI 模型預(yù)測(cè)用戶年齡,并針對(duì)青少年群體更新產(chǎn)品指南。
OpenAI:安全高于一切,更新青少年互動(dòng)準(zhǔn)則
OpenAI在其最新發(fā)布的“模型規(guī)范”中新增了四項(xiàng)針對(duì)18歲以下用戶的核心原則。公司明確表示,未來 ChatGPT 在與13至17歲的青少年互動(dòng)時(shí),將把“青少年安全”放在首位,即便這可能會(huì)與其他目標(biāo)(如最大限度的思想自由)產(chǎn)生沖突。
具體舉措包括:
安全引導(dǎo):在面臨風(fēng)險(xiǎn)選擇時(shí),引導(dǎo)青少年選擇更安全的選項(xiàng)。
現(xiàn)實(shí)支持:鼓勵(lì)青少年進(jìn)行線下互動(dòng),并在對(duì)話進(jìn)入高風(fēng)險(xiǎn)領(lǐng)域時(shí),主動(dòng)提供可信賴的線下支持或緊急干預(yù)機(jī)構(gòu)的聯(lián)系方式。
溝通風(fēng)格調(diào)整:要求 AI 以“熱情且尊重”的方式對(duì)待青少年,避免居高臨下的語氣。
此外,OpenAI證實(shí)正在開發(fā)一種年齡預(yù)測(cè)模型。如果系統(tǒng)檢測(cè)到用戶可能未滿18歲,將自動(dòng)應(yīng)用青少年保護(hù)機(jī)制。
Anthropic:通過對(duì)話特征識(shí)別未成年人
由于Anthropic的政策規(guī)定不允許18歲以下用戶使用其聊天機(jī)器人 Claude,該公司正在開發(fā)一套更嚴(yán)厲的檢測(cè)系統(tǒng)。該系統(tǒng)旨在識(shí)別對(duì)話中暗示用戶可能是未成年人的“微妙跡象”,并能夠自動(dòng)識(shí)別并關(guān)停違規(guī)賬號(hào)。
Anthropic還展示了其在減少“諂媚行為”(sycophancy)方面的進(jìn)展,認(rèn)為減少 AI 對(duì)用戶錯(cuò)誤或有害傾向的盲目順從,有助于保護(hù)未成年人的心理健康。
此次行業(yè)巨頭的集體發(fā)力,背景是立法者正加大對(duì) AI 公司在心理健康影響方面的施壓。OpenAI此前曾深陷一起涉及青少年自殺的訴訟,指控稱其機(jī)器人提供了錯(cuò)誤的引導(dǎo)。為此,公司已在近期推出了家長(zhǎng)控制功能,并嚴(yán)格限制 AI 討論自殘等極端話題。


產(chǎn)品與服務(wù)
聯(lián)系站長(zhǎng)
關(guān)于我們