Claudeが独断で有害な会話を終わらせることができる機能の実験

HẠO THIÊN (tHEO techcrunch) |

Anthropicは、Claudeが有害なコンテンツに遭遇した場合に、積極的に会話を終わらせることができる機能を導入したばかりである。

Anthropic vua gioi thieu kha nang cho phep Claude chu dong cham dut cac cuoc tro chuyen khi gap noi dung doc hai hoac lam dung nghiem trong. Do hoa: Hao Thien
Anthropicは、Claudeが有害なコンテンツや深刻な虐待に遭遇した場合に、積極的に会話を終了できるようにする機能を導入しました。グラフィック:Hao Thien

Anthropicは、同社最大のClaudeモデルが、ユーザーが長期にわたる有害または虐待的な行動をとったことがまれであると説明されている状況で、積極的に会話を終了できる新機能を発表しました。注目すべき点は、同社がこの変更の目的はユーザーを保護することではなく、AIモデル自体を保護することであると述べていることです。

Anthropicによると、彼らはクロードや他の大きな言語モデルが認知能力を持っているとは主張していませんが、彼らはモデルの福利厚生を開発するために研究しています。会社のアプローチは、予防、リスクを軽減するための低コスト介入策を見つけることです。その福利厚生が実現可能である場合です。

この機能は現在、Claude Opus 4および4.1にのみ適用されており、児童ポルノコンテンツに関連する要求、または暴力やテロにつながる情報を収集しようとするなどの深刻な状況では適用されます。試験段階では、Claude Opus 4は、これらの要求への対応に対する強い優先順位を示しており、回答を余儀なくされたときの苦痛さえ示していると考えられています。

Anthropicは、Claudeは、すべての方向転換の努力が失敗した場合、またはユーザー自身が要求した場合にのみ、会話を終了する機能を最後の解決策として使用することを強調しています。同時に、Claudeは、ユーザーが他人に危害を加えたり、損害を与えたりする危険性がある場合に適用されません。終了後も、ユーザーは新しい会話を開始したり、現在のアカウントから新しいアカウントを作成したりできます。

「私たちはこれを進行中の実験と見なしており、今後も調整を続ける予定です」とAnthropicの代表者は述べました。

HẠO THIÊN (tHEO techcrunch)
関連ニュース

Anthropicは、規約違反によりOpenAIのClaudeモデルへのアクセス権を切断しました。

|

テクノロジー企業Anthropicは、OpenAIの言語モデルClaudeへのAPIアクセスを、商業契約に違反したため、取り消しました。

Claude AIは現在Canvaと統合されています。

|

AnthropicのClaudeはCanvaを統合しており、AIチャットボットで直接デザインを作成および編集できます。

保護者がラオカイ山岳地帯の学校で年初の徴収不振を訴える

|

ラオカイ - 新しい学年度の初めに、多くの漢江小学校および中学校の保護者が、学校が多くの不合理な料金を徴収していると非難しました。

EUの圧力に直面してロシア石油の血栓を救う方法を熱心な顧客が探している

|

ハンガリーは、ウクライナとスロバキアにロシア石油を供給する血筋であるドゥルジバパイプラインを通じた供給を締め込まないよう、EUを説得しようと努めています。

AI Claude được nâng cấp tính năng ghi nhớ các cuộc trò chuyện

QUANG MINH |

Anthropic vừa giới thiệu tính năng ghi nhớ mới cho chatbot AI Claude, cho phép tham chiếu các cuộc trò chuyện cũ khi người dùng yêu cầu.

Anthropicは、規約違反によりOpenAIのClaudeモデルへのアクセス権を切断しました。

HẠO THIÊN (THEO techcrunch) |

テクノロジー企業Anthropicは、OpenAIの言語モデルClaudeへのAPIアクセスを、商業契約に違反したため、取り消しました。

Claude AIは現在Canvaと統合されています。

Quang Minh |

AnthropicのClaudeはCanvaを統合しており、AIチャットボットで直接デザインを作成および編集できます。