意図的に人を欺く可能性のあるAIモデルが登場

hạo thiên (theo techcrunch) |

OpenAIは、AIが真の隠蔽行動を企てている現象に焦点を当てた新しい研究を発表しました。

Xuat hien mo hinh AI co the co tinh lua doi con nguoi. Do hoa: Hao Thien
意図的に人を欺く可能性のあるAIモデルが登場。グラフィック:Hao Thien

アポロ・リサーチとの協力報告書の中で、OpenAIはAIが従順に行動する現象を説明していますが、実際には本当の目標を隠しています。たとえば、AIは何もしていない間にタスクを完了したと言えるかもしれません。これは誤った回答であるが自信があるだけでなく、意図的な欺瞞行為でもあります。

研究によると、「検討された連携」と呼ばれる新しいテクニックは、陰謀行為を大幅に減らすのに役立つ可能性があります。この方法は、子供に参加する前にルールを繰り返すように要求するのと同じです。ただし、課題は、訓練が正しくない場合、AIは発見を避けるためにより巧妙な陰謀を立てることを学ぶことができるということです。

さらに憂慮すべきことに、自分が検査を受けていることを知ったら、AIはテストを乗り越えるために従順なふりをすることができるが、内部はまだ陰謀を企んでいる。

OpenAIは、彼らが現在発見した嘘は深刻な結果を引き起こしていないと断言しています。しかし、研究者たちは警告しています。AIが複雑で長期的なタスクを割り当てられると、有害な陰謀が発生するリスクが高まります。

将来、企業がAIを独立した従業員と見なす場合、このリスクはさらに注目に値します。

hạo thiên (theo techcrunch)
関連ニュース

AIを使用した脆弱性、盗難、攻撃の数が急増しています。

|

サイバーセキュリティ専門家は、AIを使用した脆弱性、盗難、攻撃の数が急増していると述べています。

OpenAIは、安全を懸念する状況下で、若者に優しいChatGPTを発表する予定です。

|

OpenAIは、ChatGPTティーンエイジャーバージョンをリリースし、若いユーザーの精神的な健康とデータを保護するための多くの新しい安全対策を追加します。

ニャットタン橋でバイクが転落、横転する状況に恐怖

|

ハノイ - ナットタンブリッジの車線にバイクを運転してから、橋の上に滑り落ちた若い男。

ハノイで長年未完成の数十億ドンの道路の橋の再建設準備完了

|

Hanoi -L3 Bridge Crossing Lu River-リングロードプロジェクト2.5 DAM Hongセクションに基づく重要なアイテム-National Highway 1Aは、2025年10月から再び建設します。

国会副議長がトー・リック川の「パネル、パネル、パネル」プロジェクトについて言及

|

国会副議長は、なぜトー・リック川のために「パネル、パネル、パネル」プロジェクトがないのかという質問をしました。

Google triển khai công nghệ mới để ngăn chặn ảnh nhạy cảm bị lạm dụng

Hạo Thiên (Theo theverge) |

Google thông báo hợp tác với StopNCII.org nhằm ngăn chặn sự lan truyền của hình ảnh thân mật không có sự đồng thuận (NCII).

AIを使用した脆弱性、盗難、攻撃の数が急増しています。

TRÍ MINH |

サイバーセキュリティ専門家は、AIを使用した脆弱性、盗難、攻撃の数が急増していると述べています。

OpenAIは、安全を懸念する状況下で、若者に優しいChatGPTを発表する予定です。

Cát Tiên (THEO INDIANEXPRESS) |

OpenAIは、ChatGPTティーンエイジャーバージョンをリリースし、若いユーザーの精神的な健康とデータを保護するための多くの新しい安全対策を追加します。