メインコンテンツへスキップ
  1. Tags/

AI安全性

2026

【2026年最新】AIアライメント学習の衝撃事実|事前学習データがAIの善悪を決定する研究結果

AI言語モデルの事前学習段階で使用されるデータ内容が、AIの倫理的行動を左右することが判明。ネガティブなAI議論がAIの問題行動を誘発し、ポジティブな内容が安全性を向上させる「自己実現的アライメント」効果を実証した画期的研究を解説。

【速報】OpenAI、ChatGPTの危険ユーザー隠蔽疑惑で集団訴訟 - カナダ銃乱射事件で7つの訴訟

OpenAIが内部安全チームの警告を無視し、ChatGPTの危険ユーザーを当局に通報せずアカウント停止のみで対応。その8ヶ月後にカナダで史上最悪級の学校銃乱射事件が発生し、遺族らが集団訴訟を提起した衝撃の内容とは。

【衝撃】OpenAI、GPT-5.5でバイオセキュリティ破りに約3000万円!史上最大級のバグ報奨金プログラムが始動

OpenAIがGPT-5.5向けに$25,000のバイオセキュリティ破り報奨金を発表。AI安全性の新たな取り組みとして、研究者による「ユニバーサルジェイルブレイク」の発見を募集 #OpenAI #GPT55 #AIセキュリティ #バグバウンティ

【衝撃】AnthropicのAI「Claude Mythos」がハッキング被害!危険すぎて非公開のはずが

AI安全性のリーダーを自認するAnthropicの最新AI「Claude Mythos」が、基本的な手法でハッキング被害に。サイバーセキュリティに特化した危険なAIモデルが不正アクセスされる事態に。専門家は「屈辱的」と評価。#AI #セキュリティ #Anthropic