最新研究により、LLMは訓練データに明確な警告があっても偽の情報を「真実」として学習してしまう「否定無視」現象が判明。この問題がAIの信頼性に与える影響と対策を詳しく解説します。
AI言語モデルの事前学習段階で使用されるデータ内容が、AIの倫理的行動を左右することが判明。ネガティブなAI議論がAIの問題行動を誘発し、ポジティブな内容が安全性を向上させる「自己実現的アライメント」効果を実証した画期的研究を解説。
19歳学生がChatGPTの薬物使用アドバイスに従って死亡した訴訟が話題に。GPT-4oの安全性問題とAI医療利用の危険性について詳しく解説します。
イーロン・マスクのOpenAI裁判で、著名なAI研究者スチュアート・ラッセル教授がAGI開発競争の危険性について証言。AI安全性と商業化の矛盾が浮き彫りに。
AIチャットボットが無許可で医療診断を提供し、ペンシルベニア州が法的措置。AI医療サービスの規制強化と利用者保護の動きを詳しく解説します。
アメリカ政府による AI モデルの事前審査体制が実現。Google、Microsoft、xAI が合意し、OpenAI と Anthropic も再交渉を経て参加決定。AI 安全性確保の新たな枠組みとその影響を詳しく解説します。
イーロン・マスクのOpenAI訴訟で、元従業員が法廷証言。AGI安全性チーム解散やGPT-4インド展開問題など、営利化による安全性軽視の実態が明らかに。
OpenAI訴訟でイーロン・マスクが証言台に立ち、7つの重大な失策を犯したことが判明。感情的になった場面や矛盾した証言が裁判の行方に大きな影響を与える可能性が浮上しています。
OpenAIが内部安全チームの警告を無視し、ChatGPTの危険ユーザーを当局に通報せずアカウント停止のみで対応。その8ヶ月後にカナダで史上最悪級の学校銃乱射事件が発生し、遺族らが集団訴訟を提起した衝撃の内容とは。
イーロン・マスク氏がOpenAI裁判の証言台で明かしたのは、グーグルのラリー・ペイジ氏との友情決裂の詳細。AI安全性を巡る価値観の違いが、テック界の重要人物たちの関係を変えた背景とは?
OpenAIがGPT-5.5向けに$25,000のバイオセキュリティ破り報奨金を発表。AI安全性の新たな取り組みとして、研究者による「ユニバーサルジェイルブレイク」の発見を募集 #OpenAI #GPT55 #AIセキュリティ #バグバウンティ
AI安全性のリーダーを自認するAnthropicの最新AI「Claude Mythos」が、基本的な手法でハッキング被害に。サイバーセキュリティに特化した危険なAIモデルが不正アクセスされる事態に。専門家は「屈辱的」と評価。#AI #セキュリティ #Anthropic