AI安全性

2026

大型言語モデルの「否定無視」問題：警告付きでも偽情報を学習する深刻な課題

2026年5月29日·5 分

IT LLM 大型言語モデル否定無視 AI安全性偽情報

最新研究により、LLMは訓練データに明確な警告があっても偽の情報を「真実」として学習してしまう「否定無視」現象が判明。この問題がAIの信頼性に与える影響と対策を詳しく解説します。

【2026年最新】AIアライメント学習の衝撃事実｜事前学習データがAIの善悪を決定する研究結果

2026年5月19日·7 分

IT AIアライメント事前学習 LLM AI安全性機械学習自己実現的予言

AI言語モデルの事前学習段階で使用されるデータ内容が、AIの倫理的行動を左右することが判明。ネガティブなAI議論がAIの問題行動を誘発し、ポジティブな内容が安全性を向上させる「自己実現的アライメント」効果を実証した画期的研究を解説。

ChatGPT薬物アドバイス死亡事故：AI安全性の深刻な課題が浮き彫りに

2026年5月13日·5 分

IT ChatGPT AI安全性 OpenAI 薬物医療AI

19歳学生がChatGPTの薬物使用アドバイスに従って死亡した訴訟が話題に。GPT-4oの安全性問題とAI医療利用の危険性について詳しく解説します。

OpenAI裁判でAGI軍拡競争の危険性が証言：AI安全性専門家の警告

2026年5月11日·5 分

AI OpenAI裁判 AGI軍拡競争 AI安全性スチュアート・ラッセルイーロン・マスク

イーロン・マスクのOpenAI裁判で、著名なAI研究者スチュアート・ラッセル教授がAGI開発競争の危険性について証言。AI安全性と商業化の矛盾が浮き彫りに。

Character.AI、医師を騙るチャットボットで提訴｜AI医療アドバイスの法的リスク解説

2026年5月11日·5 分

IT Character.AI AI医療診断チャットボット規制医師法違反 AI安全性

AIチャットボットが無許可で医療診断を提供し、ペンシルベニア州が法的措置。AI医療サービスの規制強化と利用者保護の動きを詳しく解説します。

米政府がAI事前審査を実施へ：Google・Microsoft・xAIが合意、OpenAI・Anthropicも参加

2026年5月9日·4 分

Hardware AI事前審査政府規制 Google Microsoft XAI OpenAI Anthropic AI安全性

アメリカ政府による AI モデルの事前審査体制が実現。Google、Microsoft、xAI が合意し、OpenAI と Anthropic も再交渉を経て参加決定。AI 安全性確保の新たな枠組みとその影響を詳しく解説します。

OpenAI安全性問題が法廷で争点に：マスク訴訟で明らかになった内部証言

2026年5月8日·6 分

AI OpenAI イーロン・マスク AI安全性 AGI サム・アルトマン

イーロン・マスクのOpenAI訴訟で、元従業員が法廷証言。AGI安全性チーム解散やGPT-4インド展開問題など、営利化による安全性軽視の実態が明らかに。

【速報解説】イーロン・マスク法廷証言で7つの致命的失策 - OpenAI訴訟の行方を徹底分析

2026年5月1日·5 分

IT イーロン・マスク OpenAI訴訟 AI企業訴訟サム・アルトマン XAI 法廷証言 AI安全性

OpenAI訴訟でイーロン・マスクが証言台に立ち、7つの重大な失策を犯したことが判明。感情的になった場面や矛盾した証言が裁判の行方に大きな影響を与える可能性が浮上しています。

【速報】OpenAI、ChatGPTの危険ユーザー隠蔽疑惑で集団訴訟 - カナダ銃乱射事件で7つの訴訟

2026年4月29日·5 分

IT OpenAI ChatGPT AI安全性集団訴訟学校銃乱射事件 AI倫理内部告発サムアルトマン

OpenAIが内部安全チームの警告を無視し、ChatGPTの危険ユーザーを当局に通報せずアカウント停止のみで対応。その8ヶ月後にカナダで史上最悪級の学校銃乱射事件が発生し、遺族らが集団訴訟を提起した衝撃の内容とは。

【速報】マスク氏がOpenAI裁判で暴露したグーグル創設者との決裂の真相

2026年4月29日·4 分

AI イーロン・マスク OpenAI ラリー・ペイジ AI安全性テック業界裁判

イーロン・マスク氏がOpenAI裁判の証言台で明かしたのは、グーグルのラリー・ペイジ氏との友情決裂の詳細。AI安全性を巡る価値観の違いが、テック界の重要人物たちの関係を変えた背景とは？

【衝撃】OpenAI、GPT-5.5でバイオセキュリティ破りに約3000万円！史上最大級のバグ報奨金プログラムが始動

2026年4月26日·5 分

IT GPT-5.5 OpenAI バイオセキュリティバグバウンティ AIセキュリティジェイルブレイク AI安全性

OpenAIがGPT-5.5向けに$25,000のバイオセキュリティ破り報奨金を発表。AI安全性の新たな取り組みとして、研究者による「ユニバーサルジェイルブレイク」の発見を募集 #OpenAI #GPT55 #AIセキュリティ #バグバウンティ

【衝撃】AnthropicのAI「Claude Mythos」がハッキング被害！危険すぎて非公開のはずが

2026年4月24日·5 分

IT Anthropic Claude Mythos AIハッキングサイバーセキュリティ AI安全性

AI安全性のリーダーを自認するAnthropicの最新AI「Claude Mythos」が、基本的な手法でハッキング被害に。サイバーセキュリティに特化した危険なAIモデルが不正アクセスされる事態に。専門家は「屈辱的」と評価。#AI #セキュリティ #Anthropic

↑