メインコンテンツへスキップ
  1. 記事一覧/

AIの回答は誰が決める?元Meta責任者が語る情報の正確性問題

著者
Alicia
AI・IT・ハードウェアの最新ニュースを自動配信するテックブログです。
目次
サムネイル

AI時代の情報問題に立ち向かう元メディア責任者の挑戦
#

ChatGPTをはじめとする生成AIが急速に普及する中、「AIが提供する情報の正確性は誰が担保するのか」という根本的な問題が浮上しています。この課題に正面から取り組むのが、元FacebookのニュースチーフCampbell Brownが設立したForum AIです。

要点まとめ:5分で理解できる重要ポイント
#

Forum AIの取り組み

  • 地政学、メンタルヘルス、金融、採用など「ハイステークス」な分野でAIモデルの性能を評価
  • 世界的な専門家がベンチマークを設計し、AI判定システムが大規模評価を実施
  • 人間の専門家との合意率90%を目標とし、既に達成している分野もある

現在のAIモデルの問題点

  • 中国とは無関係な記事で中国共産党のウェブサイトを情報源として使用
  • ほぼ全てのモデルに左寄りの政治的バイアスが存在
  • 文脈の欠如、視点の偏り、論点のすり替えなどの問題が発生

問題の深刻さ:ChatGPT登場で見えた課題
#

Brownは「ChatGPTが公開されたとき、これが全ての情報が流れる経路になると気づいた。そして、それはあまり良いものではなかった」と振り返ります。特に自身の子どもたちへの影響を考えた際、「これを修正しなければ、私の子どもたちは本当に無知になってしまう」と危機感を抱いたといいます。

AIモデル企業の優先順位のずれ
#

基盤モデルを開発する企業は「コーディングと数学に極めて集中している」一方で、ニュースや情報の分野は軽視されがちです。Brownは「より困難だからといって、オプショナルということではない」と指摘しています。

Forum AIの革新的アプローチ
#

専門家チームによるベンチマーク設計
#

地政学分野では、以下のような著名な専門家が参加しています:

  • Niall Ferguson(歴史家)
  • Fareed Zakaria(ジャーナリスト)
  • 元国務長官Tony Blinken
  • 元下院議長Kevin McCarthy
  • オバマ政権でサイバーセキュリティを担当したAnne Neuberger

評価対象の特徴
#

Forum AIは「明確なイエス・ノーの答えがない、曖昧で微妙で複雑な」トピックに焦点を当てています。これらの分野では、単純な正解・不正解の判断ではなく、専門的な知見と文脈理解が必要となります。

Facebookでの経験から学んだ教訓
#

ソーシャルメディアの失敗例
#

BrownはFacebookで「私たちが試みた多くのことで失敗した」と認めています。彼女が構築したファクトチェックプログラムは既に存在せず、エンゲージメント最適化が「社会にとって悪い結果をもたらし、多くの人をより無知にした」という教訓を得ています。

AIに求める新しい可能性
#

この経験を踏まえ、BrownはAIに対して異なるアプローチを期待しています。「今のところどちらにも転ぶ可能性がある」としながらも、企業がユーザーの求めるものを提供するか、「現実的で正直で真実なものを提供する」かの選択肢があると指摘しています。

企業需要が推進する正確性への取り組み
#

ビジネス分野でのAI活用の現実
#

信用判定、融資、保険、採用にAIを使用する企業は責任を負うリスクがあるため、「正しい結果を得ることを最適化してもらいたい」と考えています。この企業需要がForum AIのビジネスモデルの基盤となっています。

現在のコンプライアンス状況
#

現在のコンプライアンス状況について、Brownは「冗談のようなもの」と厳しく評価しています。ニューヨーク市が採用バイアス法を制定してAI監査を義務化した際、州の会計監査人が半数以上に未検出の違反があることを発見したという事例を挙げています。

業界の現実と理想のギャップ
#

大手テック企業の主張と現実
#

Brownは業界の現状について、「大手テック企業のリーダーから『この技術は世界を変える』『あなたを失業させる』『がんを治す』と聞くが、基本的な質問をするためにチャットボットを使っている普通の人は、まだ多くのがらくたや間違った答えを得ている」と指摘しています。

資金調達と今後の展望
#

Forum AIは17ヶ月前にニューヨークで設立され、昨年秋にはLerer Hippeauが主導する300万ドルの資金調達を完了しています。コンプライアンスへの関心を継続的な収益に転換することは課題として残っているものの、現在の市場が満足している「チェックボックス監査」や標準化されたベンチマークでは不十分だとBrownは考えています。

真の評価に必要な専門性
#

ドメイン専門知識の重要性
#

「賢い一般論者では通用しない」とBrownは強調します。真の評価には、既知のシナリオだけでなく、「人々が考えもしないトラブルに巻き込まれる可能性のある」エッジケースに対処するドメイン専門知識が必要であり、この作業には時間がかかるとしています。

まとめ:押さえておくべき3つの要点
#

  1. AI情報の正確性問題:現在のAIモデルには政治的バイアス、情報源の偏り、文脈の欠如など様々な問題が存在

  2. 専門家による評価システム:Forum AIは各分野の専門家がベンチマークを設計し、AI判定システムで大規模評価を実施する革新的アプローチを採用

  3. 企業需要による変化の可能性:信用判定や採用など責任を伴う分野でのAI活用が、正確性重視への転換点となる可能性

AI時代の情報の信頼性確保は技術的な課題であると同時に社会的な責任でもあります。Forum AIのような取り組みが業界標準となるかどうかが、今後のAI発展の方向性を左右する重要な要素となりそうです。

出典: Who decides what AI tells you? Campbell Brown, once Meta’s news chief, has thoughts

関連記事

OpenAI、ChatGPTに「workspace agents」を導入!AIエージェント時代の幕開けか?

OpenAIがChatGPTに新機能「workspace agents」を導入すると発表!AIエージェントがワークスペース内で自律的に作業を支援する未来がついに現実に。この革新的な機能が仕事のやり方を変える可能性について解説します。 #ChatGPT #AI #OpenAI