GLM-Vチームが発表したGLM-5V-Turboは、従来の言語モデルとは一線を画すマルチモーダルエージェント専用基盤モデル。画像・動画・GUI操作を統合した次世代AI技術の詳細を解説します。
IBMがリリースした新AI「Granite 4.1」の8Bモデルが、従来の32BパラメータMoEモデルを複数のベンチマークで上回る驚異的性能を実現。データ品質へのこだわりと4段階RL学習の成果を詳しく解説します。
NVIDIAが画期的なAIモデル「Nemotron 3 Nano Omni」を発表。視覚・音声・言語を統合し、従来比9倍の処理効率を達成。AIエージェントの性能革命が始まる。
Googleが初めてTPU V8を学習用と推論用の2チップに分離し、最大100万TPUという驚異的なクラスター規模を実現。Nvidia AI アクセラレーターに対する優位性を狙う戦略の詳細を解説します。
Physical Intelligence社の新AI「π0.7」が教わったことのない作業を自ら理解し実行。評価額5.6億円→110億円の可能性も。ロボット産業の大転換点を迎える革新技術の正体とは? #ロボットAI #技術革新
ディープフェイク検出企業が急成長中。Reality DefenderやPindropなど検出業界は55億ドル規模に。企業は1件45万ドルの被害も。AIで偽物を作って偽物を見破る時代が到来 #ディープフェイク #AI #サイバーセキュリティ
MITが開発したCompreSSMは、AI学習中にリアルタイムで不要な部分を除去し、性能を保ちながら学習速度を大幅向上させる革新的技術。
研究者らが開発したMegaTrain技術により、1台のGPUで1000億パラメータ超の大規模言語モデルを完全精度で訓練することが可能になった。従来の分散訓練の常識を覆す革新的アプローチ。
Generalist社のGEN-1ロボットAIが箱折りや部品分類など繊細な作業で99%の成功率を実現。人間の動きを学習し、トラブル時も即座に対応する技術が産業レベルに到達。
研究者らが「Simple Self-Distillation(SSD)」という手法を発表。外部ツールを使わずにLLM自身の出力でコード生成能力を42.4%から55.3%に向上させることに成功。
ヴィクトリア朝時代限定のユニークなAI言語モデル # Trip Venturellaが開発した「Mr. Chatterbox」は、1837年から1899年に出版されたヴィクトリア朝時代の英国書籍のみで訓練された言語モデルです。このモデルは1899年以降のデータを一切使用せず、完全に19世紀の文学作品からボキャブラリーとアイデアを習得している点が特徴的です。
GoogleがTimesFMを公開 # Googleの研究部門であるGoogle Researchが、時系列予測のための基盤モデル「TimesFM(Time Series Foundation Model)」をGitHubでオープンソースとして公開しました。このモデルは2億パラメータを持ち、16,000のコンテキスト長に対応した事前訓練済みの時系列予測モデルです。