AI研究は現在、言語や画像の生成モデルからワールドモデル(世界モデル)への重点が移りつつある。
Current AI research is shifting its focus from language and image generation models to world models.
これは、実際の物理世界をシミュレートし、環境を推論する技術であり、ロボットや自動運転車などの用途には欠かせない。
This is a technology that simulates the real physical world and infers the environment, which is essential for applications such as robots and self-driving cars.
この転換は、メタやグーグルをはじめとする大手テクノロジー企業が集中的に取り組んでいることからも明らかである。
This change is clearly demonstrated by the fact that major technology companies like Meta and Google are focusing on development in this field.
メタのチーフAIサイエンティストであるヤン・ルカンは、ワールドモデルへの研究に注力する意向を強調している。
Metas Chief AI Scientist, Yann LeCun, emphasized his intention to focus on research into world models.
フェイフェイ・リーが主導するWorld Labsは、Marbleというモデルを一般公開した。
World Labs, led by Fei-Fei Li, has widely released the Marble model.
また、グーグルはGenieモデルをテストしており、エヌビディアは物理空間で動作するAI向けのOmniverseとCosmosプラットフォームを開発している。
Google is testing the Genie model, and Nvidia is developing the Omniverse and Cosmos platforms for AI that operates in physical spaces.
これらの取り組みから、AI研究は二次元のテキストや画像の理解を超えて、三次元空間の物理的シミュレーションに挑戦しようとしていることがうかがえる。
These efforts show that AI research is going beyond understanding text and 2D images, and is now taking on the challenge of physical simulation in 3D space.
フェイフェイ・リーは、人間の認知の根幹は空間的知性にあり、現代のAIに最も欠けているのはこの能力であると指摘している。
Fei-Fei Li points out that the core of human cognition lies in spatial intelligence, and that this is the ability most lacking in modern AI.
人間は物理法則と空間的な相互関係のもとに存在し、世界の中で生きて行動する。
Humans exist based on the laws of physics and spatial relationships, living and acting in the real world.
しかし現在のAIは、記号的表現に基づいて世界を解釈しているにすぎない。
However, current AI only interprets the world based on symbolic symbols.
自動運転車はこの技術の実用化の一例だが、その運用範囲は高度に構造化されている。
Autonomous vehicles are a practical application of this technology, but their operational scope is still very strictly structured.
より複雑な環境で機能するには、AIは空間的な相互作用をより幅広く理解し、シミュレートする必要がある。
In order to operate in more complex environments, AI needs to understand and simulate spatial interactions more extensively.
現行のワールドモデルを実用化する試みは、将来に向けた可能性と、いまだ克服すべき技術的課題の双方を明らかにしている。
Efforts toward applying current world models reveal both future possibilities and technical challenges that need to be overcome.
たとえば、筆者がMarbleモデルを使ってゴッホの「アルルの寝室」の絵を三次元で再現させてみたところ、不完全な描写が現れた。
For example, when the author used the marble model to recreate Van Gogh’s “Bedroom in Arles” in three dimensions, the result was an incomplete depiction.
壁や家具などが不完全にぼやけて表示され、物体の詳細が失われてしまったのである。
The walls and furniture are blurry, and the details of the objects are lost.
これは、ワールドモデルが限られたデータから構造的に一貫性のある空間を構成できる一方で、より複雑な状況では細部の保持や精密な推論に限界があることを意味している。
Even if the world model can construct a consistent spatial structure from limited data, this shows that there are still limitations in retaining details and making accurate inferences in more complex situations.
有効なワールドモデルを作るためには、過去のAI分野をはるかに超える技術的課題を克服しなければならない。
To create an effective world model, it is necessary to overcome technical challenges that go far beyond what has been achieved so far in the field of AI.
物理空間を忠実に再現するには、新たな状態を予測し、膨大なデータと文脈的・因果的関係の理解が要求される。
To accurately reproduce physical space, AI must predict new states and understand vast amounts of data as well as context and causality.
さらには、AIは時間を超えて情報を保持し、首尾一貫した行動を続ける記憶能力も獲得しなければならない。
Furthermore, AI needs the ability to retain information over time and maintain consistent behavior.
このような複雑な技術的課題を解決するだけでなく、新たなリスクも浮上する。
Not only are these complex technical challenges being solved, but new risks are also emerging.
物理世界に適用されるAIシステムが、人間の指示なしに行動する場合、理解やシミュレーションの限界が現実世界での有害な変化を引き起こしかねないからだ。
If an AI system acts in the physical world without human instructions, the limitations of its understanding or simulations could cause harmful changes in the real world.
したがって、ワールドモデルの開発には、技術的な挑戦を克服すると同時に、この技術を安全で信頼性の高い方法で社会に受け入れるための枠組みの構築も必要である。
Therefore, the development of world models requires not only overcoming technical challenges but also establishing a framework to ensure that this technology is accepted by society in a safe and trustworthy manner.