AI研究は現在、言語や画像の生成モデルからワールドモデル(世界モデル)への重点が移りつつある。
目前的人工智能研究正从语言和图像生成模型转向世界模型。
これは、実際の物理世界をシミュレートし、環境を推論する技術であり、ロボットや自動運転車などの用途には欠かせない。
这是对现实物理世界进行模拟并推理环境的技术,对于机器人和自动驾驶汽车等应用来说是不可或缺的。
この転換は、メタやグーグルをはじめとする大手テクノロジー企業が集中的に取り組んでいることからも明らかである。
这种变化也明显表明,像Meta和Google这样的大型科技公司正在专注于该领域的发展。
メタのチーフAIサイエンティストであるヤン・ルカンは、ワールドモデルへの研究に注力する意向を強調している。
Meta的首席AI科学家扬·勒昆强调了他致力于世界模型研究的意向。
フェイフェイ・リーが主導するWorld Labsは、Marbleというモデルを一般公開した。
由李飞飞领导的World Labs广泛公开了Marble模型。
また、グーグルはGenieモデルをテストしており、エヌビディアは物理空間で動作するAI向けのOmniverseとCosmosプラットフォームを開発している。
谷歌正在测试Genie模型,英伟达正在开发面向物理空间运行的AI的Omniverse和Cosmos平台。
これらの取り組みから、AI研究は二次元のテキストや画像の理解を超えて、三次元空間の物理的シミュレーションに挑戦しようとしていることがうかがえる。
这些举措表明,AI研究已经超越了对文本和二维图像的理解,正在挑战在三维空间中的物理模拟。
フェイフェイ・リーは、人間の認知の根幹は空間的知性にあり、現代のAIに最も欠けているのはこの能力であると指摘している。
费菲·李指出,人类认知的核心在于空间智能,而这正是现代人工智能最为缺乏的能力。
人間は物理法則と空間的な相互関係のもとに存在し、世界の中で生きて行動する。
人类基于物理法则和空间关系而存在,在现实世界中生活和行动。
しかし現在のAIは、記号的表現に基づいて世界を解釈しているにすぎない。
但是,目前的人工智能只是基于符号性的象征来解释世界。
自動運転車はこの技術の実用化の一例だが、その運用範囲は高度に構造化されている。
自动驾驶汽车是这项技术的实际应用案例,但其运行范围仍然被非常严格地结构化。
より複雑な環境で機能するには、AIは空間的な相互作用をより幅広く理解し、シミュレートする必要がある。
为了在更复杂的环境中活动,AI需要更广泛地理解和模拟空间上的相互作用。
現行のワールドモデルを実用化する試みは、将来に向けた可能性と、いまだ克服すべき技術的課題の双方を明らかにしている。
目前针对世界模型应用的努力,既揭示了其未来的可能性,也明确了今后需要克服的技术难题。
たとえば、筆者がMarbleモデルを使ってゴッホの「アルルの寝室」の絵を三次元で再現させてみたところ、不完全な描写が現れた。
例如,作者使用大理石模型三维重现梵高的《阿尔勒的卧室》时,结果出现了不完整的描绘。
壁や家具などが不完全にぼやけて表示され、物体の詳細が失われてしまったのである。
これは、ワールドモデルが限られたデータから構造的に一貫性のある空間を構成できる一方で、より複雑な状況では細部の保持や精密な推論に限界があることを意味している。
即使世界模型能够从有限的数据中构建出一致的空间结构,但在更复杂的情况下,在细节的保持和准确推理方面仍然存在限制。
有効なワールドモデルを作るためには、過去のAI分野をはるかに超える技術的課題を克服しなければならない。
为了构建有效的世界模型,必须克服远超以往人工智能领域的技术难题。
物理空間を忠実に再現するには、新たな状態を予測し、膨大なデータと文脈的・因果的関係の理解が要求される。
为了忠实再现物理空间,AI必须预测新的状态,并理解大量的数据、上下文和因果关系。
さらには、AIは時間を超えて情報を保持し、首尾一貫した行動を続ける記憶能力も獲得しなければならない。
此外,AI需要花时间记忆信息,并具备维持一致行为的能力。
このような複雑な技術的課題を解決するだけでなく、新たなリスクも浮上する。
物理世界に適用されるAIシステムが、人間の指示なしに行動する場合、理解やシミュレーションの限界が現実世界での有害な変化を引き起こしかねないからだ。
如果AI系统在没有人类指示的情况下在物理世界中行动,可能会因为理解或模拟的局限性而对现实世界带来有害的变化。
したがって、ワールドモデルの開発には、技術的な挑戦を克服すると同時に、この技術を安全で信頼性の高い方法で社会に受け入れるための枠組みの構築も必要である。
因此,开发世界模型不仅需要克服技术上的挑战,还必须构建一个框架,使这项技术能够以安全且值得信赖的方式被社会所接受。