Sora 来了!揭秘 3DEXPERIENCE 如何颠覆AI幻觉(内附Sora注册方法)

2024-02-28

审视AI发展历程,可以将其划分为三大浪潮。

第一波浪潮大约从1956年持续到1974年,主要聚焦于基于逻辑的符号操作和规则推理。在这一时期,专家系统和逻辑编程语言等应用崭露头角,旨在通过模拟人类专家的决策过程来解决特定领域的问题。然而,由于计算能力的限制和问题的复杂性,第一波AI在实际应用中遭遇了一些障碍。

到了第二波AI浪潮(约1980-1990年代),机器学习成为了研究的核心。在这个阶段,统计方法、决策树、神经网络等机器学习技术取得了显著进展,并在语音识别、图像处理等领域找到了实际应用。但由于数据量和计算能力的制约,第二波浪潮中的机器学习模型相对较小,且主要局限于特定任务的处理。

目前,AI发展正处于以深度学习和大模型技术为标志的第三波浪潮中。这一浪潮受到了广泛的社会关注和投资者的青睐。得益于计算能力的飞跃、大数据的可用性以及算法的进步,深度学习模型的规模和复杂性已经远超之前的限制。它们能够处理更加复杂的任务,如自然语言处理、自动化驾驶等,并开始在多个领域展现出通用人工智能(AGI)的潜力。

从OpenAI的ChatGPT、Midjourney,到谷歌的Genimi,再到 OpenAI 的Sora,这些技术从文本生成、图片生成、图片识别到视频生成,都预示着AI领域的巨大变革。一些人乐观地认为通用人工智能时代即将到来,人类正在从弱人工智能、强人工智能迈向超人工智能。然而,也有人持怀疑态度,认为尽管有这些技术进步,但除了插画师等领域外,人工智能并没有真正颠覆哪个行业。

关于当前这一波人工智能对人类社会可能产生的影响,其范围和深度仍然是一个热议的话题。周鸿祎的比喻在一定程度上揭示了公众对大模型技术的认知变化——从最初的高度神秘和震撼,到现在逐渐被视为日常生活的一部分。

今天,我们将围绕四个核心话题展开讨论:大模型的局限性、产品复杂度、人类认识世界的四种方式,以及针对这些挑战的破局解决方案,并在文章最后附上Sora内测注册方法。

一、人工智能大模型的局限性

目前的人工智能技术虽然能编写一些简单的程序,但还远远不能胜任像开发Windows操作系统或Word这样的复杂任务。同样,人工智能也无法独立设计芯片、光刻机或航空发动机等高度专业化的工程任务。

尽管有诸如谷歌的Gemini、智谱清言、豆包、字节的Dreamina、通义千问、文心一言、腾讯混元、Midjourney等流行的人工智能工具,但它们目前的设计能力还远远达不到这些复杂工程的水平。因此,至少在可预见的未来,人工智能并不能完全取代工程师的专业技能和经验。

尽管这些人工智能工具可以生成令人印象深刻的艺术作品,但在工程应用和工业实践中,它们的能力还有很大的差距。目前大模型的主要缺陷在于它们往往不能真正理解所给的提示词,而只是根据大量的数据进行模式匹配和生成。

例如,当给出特定的绘画提示词时,AI可能无法准确地理解和呈现出所要求的所有元素,如对联、横批和福字等。

尽管AI可以识别并生成图像中的某些元素,但它们往往无法理解这些元素所代表的具体含义或背后的文化内涵。这导致AI在处理类似“春回大地”这样的文字提示时,难以准确呈现所需的细节。

此外,AI的“幻觉”现象也反映了其信息处理和推理能力的不足,可能导致用户提供的信息被误解或误用。这些问题表明,人工智能在理解和执行复杂任务方面仍有待提高。

二、产品的复杂度

目前的大模型AI技术主要基于深度学习,这是一种模仿人类大脑神经网络结构和学习方式的技术。深度学习模型依赖于大量的训练数据,这些数据通常是人类创造的结果,如ChatGPT的训练数据来源于互联网文本。对于艺术和文本创作,深度学习能够通过学习大量的人类作品来掌握相关技巧和原理。

然而,对于复杂度较高的产品,如手机,其内部结构和功能涉及多个学科领域,如物理学、电子学和材料科学等。这些复杂的原理和过程难以仅通过表面现象来领悟,因此人工智能在理解和设计这类产品时面临巨大挑战。

衡量产品复杂度的常见方法和指标包括功能多样性、结构复杂性、性能要求、成本考量、可靠性标准以及制造过程的繁琐程度等。这些维度共同构成了评估产品复杂度的全面视角。

衡量产品复杂度、设计以及制造过程的复杂度需要综合运用定量和定性的方法。这些方法包括数据分析、专家访谈、问卷调查、模拟和建模等,它们能够帮助企业和开发团队更全面地理解产品的全生命周期复杂性,从而做出更有效的决策,提高产品的成功概率。

尽管当前的大模型AI技术在理解和模仿人类创造方面取得了显著进展,但在处理高复杂度产品时仍面临挑战。以Sora为例,虽然它能够生成视频中的蚂蚁形象,但其四条腿的呈现方式显然没有遵循物理学、生物学和文化规律。这也证明了Sora目前尚未具备基于定律的物理引擎,无法实现迭代和优化。

因此,对于高复杂度产品的设计和制造,人工智能仍然需要与人类智慧和专业知识相结合,才能取得更好的效果。

图:Sora生成的蚂蚁在洞里爬行

难道人工智能的第三波真的就只能止步于艺术和文本生成,还是不能摆脱彻底凉凉的命运?不,我们已经拥有解决方案。在讲述解决方案之前,让我们先回到人类是如何认识和改造世界这个话题。

三、人类认识世界的四种方式

● 体验世界:这是直接的感知方式,人们通过感官体验,如视觉、听觉、触觉等,来感知和认识世界。这种体验方式不仅帮助我们了解事物的外观和质地,还促使我们通过触摸和品尝等方式来改造世界。

● 社交世界:这是通过与他人交流和互动来认识世界的方式。人们通过语言、文字和非语言方式与他人交流,通过阅读书籍、观看电影等方式来间接体验世界。同时,社交也促进了人们通过教育、政治和经济交流等方式来改造世界。

● 数据世界:这是通过测量工具和传感器收集数据来认识世界的方式。人们通过仪器和设备测量各种物理量,如温度、压力等,从而发现自然规律并设计和制造产品。同时,数据也指导政策制定和优化生产流程等方式来改造世界。

● 虚拟世界:这是通过建模和仿真技术来认识和改造世界的方式。人们利用计算机和其他电子设备创建虚拟模型,模拟和预测现实世界的现象。虚拟世界不仅促进了科学研究,还助力建筑设计、军事训练和产品设计等领域的改造。

总之,这四种方式各具特色,相互交织,共同构成了人们认识和改造世界的多维视角。每种方式都有其独特的应用领域和价值,共同推动着人类社会的进步和发展。

第三波人工智能发展主要基于数据世界的方法,通过收集和分析数据,利用深度学习算法预测产品质量,实现科学决策。然而,尽管深度学习在某些领域取得了显著成就,但仍面临技术瓶颈和理论限制,如缺乏常识推理能力、无法理解情感和创造力等。此外,海量数据的收集、处理和存储也需要巨大的经济投入,且不一定能保证人工智能从中学习到有价值的信息。

因此,我们不能过度乐观地期待人工智能能够自动生成复杂的产品。相反,我们应该采取更加合理和现实的方法,结合数据世界和虚拟世界,以及人工智能、建模与仿真技术的综合运用,来推动人工智能的发展和应用。这样,我们才能在充分利用人工智能的潜力的同时,避免其局限性和挑战。

四、破局的关键解决方案

达索系统推出的“AI+MODSIM”方案为自动化生成复杂产品提供了新路径。这一方案旨在产品设计过程中实现可持续性、低成本、高质量和最佳体验等多重目标,预示着产品设计领域的新时代。

传统的AI技术常常因幻觉问题而备受质疑,即AI错误地将数据中的偶然模式解读为有意义信号。然而,通过将AI与建模与仿真(MODSIM)的严谨性相结合,我们可以有效地验证AI的推断并消除这些幻觉。这种结合不仅让AI学习结果,更通过模拟仿真过程来提高其准确性和可靠性。

在最近的 3DEXPERIENCE World 2024 大会上,达索系统董事会主席 Bernard Charles 向全球展示了这一前沿技术的实际应用。他向大家介绍了即将推出的 Magic SOLIDWORKS  产品,这款产品将建模、仿真和AI紧密结合,为设计领域带来了全新的革命

在演讲中,Bernard通过一段示范视频向观众展示了 Magic SOLIDWORKS 的强大功能。视频中,设计师与 Magic SOLIDWORKS 进行了对话互动,展现了设计的未来趋势。设计师仅通过简单的指令,便指导 Magic SOLIDWORKS 设计出了一款采用回收材料制作的下梁,同时在外形上融入了毕加索的艺术风格。随后,Magic SOLIDWORKS 自动启动了所有的设计和仿真流程,成功地重新创建了这款3D对象。这一过程充分展示了 AI+MODSIM 方案在设计领域的巨大潜力和价值。

更令人印象深刻的是,设计师还可通过对话要求 Magic SOLIDWORKS 提供不同的设计方案以减轻产品重量。仅仅几分钟后,AI便自动执行了所有设计应用程序和仿真,生成了一系列解决方案供设计师选择。这一过程不仅大幅提高了设计效率,也赋予了设计师前所未有的创造力。

达索系统对未来设计的展望聚焦于揭示建模、仿真和AI之间的深层联系,并通过 3DEXPERIENCE 平台实现这些技术的无缝整合。展望未来25年,关键在于整合这些技术以创建虚拟孪生,进而构建一个全面的虚拟宇宙。在这个宇宙中,企业和个人将实现自身的蝶变,推动社会经济进入生成式经济的新时代。

在生成式经济的框架下,AI不仅自动化设计过程,还根据资源、环境和成本等因素优化产品设计。这种结合人类创造力和机器智能的设计流程将带来前所未有的灵活性和效率。

随着技术进步,AI将更准确地理解设计师意图并提出创新方案。例如,通过分析市场趋势、用户反馈和设计历史,AI能够预测未来设计方向并提供建议。这种预测性设计将缩短产品上市时间并提高市场适应性。

同时,仿真技术使得在设计阶段全面评估产品性能成为可能。通过虚拟测试,可以在实际制造前发现和解决潜在设计缺陷,降低风险并提高产品可靠性。

在“AI+MODSIM”方案的推动下,产品设计流程将变得更加开放和协作。设计师、工程师、市场专家和用户将更早地参与设计过程,共同迭代和改进产品。这种跨学科协作将促进知识共享和创新。

此外,随着VR和AR技术的发展,设计师和工程师将能够在更直观和互动的环境中进行设计。通过虚拟现实头盔或增强现实眼镜,他们可以直观地查看和操作数字化产品模型,提高设计准确性和效率。

在达索系统的愿景中,3DEXPERIENCE 平台是核心。它提供集成工作环境并支持全球团队高效协作。无论设计师身在何处,都能实时访问设计数据并与团队成员交流。

最终,“AI+MODSIM”方案将实现一个更加智能化、自动化和高协作性的设计生态系统。这个生态系统将提高设计效率和产品质量,推动社会创新和可持续发展。设计师的角色也将转变,更多地专注于创意和策略层面,而AI和自动化技术将承担日常任务。

总之,达索系统的“AI+MODSIM”方案不仅是一个技术解决方案,更是改变产品设计、工程和制造领域的游戏规则。它为我们打开了通往未来设计世界的大门,充满无限可能性和机遇。通过整合AI、建模与仿真技术,我们将实现更加智能化、自动化和高协作性的设计过程,为个人和社会创造巨大价值。

注:本文内容由升华洞察参考整理编辑。

附:Sora内测注册方法

Sora还处于内测阶段,如想使用可以免费申请内测账号。

内测申请地址:https://openai.com/form/red-teaming-network

填写如下表格,申请内测资格账号。

填写邮箱地址一栏,最好是Google邮箱Gmail。

提前注册好ChatGPT,填写问卷时在此处勾选ChatGPT。

提交成功后,显示Thank you for your application, we’ll be in touch soon! 

最后,等待后台审核即可。