生成AI一词最近引起了很多关注,ChatGPT,Stable Diffusion和DALL-E等公司经常成为头条新闻。但随着它的流行程度,关于生成人工智能一词的实际含义也存在很多混淆,更不用说它与另一个类似名称的领域的关系:生成工程。当谈到快速发展的人工智能世界时,术语的发展速度几乎与技术一样快,在理解最新的嗡嗡声时会导致混乱。
术语:基础知识
自从ChatGPT和其他类似产品公开发布以来,发现生成AI一词与一般AI混为一谈的情况并不少见。就像所有的正方形都是矩形,但反过来却不是真的,并非所有的人工智能算法本质上都是生成性的。生成式 AI 算法是所有 AI 算法的子集,这些算法将提示作为输入并以文本、图像和其他形式的媒体形式生成(因此得名)输出。
向生成式AI模型询问某事与向人类索要它并没有什么不同。例如,要求艺术家画一朵花的图片,或者让作家写一篇关于 CPU 如何工作的文章。一个问题的简单提示(“给我画一朵花的图片”)被转化为一个完整的作品,在这种情况下是一幅画,没有向创作者提出请求的人的进一步输入,无论是人类还是人工智能,根据现有的知识和例子填写缺失的信息。
生成式 AI 模型主要分为两种类型,生成对抗网络 (GAN) 和生成预训练转换器 (GPT),后者是两者中使用更广泛的一种,也是许多著名的生成 AI 模型的基础,包括其同名的 ChatGPT。就像其他类型的人工智能一样,GPT 在基本上不受监督的初始训练过程中需要大量的训练数据,然后才能使用更微调的数据来准备模型以实现其预期用途。
GPT 也是大型语言模型或 LLM 家族的一部分,虽然没有 LLM 的正式定义,但它们广泛包含使用未标记文本训练的大型数十亿参数模型。例如,ChatGPT-3 有 175 亿个参数,并使用 570Gb 的纯文本、从许多流行网站抓取的数据、来自 Google Books 的几本书(包含数十亿字)以及其他类似的数据源进行训练。
生成式 AI 与通用 AI
生成式人工智能具有广泛的应用,但这并不能使它适合一切。人工智能的许多现有应用,特别是在工业或专业工具中,如西门子Xcelerator套装中的应用,长期以来一直使用其他非生成方法来实现其结果。
以Simcenters代理模型中使用的AI推理系统为例。这些是功能强大的模型,能够准确推断复杂模拟的结果,这要归功于在现有数据丰富的模拟上训练的机器学习 (ML)。与寻求基于其训练数据但不同于其训练数据生成原创和新颖结果的生成人工智能相比,这些代理模型必须在训练它们所使用的非常真实的模拟数据中保持坚实的基础才能有用。
同样,工业人工智能的许多其他例子依赖于从完善的数据或模式中进行推理,以达到可靠、值得信赖的结果。在这些情况下,让人工智能模型生成新的和原始的输出可能从不方便到灾难性,在任何一种情况下都完全不适合工业应用。因此,重要的是要认识到生成式人工智能何时可以提供新的发展途径,以及现有的人工智能实施何时已经提供了最佳可用解决方案。
关于创成式工程的一句话
创成式工程是最近开发的一种方法,用于各个领域的设计空间探索。简单地说,该过程通过定义一组需求并生成现有设计的变体来寻找可能的解决方案。由于计算能力的进步,这种高度自动化的过程可以探索比设计师更广阔的设计空间。与生成式AI非常相似,此过程涉及根据以前的数据生成内容,但是与AI不同,生成式工程目前不是机器方面的智能或学习过程。
创成式工程通过传统的模拟、启发式和参数来达到其结果,目前没有人工智能,生成或其他方式,这个过程不涉及。这并不是说在这个过程中没有将人工智能添加到其中的空间,它可以提供更全面地查看数据并真正生成新设计的能力,而不是提供现有设计的简单变化。
人工智能生成内容的未来
随着生成式人工智能席卷全球,许多人和行业将看到重大变化,因为人工智能提供了一种连接数字和物理世界的新方式。随着人工智能世界的快节奏变化,术语、技术和进步很容易相互混淆,导致适应最新人工智能工具的混乱和挑战。虽然人工智能生成从文本和代码到图像的所有内容似乎像是技术接管,但实际上这只是人工智能改变我们与世界互动方式的另一种方式。