《中国科学基金》| Science 2022年十大科学突破解读:创造性人工智能的快速发展

无忧课题
523 阅读
2023-08-24 10:01:07

  搜索下方网址进入官网投稿页面:

  https://zkjj.cbpt.cnki.net

  2022年AI圈最大的趋势,非生成式AI(AI Generated Content,AIGC)莫属。它意味着,AI进军到了此前被视为“人类独占”的领域,如艺术表达、科学发现。最初AI这种渗透是缓慢的,但在今年逐渐形成了一场抢地战。Dall-E 2 先声夺人,以逼真、契合的效果,掀起了文本—图像模型的新趋势。紧接着Stable Diffusion在更大众层面掀起狂潮——当然也引发艺术圈争议。但用扩散模型生成精美的图像视频,已经成为了今年科技巨头都在冲的领域,Meta、Google都在接二连三发布相关模型。以及在科学探索、数学、编程方面,AI也在大举阔步。2021年,AlphaFold2就获得了Science年度最大突破。2022年,DeepMind相继发布了AlphaTensor、AlphaCode。其中,AlphaTensor打破矩阵乘法计算50年记录,可用于计算机图形学、物理模拟和机器学习。AlphaCode则在编程比赛中,成绩超过了一半人类选手。尽管AIGC目前还尚存许多争论,但毋庸置疑的是,它能开拓人类的创造力。这种现象,或许就像过去人类接受织布机、照相机等发明的过程一样。

  俞 扬

  南京大学人工智能学院教授。主要从事机器学习、强化学习的研究工作。研究工作获4项国际论文奖励和3项国际算法竞赛冠军,入选IEEE“国际人工智能十大新星”。

  2022年,Science将“创造性人工智能”选为十大科学突破之一。与其他科学突破相比,这个题目不是单一的发明,而是人工智能技术在“创造性”领域的应用。代表性系统包括OpenAI的DALL-E、MidJourney网站和开源的Stable Diffusion系统,这些系统可以根据人类用户提供的文本描述生成图像。DeepMind的AlphaCode和微软的Copilot可以根据文本描述生成代码,而AlphaFold支持新蛋白质结构的生成。DeepMind的AlphaTensor则是发现了更快的矩阵乘法。

  利用人工智能技术辅助人类产生创造性成果这一方向有长期的研究。经典的应用主要基于搜索算法,以突破人类思维的局限,找到在人类定义的解空间中更好的解决方案。例如,美国国家航空航天局(National Aeronautics and Space Administration,NASA)在2006年使用进化算法优化天线,获得了与人类设计不同的紧凑而高效的ST5天线。在低维空间搜索未知的更好解已相对成熟,AlphaTensor发现更快的矩阵乘法即属于此类研究。然而,在高维度空间对象(如文本、代码和图像)中“创作”还需要在高维度空间中评估所创建对象的真实性,需要克服准确计算和高维度空间概率采样的困难。

  生成对抗网络(Generative Adversarial Network,GAN)于2014年问世,引入了判别模型来区分真实图像和生成图像,突破了建模高维度空间概率分布的难题。GAN可以学到从随机数到逼真图像的映射函数,使得在随机数空间中采样可生成不同的图像。然而,对抗学习过程容易不稳定。2020年出现的扩散模型从随机数逐渐还原出目标图像,极大地提高了训练的稳定性,成为图像生成的主要模型。2017年,Google提出了用于自然语言理解任务的注意力网络Transformer,对于顺序文本数据具有出色的建模能力。2019年左右,Google、OpenAI等组织开始扩大模型规模,不断将训练数据和模型规模推向极限。2022年,这些模型的输出产生了惊人的效果,OpenAI基于Transformer的ChatGPT模型具有流畅的问答能力和广泛的知识,而DALL-E和MidJourney可以从语言中生成逼真的图像。

  创造性人工智能技术的发展可以在艺术创作、文化遗产、教育等领域发挥积极作用。它极大地提高了高质量作品的生产效率,帮助人类在各个领域扩展创造力,促进技术创新和进步。在这方面,中国的多所高校和研究所正在进行相关领域的基础研究,产品领域也有百度的“文心一言”等模型。随着算法、计算能力和数据量的不断进步,预计在不久的将来将出现更多、更好的创造性人工智能产品。

  可以看出,“创造性”人工智能技术并非像人类一样产生创新能力,而是辅助人类在定义的空间中进行探索。作为辅助工具,当前生成模型的可控性不足。为了生成符合预期的图像,用户通常需要反复调整他们的描述。如何更好地控制人工智能模型的创造性输出是未来的一个重要研究问题。解决这个问题将使人工智能辅助创造力的能力和效率提升到一个新的水平。在应用层面,保障训练数据(原创图像、文章、代码)的版权、抑制虚假信息的生成、消除生成结果中的歧视和刻板印象,将使“创造性”人工智能技术被广泛的接受和应用。