【面面观·人工智能诗歌创作】
自新一代人工智能问世以来,人工智能在文本生成上取得的进展有目共睹,可以按照人们的要求,完成包括纠正语法错误、摘编文章观点、编制广告文案等多种多样的任务。用人工智能完成故事大纲、背景设定、人物形象等一系列工作,并在此基础上生成出具体的情节文本,则是对这些功能的综合应用。近期,国内首部由人工智能创作而成的百万字长篇小说发布,有关文学与人工智能的话题再度引发文学创作与研究领域的广泛关注。
这并不是人们第一次感受到“机器”对于文学的冲击。2017年,伴随“小冰”的《阳光失了玻璃窗》出版,“骆梦”“风的指尖”等一批在网络平台活跃的“诗人”,被揭晓为“小冰”的“马甲”。同一年,清华大学的“九歌”系统发布并在电视舞台亮相,其产生的文本具有古典诗歌的形式,能够遵守格律和用韵的要求,同样让人难辨真假。但在当今围绕人工智能与文学的讨论中,诗歌仿佛离场了。取而代之的是一个技术名词位居话题的中央,那就是“语言大模型”。通过将模型内部参数的规模提升到十亿、百亿的数量级,并在人类穷其一生也无法读完的海量文本上进行训练,大模型获得了模仿人类生成各种文本的能力。无论是生成诗歌还是小说,又或是各类应用文,都只是其通用性的体现。
如今,无论是否为技术专家,人们将更多注意力放在大模型如何获得这种按需“定制”文本的能力,又如何才能对它的生成能力施加进一步的控制。而诗歌生成本身似已不再构成技术发展中的一项主要挑战,人工智能写诗也随之失去了当年的话题性。在这样的境况下,不禁有必要怀疑:机器写诗还有未来可言吗?
探求机器写诗的未来,也许我们应当首先回顾机器写诗的历史。1845年,英国一位出身工匠家族的生意人约翰·克拉克,用回收再利用的齿轮、皮带、木条,拼装出一台名为“尤里卡”的诗歌机器。他将写有字母的木条安装在传动装置上,转动机器把手,“尤里卡”就能逐个字母拼写出一句由6个单词组成的拉丁文诗行,其格律符合“六步格”要求。
“尤里卡”迅速成为当时社会热点并进入公共话题领域。彼时,撰写拉丁文诗歌一直是大学必考科目。学生们疲于记诵各种陈词滥调,将作诗削减为机械化的应试技巧。克拉克所制造的机器无疑是对这种应试写诗的讽刺——不合时宜的应试要求,将人异化为一种受“死规矩”束缚的“写诗机器”,限制了他们学习和推动现代学科所需要的创造力。所以,早期的机器写诗反而是为了批判写诗的机械化。
在语言大模型出现之前,机器写诗一直是技术专家进行文本实验的工具。1952年,英国计算机专家克里斯多夫·斯特雷奇编写了最早的文本生成程序,以检验使用计算机操作文本信息的可行性。七年之后,德国工程师鲁兹从卡夫卡的小说《城堡》中分别选择了16个名词和形容词,编制了计算机程序将其按四种句式加以组合,产生出大量随机排列的句子。由于这些句子排列规整,并因句式上的重复,而获得别具一格的韵律感,这一题为《随机文本》的作品被视为最早由计算机生成的诗歌。
在谈论自己的作品时,鲁兹指出,他的目的在于表明计算机能够应用于数学以外的领域,并将“计算”的概念拓展到字词和逻辑推理上。为此,他应用了计算机中的随机生成器,来做出决策、生成文本,并指出未来的研究方向应在于引入概率统计的结果,来使字词的组合更有意义。后世的发展也确如鲁兹所料,一些新的数学模型得以提出,并在诗歌形式的文本生成中展露身姿。即便今天的语言大模型在原理上已与当年基于模板和规则的方式大相径庭,在对语言材料进行统计分析这一点上,仍然殊途同归。
在人工智能的技术发展历程中,诗歌生成具有特殊地位,不仅因为它代表了最早使用计算机进行文本生成的尝试,而且还在于它独特的象征意义:利用千百年来诗歌的崇高精神地位,机器写诗吸引了人们关注并支持人工智能领域的整体发展;借助诗歌体裁对词句非日常用法的宽容,诗歌生成方面的探索描绘了通用文本生成的技术图景。其背后的预期是,既然能够用计算机生成某些“诗作”,那么未来也完全有可能生成新闻、报告,抑或小说、散文,产生社会与经济价值。
现在,当初许诺的“未来”已经到来。语言大模型以一种通用的方式,实现了不同体裁文本的生成,其中诗歌已然不具有当初的特殊地位。要获得一首机器生成的“诗”,人们只需将自己的需求按照大模型所能接受的格式写成文本,这与让机器生成其他形式的文本完全一致。大模型应用的普及让专门化的诗歌生成反而成为边缘。技术地位上的沉寂,只是使“机器写诗”蒙上阴影的一个方面。由机器产生的诗歌自进入公众视野以来,就受到诗人、作家和批评家们近乎一致的反对。一位当代著名诗人批评说,机器生成的“诗”只是“一些碎片的无机组合”,是“拙劣的”、玩弄“修辞智性”而已。
机器写诗这项古老的事业,诞生于对“人的机械化”加以批评的社会思潮中。然而三百余年来,从木制的机械齿轮到迅速更新迭代的人工智能,产生“机器写诗”的文化境况已发生改变,连同诗歌生成技术地位的下降,以及技术的复杂性与诗歌的先锋性之间联系的“失灵”,使机器写诗很难再有未来可言。
来源:光明日报,2024年09月28日
作者:朱恬骅,上海社科院文学研究所助理研究员