技术逻辑、实现方式与现实边界: 生成式AI对出版业的深层影响*

作者:  来源:  2023年10月31日

     目前人工智能模型领域大致可以分为决策AI和生成式AI两大类。前者发展已较为成熟,图像识别、精准推送、风控评级等都是决策式AI的主要应用领域。而后者于2014年开始进入高速发展阶段,主要采取的技术路径是对所有数据进行分析归纳后进行缝合式、模仿式创作,从而生成新的内容并作出判断,此前较为人们所熟悉的应用还停留在自动生成图像、音乐等领域。2022年,随着深度神经网络参数量升至数千亿级,跨模态生成得以实现,优质训练数据增多,训练算力升级。在自然语言处理应用工具方面,由美国OpenAI公司研发的ChatGPT和百度公司发布的文新一言彻底引燃了社会对生成式AI的关注,成为生成式AI的发展拐点。

      作为知识传播的核心产业——出版业是否会被生成式AI颠覆?生成式人工智能技术所带来的科技革命下,人们的知识生产、学习和阅读消费习惯会有怎样的变化?技术与资本日益集中的趋势是否会对出版事业形成蚕食,其边界又在哪里?对这些问题的回答恐怕已经不是将来时态。本文将从当前生成式AI参与出版业生产的技术逻辑、对出版业的作用方式和发展中的阶段性问题进行梳理,试图回应上述问题。

一、生成式AI助力智能出版的技术基础

      面对生成式AI,人们在发出赞叹的同时也流露出对自身职业发展的巨大担忧,这种复杂情绪在人工智能技术每一次取得重大突破时都会上演。生成式AI最早在学术界引发“地震”是《自然》(Nature)专门针对ChatGPT公布禁令,认为ChatGPT不能成为论文作者。《科学》(Science)杂志直接禁止投稿者使用ChatGPT生成文本。但不久后Nature便在2023年2月一周内连发两文,讨论ChatGPT及生成式AI对于科学界的意义。[1][2]与学界审慎的态度相比,社会范围内的反馈似乎预示着人们对人工智能技术的情感正在迈过恐惧厌恶的低谷:抖音中AI绘画特效使用已经突破2700万人,而ChatGPT也刷新了最快月活用户破亿的纪录。

生成式AI对出版领域的影响主要可以概括为以下两个方面。

1.全域视角下的整合梳理能力

     随着语料训练的不断丰富,生成式AI能够在更为广博的领域形成知识体系,从而在选题策划、约稿、校对、翻译、文献查考、内容整合等多个环节辅助编辑工作,缓解出版机构在特定领域中专业人才缺失所面临的压力,帮助编辑在基于全域数据的基础上进行联合查询、梳理整合,从而大幅提升编辑对某一知识领域的全域视野和实际生产效率。

      以生成式AI中的GPT系列为例,其成功获得社会普遍赞许的一项功能是机器深度学习并进行数据挖掘与整合的逻辑性以及高速率。其核心原因之一在于ChatGPT以Transformer模型为依托,利用独特的自注意(attention)机制,基于超大型数据训练而生成全新内容。[3]在此之前主流的计算方式通常是顺序性的,即后一刻的输出取决于前一时刻的输入,每一步的计算结束才有可能开启下一步的计算。[4]而ChatGPT可以一次性处理大量的内容并作出判断。这在反馈和处理内容上的效率是大幅提升的,类似于一字一句和一目十行的阅读速率对比。[5]当前的ChatGPT在3000亿单词上预训练1750亿参数的模型,其主要目的便是存储知识完成知识密集型任务。

      这些功能都能够帮助编辑在更短时间内迅速梳理整合某一领域的情况,并且获得相应的较具参考价值的初步资料整合结果,从而达到快速“温故而知新”的效果。这种初步整合的价值还包括处理整合不同文化背景、不同语言的数据。目前版本的ChatGPT语料中96%的内容来源于英语,中文内容较少,因而在公开网络中涉及较少的一些传统文化领域的话题所表现的流畅度和准确性要逊于英文内容,但这也为该项技术本身的可实现性提供了佐证。这种学习能力在一定程度上为编辑出版人员的学科背景限制打开了出口,能够极大地方便编辑挖掘不断增长的新知识,并进行快速提炼和内容组织。

2.语义理解和生成能力

      创造性是生成式AI的最大特点,现阶段其对于社会实践的影响将主要体现为对于创造性工作效率的大幅提升而并非对生产关系的彻底颠覆。当前的生成式AI作为一种大语言模型,多以聊天机器人的形式呈现,其主要特点包括:支持连续的多轮对话、准确度相比此前的话机器人有大幅提升,并且支持对上下文的理解。此外,更为人们所关注的是生成式AI呈现出了更为接近人类的反馈能力,在对话过程中能够对人类输入的内容提出质疑,而在收到确定错误的批判后也会承认对该领域的无知和错误。因此其在新闻出版领域特别是内容生产方式和流程中将产生深远影响,真正实现编辑出版工作从数字化向智能化转型。

      在具备巨量信息处理能力的同时,ChatGPT及相关的生成式AI技术能够使出版内容生产过程从数字化向智能化转变,提高生产效率,为创造性工作解放劳动力。在理解人类思想方面ChatGPT表现出较强的能力,它突破了传统工具软件较难涉足的语义理解,复杂推理和零样本生成等能力瓶颈。这得益于GPT系列引入了基于人类反馈的强化学习机制(Reinforcement Learning from Human Feedback),通过大量人工对AI输出结果进行评判,不断训练机器学习像人类的表达习惯和思维习惯靠近。

     正因如此,这款应用能够呈现出与人类更为接近的理解和表达,例如主动提供翔实的回应,对涉及多个利益的方面在答案中尽量平衡公正地予以顾及等。此外ChatGPT还能对提问者的实际意图尝试理解,表现出强大的逻辑能力。这些不断加快升级版本的生成式AI为内容生产中可能面临的表达逻辑检查、语病纠错、数据核验提供远超人工的工作效率。2022年12月计算生物学家 Casey Greene 和 Milton Pividori利用ChatGPT在不到20分钟的时间内审阅完成了3篇研究论文,帮助其在一篇论文中发现了一个引用方程式的错误,并生成了阅读起来更为通顺、简单的手稿。[6]不仅如此,许多科学家都开始尝试在写作过程中使用大语言模型来辅助编写或者检查代码,GPT系列也帮助科学家很好地撰写摘要、介绍、申请书等有一定写作规则的文书。因此,生成式AI根据用户需求生成内容并且在一定范围内能够达到专业水准,这样就可以解放更多的人力去进行更为有创造性的工作。


二、相融方式:生成式AI与出版工作在知识产品供应中相互促进

      出版的内涵具有时代性,知识载体、记录方式、复制技术等方面的变革始终牵动着出版工作的变革。[7]数字化时代以来,编辑出版工作一直面临着生产流程、信息分发和营销策划等方面对多模态产品的全新整合进化。可以说技术前进的步伐一直伴随着出版业的发展创新,技术与文明、机器与人类在出版事业中始终保持着动态平衡,相互促进、互为驱动。生成式AI技术虽然还存在很多局限,但是该技术已经进入了由量变到质变的快速迭代发展阶段。尽快适应并形成智能时代的出版工作,成为当下要务。

1.生成式AI驱动交互式非线性知识生产

      如果说数据是算法的燃料,那么生成式AI的有效接入将会使出版业发展迎来高效优质的“新能源”。这种驱动力首先体现在对出版业核心基础——知识生产的深层影响。相比于传统的知识积累和沉淀方式,生成式AI不仅加速了知识生成的速率,更使得以往隐性的精神交往、信息提炼、清洗和总结过程变得可追溯和互动化。

      在生成式AI的使用场景中,专业的内容生产者和内容消费者的边界逐步消弭,作者与读者、读者与读者、读者与编辑、作者与编辑的思想在扁平化的内容生产空间内交互更为便利,共同推动知识的生产。而这种由技术赋予的每个群体的参与感相较于过去在漫长的知识传播和形成过程会逐步得到凸显,从而激发人们的使用意愿和参与知识生成和传播的行为。出版形态和手段也会在接下来的智能时代经历更多的创新发展。

       作者、编辑、读者被拉到一个共同的角色中:那便是“用户”,内容生产和消费的过程变得不再遵照单一向度的线性规则。作为用户,每一次对内容的提问和订正都会留存相应的数据反映到模型的运算中成为此后内容生成的依据。知识生产从线性的经验总结或实证检验,发展到生成式AI作为主要接入口的时代,人们的互动方式可能会改写具体的线性的知识生成过程。虽然在总体趋势上仍然符合积累、验证再到总结的顺序,但是在具体过程中不同学科之间、不同领域、不同文化可能借助生成式AI产生大量有待检验的“前知识”形态。而这些内容的传播速度也会远远超过以往任何时代,信息向知识的转化过程可能是爆发式的涌现。其间也必然伴随着类似于新闻事实传播过程中的“后真相”现象,因此对于一些“前沿”和“热门”知识的整理和回应也是出版界在生成式AI时代所肩负的一项使命。

       与此同时,生成式AI并不能直接生产知识,但可以成为知识涌现的加速器和主流知识生产的有益补充。当我们仔细观察生成式AI的创造力,这种创造来源于对于基础数据的整合输出,而非在此基础上将人类的知识边界向前推进。也就是说其创造更多地体现为对存量知识的理解和运用,单就这一点来说生成式AI的影响依然是巨大的,并且在内容的传播方面相比于出版物有着更好的灵活性,成为稳定知识生产和传播的重要补充。

2.知识封装的深层重塑

      生成式AI将对传统的知识的产品化组织进行深层重塑。出版通过一系列的工作使人类的复杂多元的思维活动形成系统化的知识网络,这当中除了包含原始的数据,和包含即时性的信息(比如新闻),还有更为深邃的经过情感与逻辑沉淀的思想。

      传统的知识封装主要是对知识内容进行系统化的封装并形成产品,进而形成传播知识的行业链条。在数字出版时代常见的知识封装内容形态有电子书、有声读物、知识服务等,其对应的产品类型主要有APP、网页等。ChatGPT以及嵌入该模型的Bing搜索引擎则可以在短时间内迅速基于巨量内容对个性化的问题进行多轮连续回复,从而成为知识服务的新产品形态。虽然尚不完善,但是其背后的大语言模型却被证实了这一内容生成路径的可靠性。也就是说,基于大语言模型的生成式AI具备提供严谨可靠知识回答的可能性,即生成式AI极有可能突破一定的训练量级在人工标记帮助后成为知识封装更快捷、方便、可靠的主流技术。在知识指数级增长的当下,人工智能的内容生成功能和出版行业的深度融合将实现知识封装过程中的全流程互动性和个性化,并更好地整合多模态的出版内容,实现更完整、优质的内容出版。

      对话机器人的形式固然可以呈现一定的数据和信息,但是很难形成稳定的系统化的知识提供给用户。早在ChatGPT出现之前就有讨论认为:数字出版将会使专业的把关人被淘汰,每个个体都具备了在数字世界中进行自主出版的条件,因而出版业的边界正在被消融。然而事实上,这种混杂性的知识实际上仍然需要一定的知识体系或者说经过把关、梳理和集约的出版活动作为基础,从而才能凸显这类个体化知识的非标准性和可实现性。因此当前生成式AI与出版的关系还很难形成替代,更多的是在知识的流动和传播中发挥价值。

      值得注意的是,AI在知识生产的深层无能反过来为出版行业的从业者们提供了机遇和更高的能力要求。目前的技术条件仍未有充足证据证实生成式AI 具有自主知识生产能力。因此生成式AI在当前能够实现的主要任务是对出版业所产生的存量知识进行高效学习和深度挖掘,这可以视为对智慧出版的赋能而非扼杀。编辑人员需要具备足够的知识储备和逻辑思维能力,并且能够熟练运用相关人工智能机器。以对话类生成式AI为例,针对当前以“问答对话”为主要内容呈现方式的阶段,其答案是需要根据问题来不断“校准”的。而想要获取有效信息就需要在与机器的互动中不断调整输入清晰明确的问题,缩小范围、深化讨论、逼近核心议题获取有效答案。如何进行问题设计,避免无效回答,如何发现端倪进行追问都是编辑在基础工作中需要具备的基本使用技能。

3.阅读习惯和消费入口迁移

     纵观历史,出版技术的变革不断拓展着出版物的受众范围,生成式AI无疑又向前走了一步。随着技术的进化以及商业化开发,生成式的内容将衍生出多种类型的产品形态,依托各种智能终端设备参与到人们的日常生活中。如果说电车的发明解放了人们看路的眼与驾车的手,使得腾出来的时间和能力得以抓住报刊进行阅读,那么人工智能时代新的技术环境一定会造就新的阅读习惯。

     当前生成式AI主要采用了(付费)聊天机器人和与搜索引擎相结合的方式提供服务。虽然这仅仅是生成式人工智能产品化的开始,但足以改变许多内容产品触达受众的方式。生成式人工智能将成为内容生产行业的一个基座,未来有无限的商业形式可以基于此而叠加。用户对内容需求的获取习惯一旦形成,新的阅读场景和习惯将会随之生成。毫无疑问,社交属性使媒介在过去十几年快速成长为用户数量最多的平台型媒介,但如今由于平台属性的过于凸显,社交属性被弱化。聊天机器人的生成式内容在这一过程中恰好有机会“乘虚而入”。而对于用户阅读习惯的重塑也随之开启,互动性的基因必然进一步加强。如何处理好产品内容与生成式AI接入方式、接入程度的问题,是事关出版业切身利益的重大战略。在此基础上,利用生成式AI开发出互动性更强的多模态阅读产品是面对人工智能冲击最好的顺势而为。

       虽然当前生成式AI的应用主要以软件形式进行市场化推广,但是随着人工智能工程技术的发展,未来硬件的接入也势在必行。在专门的领域和场景中,出版行业有着一定的先发优势。在教育、科技、公共服务等领域中,出版业应当努力开掘并细分场景,争取同生成式人工智能硬件结合,形成对用户阅读习惯和文化消费的先发培养优势。布局硬件的智能阅读终端,参与国家全民阅读基础设施的智能化建设,与人工智能的研究机构展开合作,有利于贯彻文化强国战略并为出版业在智能时代的入口抢占先机。



三、锁定边界:生成式智能出版中的核心问题

      在人们理性认知生成式人工智能的技术特性及其局限性之后,作为人类智慧集成领域的出版界对生成式AI的思考应更为务实地着眼于如何规范使用、明确哪些边界。这些问题主要体现为虚假信息生成、版权保护、意识形态安全和责任界定等方面,而人类始终要为自己的使用行为和选择负责。

1.明确AI生成内容与专业内容生产的责任与版权边界

     生成式AI在生成内容的过程中主要使用训练素材库中的既有知识生成看似合理的答案,然而在出版领域必须加强人工对于这些答案的进一步验证。就目前来看,在一些专业领域以及涉及更多文化和情感内容方面,即使是最新推出的GPT4的表现仍然不尽如人意,不少用户将这种表现戏称为“一本正经地胡说八道”。这可能是由于对模型的训练较为集中,未能覆盖到更多的相关知识并且机器尚不能对信源进行有效区分,因此就更加需要人工进行谨慎的审查和勘误。

      当前技术条件下AI产品仍然会产生大量伪知识,编辑人员需要有足够的责任感和能力去进行更为细致的甄别和筛选。在人工发布信息的阶段,未经核查的虚假信息就被有意无意地暴露于受众当中,引发社会危害。一些涉及重大历史事实和意识形态安全的内容需要经过严格的出版流程进行编审校对。而在机器依托尚不完善的数据库且自身不具备核查能力而产出内容时,虚假和有害内容将可能借助AI自身的渠道进行大范围传播。大语言模型尽管建立了尽量全面的人工检查与伦理修正方案,但就目前来看其生成的内容与人工把关的精致出版内容相比还有很大距离。

      在智能技术辅助出版工作的同时,许多内容生产者自身也是生成式AI的用户,如此就可能面临人工智能生成内容涉及侵权的问题。这种侵权并非有意而为,但需要更加警惕。在生成式AI使用过程中存在两种无意识的侵权风险:一是由于机器在作品创作过程中自主学习相关内容时可能会收集他人聊天过程中录入的未发表的作品,从而造成侵权。这也是许多从事创新工作的作者和编辑最为担心的一类情况。二是一些用户本身不具备分辨能力,被人工智能的所谓广博和客观所蒙蔽,无意中抄袭和使用了未知来源的数据资料。接入ChatGPT的搜索引擎Bing在提供答案的同时,给出了每一则信息的对应出处,这在一定程度上降低了此类风险。但是机器如不能准确判断信息的最初发表状态和来源,而引用了本身存在侵权问题的链接则会给版权所有者带来更大程度的伤害。因此,加强新技术环境下的人工交叉核验和监管,明确AI的适用范围,着力保障人工智能生产内容过程中作者的署名权、发表权、复制权以及信息网络传播权才能更好地保护知识创新。进入web3.0时代,生成式AI涉及相关的版权保护问题除了依靠国家和地区设置相应的法律法规,还需要依赖行业自身从技术、管理、人员素质等多个维度对创新进行保护。通过技术实现底层去中心化分部、以密码学、加密货币的结算方式为人机协作、集体协作、个人创意等提供更为安全和完善的结算方式,促进智慧出版的生产关系高效发展。

2.明确技术能力与出版事业的边界

     对算力的不断提升和算法的不断完善,使核心技术和数据信息高度集中,成为当前的人工智能研发与升级发展过程中不可避免的现实。但是这种科技力量的过度集中很难不延伸至社会生活,形成更为中心化的技术集权和经济利益垄断。而出版事业关乎整个社会的文化建设与认知引导,需要不断凝聚社会共识面向不断变化的社会历史条件作出对重大现实问题、重大理论问题、重大思想问题的清晰回应和阐释。因此,需要明确新技术的使用和技术能力在出版文化事业中的边界,强化价值引导,从而在生成式AI辅助出版的过程中保持出版事业的主体性。

     技术虽然没有边界,但技术的使用仍然应当倍加小心地明确边界所在。生成式人工智能技术的开发者们在伦理和法律方面虽然设置了一系列的“防火墙”,但从技术根源上来说,充斥其中的数据仍可能成为生成极端言论、歧视性观点、威胁现实世界秩序和安全的隐患。因此除了一般性的生成式内容伦理设计,在针对出版业的生成式AI产品架构设计和伦理设计过程中需要格外对涉及文化差异、国际关系敏感问题、种族问题、宗教问题等议题进行规范,防止出现隐性的内容失衡,从而造成具有破坏性的内容生成和传播。当前的GPT系列大语言模型在关于一些敏感词汇或涉及有争议事件的判断上会采取拒绝或回避的处理方式,然而随着多方势力的广泛介入,很难保证生成式AI产品在内容输出时不会存在偏见和不良引导。在事关意识形态安全的重要领域,有必要对这些内容建立专门的内容审核机构和进行安全评估。

      生成式AI在出版领域的使用过程中还需要明确其技术能力与社会责任,警惕技术和资本对出版文化事业的侵蚀,确保生成式AI的相关技术正确服务于我国出版事业的工作大局。具体来说,首先在面对生成式AI的技术革新和对出版工作的流程挑战时,仍然需要坚定地坚持出版事业的主体性、专业性和权威性。在最大化利用人工智能技术辅助出版生产的同时,仍然保持在不同生产环节和分工中人工的统筹与把关。其次,利用好生成式AI的数据支持和内容生成逻辑推进数字时代的全民阅读走向更加智能化的阅读体验。从服务与社会发展的角度,出版产业可以利用生成式AI定制更符合不同社会群体的高质量阅读产品,同时增强数字阅读的交互体验进而提高受众对阅读的兴趣和效率。最后,在生成式AI同出版融合的过程中应区分生成式内容供给侧的技术研发主体、出版应用主体和监管主体三者的边界。特别突出前两者应当对生产的产品进行标识并对用户和所提供的服务负责。应加强生成式内容对社会主义核心价值观的体现,从架构体系和算法层面对生成式内容的使用和传播进行规范。


四、结语

     人脑与机器的边界究竟在哪里,在当前的现实世界中仍需要一系列具体的保障措施去作出清晰的回应,哪怕人的创造性不断被机器赶上也应当不断去探寻人的价值。正如科技期刊主编辛克莱尔(Brent J.Sinclair)在社论中所说:“我希望我们能超越最初的恐慌,将文本生成软件视为一种工具……我们希望作者对其手稿中的思维质量负责。人工智能只是生成文本的一种工具,需要用户仔细和批判性地思考输入和输出,并对两者负责。在这方面,它与统计分析或自动图像调整没有什么不同。因此,请谨慎地使用人工智能生成的文本,批判性地思考你的工作(无论谁生成了文本),并对你的科学负责。”[8]在数字化生存的时代,出版行业依旧是人类智慧的高地,也将继续起着文明的领航作用。危机并存的当前,面对人工智能的挑战,回归人的价值的发现,道德理性和工具理性并重的坚守才是转危为机的底层逻辑。

(作者单位:北京印刷学院出版学院  中国人民大学新闻学院)


*本文受北京市教育委员会科学研究计划项目资助(SM202310015009)

参考文献:略

来源:中国新闻出版广电网

上一篇:第二十九期中国科技会堂论坛聚焦纳米科技
下一篇:全国妇联中国科协联合发布通知 持续开设专题专版专栏加强巾帼科普宣传创作