跳到主要内容
马库拉应用伦理学中心

开源AI:发布或不发布GPT-2合成文本生成器

在一屏科技图像中有一张人脸

在一屏科技图像中有一张人脸

人工智能伦理案例研究

Subbu文森特

2019年2月,总部位于旧金山的开放人工智能组织做出了一个决定,在全球人工智能和开源社区引起了反响。首先,它宣布了“GPT-2”,这是对语言模型的一个重大改进,根据其创建者的说法,它可以生成“连贯的文本段落,在许多语言建模基准上达到最先进的性能,并执行基本的阅读理解、机器翻译、问题回答和摘要——所有这些都不需要特定任务的训练。”Open AI随后添加了以下内容:

由于担心大型语言模型被用于大规模生成欺骗性、偏见或辱骂性语言,我们只发布了一个更小版本的GPT-2以及抽样代码.我们不会发布数据集、训练代码或GPT-2模型权重。

Open-AI还发布了一个技术论文.GPT-2被训练为一个大规模的无监督语言模型,使用从互联网上抓取的40 gb内容,Reddit业力评分超过3分。在“假新闻”时代,社会上对假新闻对社会的潜在危害和对研究人员的好处进行了大量讨论。Open AI随后进行了阶段性发布。2019年5月,它发布了一个扩展的数据集,其中包含更详细的模型。最后,在11月,它发布了完整的GPT-2,并辩称:

我们已经看到没有强有力的证据目前为止的误用。虽然我们已经看到了一些关于GPT-2增加高容量/低收益操作(如垃圾邮件和网络钓鱼)的潜力的讨论,但我们还没有看到编写代码、文档或滥用实例的证据。我们认为,如果合成文本生成器的输出变得更加可靠和连贯,那么它们被滥用的几率就会更高。我们承认我们不可能意识到所有的威胁,并且有动机的参与者可以在不发布模型的情况下复制语言模型。

练习:去talktotransformer.com.这个网站允许您通过输入任何句子来实时测试GPT-2,并让您观看它在您输入的上下文中生成的合成文本作为响应。输入任何关于事故或暗杀的句子。你自己看看机器会产生什么。这里有一个例子。

***例1。只是测试,这不是真实的,不要分享***

用户:巴尔的摩市长凯瑟琳·皮尤昨天被判三年监禁。

GPT-2:巴尔的摩市长凯瑟琳·皮尤昨天被判三年监禁。她被判在知情的情况下接受非法竞选捐款州长拉里·霍根的家人。据福克斯5台报道,“皮尤的丈夫彼得·鲁伊斯捐款了2013年给霍根的竞选提供了1000美元。2014年10月,他还与霍根一起主持了一场筹款活动,2500美元将用于她的竞选,一顿饭和一张他们两人的照片孙子。鲁伊斯还在皮尤的审判中作证说,鲁伊斯“非常支持特朗普”,“知道什么是特朗普”了”。但普和鲁伊斯承认,他们拿走这笔资金违反了马里兰州的法律“打小报告”或拉票

例1(生成于2020年2月28日)展示了一台经过网页训练的机器如何生成完全虚构的、带有政治色彩的叙述。GPT-2根据你提供的内容生成了更多不人道和种族主义文本的例子。

在Github上,在GPT-2的“范围外用例”部分Open AI表示,“因为像GPT-2这样的大规模语言模型不能区分事实和虚构,所以我们不支持要求生成的文本是真实的用例。”它还承认,像GPT-2这样的语言模型“反映了它们所训练的系统固有的偏见,所以我们不建议将它们部署到与人类交互的系统中,除非部署者首先对与预期用例相关的偏见进行研究。”

讨论问题:

1.对于GPT-2的完全发布,谁是参与的利益相关者?谁是直接或间接受到GPT-2发布影响的人和/或组织?谁受益?可能会产生哪些类型的危害?

2.在这种情况下,应用这五种道德视角会引起哪些问题和关注?

  • 权利
  • 公平和正义
  • 功利主义
  • 共同利益
  • 美德

3.根据你们的讨论,你将如何评估Open AI在11月全面发布GPT-2的决定的伦理性?

参考文献

  1. 模型:https://github.com/openai/gpt-2/blob/master/model_card.md
  2. Github:https://github.com/openai/gpt-2
  3. 2019年11月发布:https://openai.com/blog/gpt-2-1-5b-release/
  4. 训练数据上下文:为了了解进入GPT-2, Open AI的数据发布列表在前1000个域名中出现在WebText和他们的频率。WebText排名前15位的域名分别是:谷歌、Archive、Blogspot、GitHub、纽约时报,Wordpress,华盛顿邮报,Wikia, BBC,卫报,eBay, Pastebin, CNN,雅虎!以及《赫芬顿邮报》。”- - -开放的人工智能。

更多的背景:

开放AI训练语言模型,大规模歇斯底里随之而来http://approximatelycorrect.com/2019/02/17/openai-trains-language-model-mass-hysteria-ensues/

2020年5月19日