生成式人工智能似乎像魔术一样。图像生成器,如Stable Diffusion、Midjourney或DALL-E 2,可以产生非凡的视觉效果,其风格从老照片和水彩到铅笔画和点彩主义。由此产生的产品可能是迷人的–与人类的平均表现相比,创作的质量和速度都得到了提升。纽约现代艺术博物馆举办了一个由人工智能生成的装置,该装置是由博物馆自己的收藏品生成的,而海牙的Mauritshuis博物馆在维米尔的《戴珍珠耳环的女孩》被借出时,悬挂了一个人工智能变体。
文本生成器的能力也许更加引人注目,因为它们会写散文、诗歌和摘要,并被证明善于模仿风格和形式(尽管它们可以对事实进行创造性许可)。
虽然看起来这些新的人工智能工具可以从乙醚中变出新材料,但事实并非如此。生成式人工智能平台是在数据湖和问题片断上进行训练的–数十亿的参数是由软件处理巨大的图像和文本档案而构建的。人工智能平台恢复模式和关系,然后用来创建规则,然后在回应提示时做出判断和预测。
这个过程伴随着法律风险,包括侵犯知识产权。在许多情况下,它也带来了仍在解决的法律问题。例如,版权、专利、商标侵权是否适用于人工智能的创作?谁拥有生成式人工智能平台为你或你的客户创造的内容是否明确?在企业能够接受生成式人工智能的好处之前,他们需要了解风险 – 以及如何保护自己。
生成式AI在今天的法律环境中的地位
尽管生成式人工智能对市场来说可能是新事物,但现有的法律对其使用有重大影响。现在,法院正在梳理书本上的法律应该如何应用。有侵权和使用权的问题,人工智能生成的作品所有权的不确定性,以及关于训练数据中未经许可的内容的问题,以及用户是否应该能够提示这些工具直接引用其他创作者的版权和商标作品的名称,而无需他们的许可。
这些要求已经在诉讼中了。在2022年底提交的一个案件,即Andersen诉Stability AI等案中,三位艺术家组成了一个集体,起诉多个生成式人工智能平台,理由是人工智能在没有许可的情况下使用他们的原创作品,以他们的风格训练人工智能,使用户生成的作品可能没有充分改造他们现有的受保护作品,因此,将成为未经授权的衍生作品。如果法院发现人工智能的作品是未经授权的衍生作品,可以适用大量的侵权处罚。
2023年提交的类似案件提出,公司使用带有数千–甚至数百万–未经许可的作品的数据湖训练人工智能工具。Getty公司是一家图片授权服务机构,它对Stable Diffusion的创作者提起诉讼,指控他们不正当使用其照片,都侵犯了它在其水印照片集上的版权和商标权。
在这些案件中,法律体系被要求澄清什么是知识产权法规定的”衍生作品”的界限–根据不同的司法管辖区,不同的联邦巡回法院可能做出不同的解释。这些案件的结果预计将取决于对合理使用原则的解释,该原则允许在未经所有者许可的情况下将版权作品用于”批评(包括讽刺)、评论、新闻报道、教学(包括课堂使用的多份拷贝)、学术研究或研究”,以及以非预期的方式对版权材料进行转换性使用。
这并不是技术和版权法第一次相互碰撞。谷歌在一场诉讼中成功地为自己辩护,辩称改造性使用允许从书本上刮取文字来创建其搜索引擎,目前,这一决定仍然具有先例。
但还有其他一些非技术性的案例,可能会影响到如何对待生成式人工智能的产品。美国最高法院审理的一起针对安迪-沃霍尔基金会的案件–由摄影师林恩-戈德史密斯提起,他授权了已故音乐家普林斯的图像–可能会完善美国的版权法,即一件艺术作品何时与源材料有足够的不同,成为明确的”转化”,以及法院在评估该转化时是否可以考虑衍生作品的含义。如果法院认为沃霍尔的作品不属于合理使用,这可能意味着人工智能生成的作品将面临麻烦。
所有这些不确定性给使用生成式人工智能的公司带来了一连串的挑战。在对供应商和客户使用生成式人工智能保持沉默的合同中,存在着侵权的风险–直接或无意的侵权。如果企业用户知道训练数据可能包括未经许可的作品,或者人工智能可以产生未经授权的衍生作品,而不在合理使用的范围内,那么企业可能要承担故意侵权的责任,这可能包括对每一次知情使用的损失高达150,000美元。还有一个风险是,通过向生成式人工智能工具输入数据,意外地分享机密商业秘密或商业信息。
减轻风险和建立前进的道路
这种新的模式意味着公司需要采取新的措施,在短期和长期内保护自己。
人工智能开发者之一,应该确保他们在获取用于训练其模型的数据方面符合法律规定。这应该涉及到许可和补偿那些拥有知识产权的个人,开发人员试图将其添加到他们的训练数据中,无论是通过许可还是分享人工智能工具产生的收入。人工智能工具的客户应该询问供应商他们的模型是否是用任何受保护的内容训练的,审查服务条款和隐私政策,并避免使用那些不能确认他们的训练数据是从内容创作者那里获得适当许可或受到人工智能公司遵守的开源许可的生成式人工智能工具。
开发人员
从长远来看,人工智能开发者需要对他们的数据来源方式采取主动–而投资者需要知道数据的来源。Stable Diffusion、Midjourney和其他公司基于LAION-5B数据集创建了他们的模型,该数据集包含了近60亿张从网络上胡乱刮来的标记图片,并且已知包括大量受版权保护的创作。
开发”Stable Diffusion”的Stability.AI公司已经宣布,艺术家将能够选择退出下一代的图像生成器。但这把积极保护其知识产权的责任放在了内容创作者身上,而不是要求人工智能开发者在使用作品之前确保其知识产权–即使艺术家选择退出,这一决定也只会反映在平台的下一个迭代中。相反,公司应该要求创作者选择加入而不是选择退出。
开发者还应该研究如何维护人工智能生成的内容的出处,这将增加训练数据中包含的作品的透明度。这将包括记录用于开发内容的平台,所采用的设置细节,跟踪种子数据的元数据,以及便于人工智能报告的标签,包括生成的种子,以及用于创建内容的具体提示。这些信息不仅可以复制图像,使其真实性容易得到验证,而且还可以说明用户的意图,从而保护可能需要克服知识产权侵权索赔的企业用户,并证明输出不是由于故意复制或偷窃的意图。
如果(或更有可能,当)客户开始在合同中加入对这些审计跟踪的要求,作为供应商的作品不是故意的或无意的未经授权的衍生品的一种保险形式,开发这些审计跟踪将确保公司做好准备。展望未来,保险公司可能需要这些报告,以便将传统的保险范围扩大到资产包括人工智能生成的作品的企业用户。分解训练数据中包括的个别艺术家的贡献,以产生图像,这将进一步支持适当补偿贡献者的努力,甚至将原始艺术家的版权嵌入新的创作中。
创作者
个人内容创造者和创造内容的品牌都应采取措施,检查其知识产权组合的风险并加以保护。这涉及到积极主动地在汇编的数据集或大规模的数据湖中寻找他们的作品,包括视觉元素,如标志和艺术品,以及文本元素,如图像标签。显然,这不可能通过人工来完成TB级或PB级的内容数据,但现有的搜索工具应该可以实现这一任务的低成本自动化。新的工具甚至可以承诺从这些算法中进行模糊处理。
内容创作者应积极监测数字和社会渠道,以防止出现可能源自他们自己的作品。对于有价值的商标需要保护的品牌来说,这不是简单地寻找特定的元素,如Nike Swoosh或Tiffany Blue。相反,可能需要对商标和商业外观进行监测,以检查衍生作品的风格,这可能是由于对一个品牌的特定图像集的训练而产生的。即使人工智能生成的图像中可能不存在标志或特定颜色等关键元素,但其他风格元素可能表明,品牌内容的突出元素被用于制作衍生作品。这种相似性可能表明,通过使用可识别的视觉或听觉元素,有意占用普通消费者对该品牌的好感。模仿可能被视为最真诚的奉承,但它也可能暗示着对一个品牌有目的的滥用。
对于企业主来说,有关商标侵权的好消息是,商标律师已经确立了如何通知和执行对侵权者的商标权,例如发送措辞强硬的停止通知或许可要求信,或直接提出商标侵权索赔,不管是人工智能平台产生未经授权的品牌,还是人类产生的。
企业
企业应评估其交易条款,将保护措施写入合同。作为一个起点,他们应该要求生成式人工智能平台提供服务条款,确认为其人工智能提供的训练数据的适当许可。他们还应该要求对因人工智能公司未能适当许可数据输入或人工智能本身自我报告其产出以标示潜在侵权行为而造成的潜在知识产权侵权进行广泛赔偿。
至少,企业应该在其供应商和客户协议(用于定制服务和产品交付)中增加披露内容,如果任何一方使用生成式人工智能,以确保双方都理解和保护知识产权,以及各方将如何支持注册作者和这些作品的所有权。供应商和客户合同可以包括添加到保密条款中的人工智能相关语言,以禁止接收方将信息披露方的机密信息输入人工智能工具的文本提示中。
一些领先的公司已经为他们的客户创建了生成式人工智能的合同修改检查清单,评估每个条款对人工智能的影响,以减少非预期的使用风险。使用生成式人工智能的组织,或与之合作的供应商,应该让他们的法律顾问及时了解这种使用的范围和性质,因为法律将继续快速发展。
• • •
展望未来,拥有足够的自己的知识产权库的内容创作者可以考虑建立自己的数据集来训练和成熟的人工智能平台。由此产生的生成式人工智能模型不需要从头开始训练,而是可以建立在使用了合法来源的内容的开源生成式人工智能之上。这将使内容创作者能够以与自己作品相同的风格制作内容,并对自己的数据湖进行审计跟踪,或将这些工具的使用许可给感兴趣的各方,并对人工智能的训练数据及其输出进行明确的所有权。本着同样的精神,已经形成在线追随者的内容创作者可以考虑与追随者共同创作,作为训练数据来源的另一种方式,并认识到应在服务条款和隐私政策中征求这些共同创作者的许可,以利用他们的内容,并随着法律的变化予以更新。
生成式人工智能将改变内容创作的性质,使许多人能够做直到现在只有少数人拥有技能或先进技术来高速完成的事情。随着这一新兴技术的发展,用户必须尊重那些促成其创造的人的权利–那些可能被其取代的内容创造者。虽然我们理解生成式人工智能对创意阶层成员的部分生计的真正威胁,但它也对那些利用视觉效果精心制作其身份的品牌构成了风险。 同时,创意人和企业利益集团都有一个戏剧性的机会,可以建立他们的作品和品牌材料的组合,对它们进行元标记,并训练他们自己的生成式人工智能平台,可以生产授权的、专有的、(付费的或有版权费的)商品,作为即时收入来源。