论人工智能深度学习中著作权的合理使用.docx

上传人:b****6 文档编号:3108491 上传时间:2022-11-17 格式:DOCX 页数:11 大小:32.16KB
下载 相关 举报
论人工智能深度学习中著作权的合理使用.docx_第1页
第1页 / 共11页
论人工智能深度学习中著作权的合理使用.docx_第2页
第2页 / 共11页
论人工智能深度学习中著作权的合理使用.docx_第3页
第3页 / 共11页
论人工智能深度学习中著作权的合理使用.docx_第4页
第4页 / 共11页
论人工智能深度学习中著作权的合理使用.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

论人工智能深度学习中著作权的合理使用.docx

《论人工智能深度学习中著作权的合理使用.docx》由会员分享,可在线阅读,更多相关《论人工智能深度学习中著作权的合理使用.docx(11页珍藏版)》请在冰豆网上搜索。

论人工智能深度学习中著作权的合理使用.docx

论人工智能深度学习中著作权的合理使用

论人工智能深度学习中著作权的合理使用

作者:

徐小奔杨依楠

来源:

《交大法学》2019年第3期

徐小奔中南财经政法大学知识产权研究中心专职研究员、讲师、法学博士。

本文系文化和旅游部2018年度文化和旅游研究项目“权利科学视野下非物质文化遗产法律治理机制研究”(项目编号:

 18DY20)的阶段性研究成果。

杨依楠中南财经政法大学知识产权学院2018级硕士研究生。

摘要自由地分析数据是通过深度学习发展人工智能的前提。

如果人工智能分析的对象恰巧是作品,则不可避免地需要对其进行扫描与复制,由此产生著作权的侵权争议。

互联网时代,作品以数据的形式进行传播。

由于作品在利用上存在非竞争性的特点,人工智能可以借助于机器分析不断从作品中发掘出新的价值,满足不同主体的特定需要。

尽管深度学习中对作品的分析行为与原作品息息相关,但机器分析后形成的价值既不是对作品的原样呈现,也不是对作品内容的演绎性表达,而是独立的、新的作品增值。

作品增值的结果是对作品思想层面的利用,但是知识增值的过程——深度学习则不可避免地要对作品进行转换性使用,可归入合理使用的范畴。

将人工智能深度学习纳入合理使用不仅与合理使用规则变迁的历史趋势相一致,也符合著作权法激励创新的目的,更有助于人工智能产业的健康发展。

关键词人工智能深度学习作品合理使用权利限制

导论

算法自由是当下人工智能技术发展的阶段性目标。

深度学习的独特之处在于通过模仿人类大脑神经元的分层结构,自动从海量数据中获取具有多层表达的特征。

换言之,传统算法需要人工预先确定学习对象的特征,深度学习则可以通过算法自动构建特征,使机器可以不在人类的干预下从数据中发掘出有价值的内容。

以人工智能学习写作为例,为了生成与某一作者相似风格的文章,人工智能系统需要首先输入该作者所有的文章并对其进行数据分析。

经过词频统计以及关键词提取,若机器发现该作者的文章中经常使用许多幽默、诙谐的词语,那么就会将该作者的写作风格标记为幽默,并对其常用的词语和行文习惯进行保存,生成相应的模版。

一旦需要生成相似的文章,只需要提供素材,机器就会自动根据其自我生成的模版将素材嵌入到合适的位置。

久而久之,人工智能通过分析标记大量相同主题的文章,甚至可以对比不同作者的写作内容,形成自己对某一风格的独特理解。

在人工智能自发提取数据特征的过程中,由于缺乏人为设置的特征标准,因此很容易出现误差。

只有最大限度地拓展训练数据的范围及数量,才能有效减少数据偏差,从而保障人工智能自发提取数据特征的准确性。

因此,能自由地获得、使用数据是通过深度学习来发展人工智能的前提和关键。

人工智能在分析数据的过程中可能面临着著作权侵权的困境。

一般而言,无论是自然人对作品分析还是人工智能的机器分析,其主要的目的是理解作品的内在思想并形成新的思想以实现知识的更新。

从这个意义上看,作品分析主要是对作品思想的利用,依据思想表达二分法的著作权保护范围标准,作品分析应当是自由的。

但是,所有的作品分析前提是接触作品,这便不可避免地涉及对作品表达的使用,换言之,正是通过作品表达的使用才能理解作品思想,由此便产生著作权争议。

具体而言,所有的机器学习都需要事先汇总并输入数据,并在人工智能系统中形成数据副本。

如果输入的数据中包含着大量未经著作权人授权使用的作品,那么这种行为可能会构成对著作权人复制权的侵犯。

对于动辄输入数千万份数据的人工智能产业主体来说,事先获得许可的做法显然面临着过高的交易成本,一旦被认定为侵权,成千上万份作品的损害赔偿甚至会让人工智能产业面临破产。

为了解决人工智能产业发展的困境,日本于2018年2月对《著作权法》进行了修订,增加了“灵活的权利限制条款”,原则上允许互联网和高科技企业可以不经著作权人同意直接使用作品。

参见《日本大尺度修改〈著作权法〉》,载中华人民共和国国家版权局网站(http:

//

一、 复制与分析:

 人工智能深度学习行为的著作权含义

(一) 复制:

 作品分析行为的前提

现代著作权制度设计的基本逻辑是将作品这一具有公共物品特征的客体转变成私人财产,并通过市场交易使作者或者著作权人获得报酬,激励更多的人从事职业创作,最终促进社会文化的繁荣。

从市场经济的角度看,作品之所以能成为商品进行流通,是因为作品具有使用价值,即作品能够满足人的某种主观偏好。

例如,美术作品通过线条与色彩搭配可以使人获得视觉上的愉悦,音乐作品则通过对音符、和弦、节奏的联结为人们营造听觉上的独特体验。

因此,著作权交易的本质即是作者将作品的使用价值让渡给消费者,从中获得交易价值,从而推动作者进行持续创作。

康德曾指出作品是“作者向自己的读者的讲话”,作品的印刷是出版商“以作者的名义”将作者的言论“带到公众中”的过程。

参见[德] 康德:

 《论书籍翻印的不合法性》,载《康德著作全集》(第8卷),李秋零译,中国人民大学出版社2013年版,第85~86页。

可以说,作者与读者之间交流的实现在于作品在读者眼前原样呈现,使读者据此了解作者的意图。

此时,通过作品原样呈现的以满足读者需求的使用价值可以被称为作品的原初价值。

在著作权法诞生之初,受制于当时的技术条件,作品在一般情况下无法与其载体相分离,作者与读者之间的交流必须借助于占有作品的物质载体才能实现,也即作品的使用价值必须附着在有形复制件之上。

消费者只有占有作品的复制件,才能直接阅读、欣赏负载其上的作品。

因此,复制权是现代著作权制度的原初性、基础性权利。

也即是说,在以印刷、出版为作品核心传播方式的时代,复制行为就是将作品复制件从一变多的过程。

在1886年《保护文学和艺术作品伯尔尼公约》(以下简称为《伯尔尼公约》)制定之初,作品的传播途径主要有公开表演和印刷出版两种形式,伴随着印刷技术与出版产业的发展,印刷与出版成为作品能够在全球范围内传播的主要手段。

因此,《伯尔尼公约》建立了以复制权为核心的作者经济权利体系。

《中华人民共和国著作权法》(以下简称为《著作权法》)第10条第5项将复制权定义为“以印刷、复印、拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的权利”,就是沿袭了以有形载体为作品传播方式的定义模式。

如此一来,作者只要控制了作品的复制,就相当于间接地控制了作品的传播,进而通过大量印刷、销售作品复制件获利。

从创新激励的制度原理角度来看,如果权利人无法垄断作品复制件的供给,则会导致其他人在不进行创作的情况下获得复制件,取代作者的地位与消费者进行交易,这将严重损害作者的市场利益,消耗作者的创作动力。

因此,为了激励创作,著作权法限制了印刷复制件的行为,赋予作者对作品复制的垄断性权利。

从表面上看,复制权在著作权法上的含义是作品通过有形载体的原样呈现,但背后真正的价值基础在于这种再现的形式可以直接满足市场中消费者对作品的特定的使用需求,实现作者向读者的知识传递。

(二) 知识增值:

 作品分析行为的结果

人工智能的深度学习从运行模式上看就是对数据的机器分析过程,在这一过程中实现了对数据价值进行挖掘,并在数据的原始价值之上挖掘出新的价值,即知识增值。

知识增值主要产生于以下几种机器分析方式。

参见[英] 维克托·迈尔舍恩伯格、肯尼思·库克耶:

 《大数据时代:

 生活、工作与思想的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第127~145页。

第一种方式是对数据的基本再利用,即将原本用于某一特定目的而生产的数据运用于另一目的,这也是知识增值最常见的途径。

譬如高校可以挖掘校园卡流水数据用于贫困生的认定。

第二种方式为混合数据,是指叠加两种主题不同的数据集,用新的方式进行重组。

相比于数据的部分,数据的总和往往更有价值,因此,重组后的数据价值会超过原有的单一主题的数据集。

丹麦将使用手机用户的数据集与特定类型的癌症患者的数据集交叉比对,发现二者相关性的例子就属于数据重组。

第三种方式是创造扩展性数据,换言之,从数据产生之初就设计它的可扩展性,实现相同数据集的多种用途。

例如,商店中的监控数据既可以防止盗窃事件的发生,又能观察消费者在每个货架停留时间的长短,以调整货品的摆放位置与摆放方式,从而提升消费者的购买意愿。

第四种方式则关注数据的折旧价值,虽然信息具有一定的时效性,然而旧数据仍然存在强大的价值可供挖掘。

具言之,同比数据的计算与数据走势的观察均依赖于旧数据的支撑。

从企业利润的增长率到国内生产总值的同比、环比增长,再到人类人口增长率及地球冰期与间冰期的周期性研究,无一不是利用了数据的折旧价值。

第五种方式则是挖掘数据的副产品。

在用户获取信息时,数据生产者可以捕捉到用户进行检索的全过程,例如用户在搜索引擎键入关键字后,选取了哪一页的哪一个链接,浏览了什么页面,或者直接放弃检索。

新浪微博便通过分析用户搜索内容的数量设计了“排名算法”,即“热搜排行榜”,对某一内容进行搜索浏览的用户人数越多,该内容在热搜榜上的排名也就越靠前。

参见梁秋实、吴一雷、封磊:

 《基于MapReduce的微博用户搜索排名算法》,载《计算机学报》2012年第11期。

可见,随着时代发展和技术进步,越来越多的数据信息被创造生成,越来越多的使用者得以接触数据并利用,数据价值呈数量级增长。

这些知识增值行为的共同特点在于超越数据的通常用途(原初价值)而发掘出新的、与原初价值相独立的用途。

人工智能通过深度学习产生的知识增值,相较于通过占有作品有形载体(复制件)而获得的作品原初价值具有明显的不同。

受制于复制件的物质形态,对作品原初价值的利用,以占有作品有形载体为前提。

因此,在时空上,作品载体的使用在不同主体之间具有竞争性。

作品数据化之后脱离了有形载体的限制,对作品的利用呈现出非竞争性的特点,数据的具体用途不仅不会受制于特定形态,在二次利用中也不会产生价值减损,只要能够被使用者获取并满足使用者的需要,就能产生与数据原初价值所不同的知识增值。

可见,数据的利用次数影响了数据的价值,经手数据的主体越多,二次利用的方式也就越多样,这意味着数据满足了更多使用者的需求,使得数据在传播中不断产生增值。

正是源源不断的数据传播及整合才创造了更大的利益。

由于不同的使用者对数据具有不同的需求,而生产数据的主体出于行业壁垒、地域差异、技术限制等因素,永远无法穷尽数据的所有潜在用途。

数据利用对使用者来说意味着做出具体的选择:

 将其应用于哪一领域,基于何种目的,用于解决何种问题。

做出特定选择的时刻,数据便满足了使用者的这一特定需求,数据价值也就得以实现。

在没有人工智能的时代,人也可以通过分析数据而挖掘知识增值,但是人对作品的分析与人工智能深度学习中的机器分析,从作品原初价值的消耗上来看具有截然不同的意义。

人对作品的分析是接触、阅读、理解作品的过程,其知识增值是人归纳、分析、综合后的智力产出。

单就作品分析的过程本身而言,其既是人获取知识的目的,也是创造新知识的手段,是原初价值与知识增值的双重满足。

以文献学术分析为例,人在阅读、分析文献的过程中,哪怕没有得到任何知识输出(知识增值),也增长了自我知识的积累。

这种知识的积累构成了文献分析者对作品原初价值的主观需求,也因此成为向作者付费的基本理据。

但是,就人工智能的深度学习而言,机器分析是执行既定算法的结果。

人工智能可以根据不同的算法区分信息摄入重点,具备单纯地进行机械分析与收集的能力,从作品中不断挖掘出新的价值。

由于人工智能不是主体,不能认为人工智能通过深度学习获得了知识积累就像人的知识积累一样具有主观偏好性,是一种主观效用上的需求。

人工智能对数据的分析本身只能是为了实现另一个目的(如分析市场上消费者对幽默作品的需求)而采取的一个纯粹的技术手段。

换言之,人

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 幼儿读物

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1