8月16日炒股在线杠杆真实网站,上海秘塔网络科技有限公司官微发布声明称,昨日公司收到《中国学术期刊(光盘版)》电子杂志社有限公司(下称“知网”)长达28页的侵权告知函。
秘塔科技在声明中表示,秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。
秘塔科技称,即日起秘塔AI搜索将不再收录知网文献的题录及摘要数据。
秘塔:没有search(搜索),就没有research(研究)
据AI秘塔微信公众号8月16日消息,上海秘塔网络科技有限公司官微发布声明称,昨日公司收到知网长达28页的侵权告知函。
图片来源:AI秘塔微信公众号
“知网”是中国知网CNKI系列数据库编辑出版单位。侵权告知函提到,“知网”发现秘塔通过秘塔AI搜索、秘塔AI搜索APP向用户提供其学术文献题录及摘要数据,且数量巨大。侵权告知函要求,立即停止在搜索服务中提供中国知网学术文献题录摘要数据,“同时,我司不希望我司网站中国知网被秘塔科技搜索到,请立即断开搜索结果到我司网站的链接。”
图片来源:AI秘塔微信公众号
秘塔AI表示,依照学术规范,文献的摘要和题录应具有独立性和自明性,能够使读者不阅读全文就能获得必要的信息。秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。“近些年国际学术界、出版界和图书情报界联合推动的《布达佩斯开放存取倡议》(BOAI)即在不断推进学术文献的免费阅读、下载、复制、传播、打印和检索。没有search(搜索),就没有research(研究)。”
秘塔AI表示,从即日起,秘塔AI搜索将不再收录知网文献的题录及摘要数据,转而收录其他中英文权威知识库的文献题录及摘要数据。
上海秘塔网络科技有限公司成立于2018年,今年2月上线“秘塔AI搜索”。
根据公开资料,秘塔科技近期完成了超1亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投,秘塔之前的老股东有明势资本、猎豹移动和丰元资本等。
团队方面,秘塔科技创始团队背景较为丰富,涵盖了人工智能、计算机工程以及法律等多个领域。核心团队主要有董事长兼CEO闵可锐、技术专家唐悦和首席运营官王益为等。
根据天眼查数据显示,闵可锐持股比例为28.8%。他拥有复旦大学计算机科学学士学位和牛津大学数学硕士学位,并且在多个知名公司担任过重要职务,包括玻森数据的CTO&联合创始人、猎豹移动首席科学家以及微软亚洲研究院的实习研究员。
律师分析:知网无权干涉文章训练,但拥有网络传播权
上海大邦律师事务所高级合伙人、律师游云庭对澎湃科技表示,秘塔AI搜索的“学术”版块最大的问题在于可以完整展现文章内容,“论文PDF在研究结果里,虽然不能下载,但用户在结果页里点PDF的链接,是可以查看这篇文章全文的,这侵犯了这篇文章的信息网络传播权。”但如果吸收了文章精华后,人工智能用自己的方式转述给用户,根据《著作权法》规定,为了说明某个问题合理引用部分作品内容的,属于合理使用。
对于大模型用论文数据做训练,游云庭表示,这种行为并不侵权中国知网。根据《著作权法》,训练的过程是复制和学习,复制是将文章从网络复制到服务器里训练,学习是否属于侵权,目前在法律上没有明文判决可以判断。但不管是复制权、学习,还是涉及到的著作权的其他权利,中国知网都不是论文权利人。
游云庭举例,比如作者投稿某杂志,杂志刊登后,文章的版权可能是作者的,也可能是作者授权给了杂志,“知网只是进行了收录,拥有信息网络传播权,而且是一个分授权,所以知网无权干涉这篇文章的训练。”但他表示,如果是杂志社过来维权,那么秘塔将面临《纽约时报》起诉OpenAI一模一样的问题。
《纽约时报》起诉OpenAI,争议在哪?
在意识到ChatGPT对历史和时事的了解源自其网站上发布的故事(甚至是付费内容)时,去年年底,《纽约时报》对OpenAI以及微软提起诉讼,指控后者未经授权使用该报版权内容训练AI模型,并在ChatGPT产品中呈现给用户。
该案打响了媒体机构起诉OpenAI的第一枪,随后又有多家媒体加入了这一反抗的队列。据《每日经济新闻》记者的不完全统计,截至今年6月底,已至少有13家新闻媒体机构对OpenAI和微软提起了侵权诉讼。
“判断这种数据抓取行为是否侵犯版权,是一个复杂且有争议的问题。”安杰世泽律师事务所合伙人、中国和美国纽约州执业律师于雯竹在接受每经记者采访时表示。
《纽约时报》的起诉不仅是媒体领域的重要里程碑案件,亦可以为法律业界提供极具参考价值的信息。
目前,该案件但还没有定论。
媒体之难:证明“实质性相似”
《纽约时报》在起诉书中称,ChatGPT几乎逐字复制了其新闻报道。该报举例称,2019年,《纽约时报》发表了一篇荣获普利策奖的关于纽约市出租车行业掠夺性贷款的系列文章。该报称,只要稍加提示,ChatGPT就会一字不差地背诵其中的大部分内容。
在其他多家媒体的起诉书中,记者发现,其法律论证和主张都基于美国1976年版权法和《数字千年版权法》(DMCA)。对于这两部法案中涉及AI的内容,于律师告诉《每日经济新闻》记者,“就1976年版权法而言,侵权的判定通常依赖于原作品和被指控侵权作品之间的相似性,以及实际的复制行为。本案中实际复制行为相对容易证明,因为OpenAI并未否认其训练数据中包含《纽约时报》的文章。”
然而难点在于,“证明最终生成的文本构成版权侵权仍需满足‘实质性相似’测试,因为它有助于判断受版权保护的表达元素是否被复制,还是仅复制了其中的思想。版权保护的是表达,而不是思想。你可以用自己的语言重新实现他人的思想,这不构成版权侵权。但如果你使用他人的语言——即他们的表达——那就是版权侵权。”于律师说道。
谈及DMCA,于雯竹解释道:“其中的一项规定鼓励版权持有者在数字资产中添加内容管理信息(CMI),例如帮助识别创作者或权利持有者的信息,并禁止他人移除这些信息。”然而,《纽约时报》起诉书提到,OpenAI在抓取其文章以创建数据库时,移除了这些信息,违反了DMCA。
OpenAI的“盾牌”:“合理使用”
而在回应《纽约时报》版权侵权诉讼时,OpenAI强调使用公开材料训练AI模型属于合理使用。这一规则基于美国1976年版权法第107条规定。哈佛法学院教授丽贝卡·塔什内特(Rebecca Tushnet)在接受《每日经济新闻》记者采访时认为,“美国版权法既提供了广泛的权利,也提供了广泛的例外。关键问题是AI训练是否构成‘合理使用’,以及当AI输出与现有作品过于相似时,该问题到底应该归咎于模型还是用户的滥用。”
塔什内特认为,“OpenAI提供了有一个有趣的主张,即(AI)要获得高度相似的输出,必须故意用《纽约时报》原始文章中的大量引文来提示模型,这表明错误在于提示者(用户的滥用)。”“‘合理使用’是美国版权法的一项关键优势,使其能够应对不断变化的情况。它促成了我们所知道的现代互联网的兴起,尤其是搜索引擎。按照同样的推理,只要输出通常不是从特定作品中复制而来,创建AI模型就应该被视为变革性的和公平的。”
她对记者解读称炒股在线杠杆真实网站,“我认为这是一个相当标准的有关‘合理使用’的问题。”根据1976年版权法,判定合理使用的认定包括四个因素。其中,于雯竹认为,最重要的是第四点:使用对版权作品的潜在市场或价值的影响。“简而言之,就是新作品是否对原作品构成‘市场损害’。”