百度文库昨日宣布,文库对非授权文学类作品的清理工作已基本完成,此前“三日内清空”的承诺兑现。
“人拉肩扛”审侵权
自百度文库纠纷爆发以来,先后经历了作家“3·15”发公开信、双方代表谈判、百度声明“三日内清空”等阶段。昨天,是百度发出“清理文库非授权文学类作品”声明的第三天。记者昨日下午登录百度文库,发现文库文学分类下的文档数减至不到150份。在文库纠纷前,这一数字为270多万份。
百度副总裁朱光昨日接受本报记者采访时表示,3月26日开始,百度调集公司各部门的技术力量,加速对文库中可能侵犯他人著作权的文档进行清理。即日起,百度文库用户如果上传一千字以上的文档,将由百度员工人工审核内容,确定没有侵权内容后才予以放行。“现在我们是人拉肩扛,全员上阵,但这种情况不可能持续。”朱光称。
昨日,记者使用自己的文库账号上传一小说的电子文本,文库提示“该文档无法上传”。但是,在文库的非文学分类中,记者仍然看到了一些版权书的电子版。
对此,朱光表示,文库文学分类是版权纠纷的“重灾区”,因此百度现在集中精力先清理文学类的侵权作品。对于非文学类文档,也在采用人工审核的方式清理。他呼吁,如果在文库中发现侵权文档,可通过文库首页的投诉通道直接投诉。
版权DNA比对系统五一后运行
朱光昨日透露,人工审核方式将持续到4月中旬。“4月11日之后,版权DNA比对系统将开始内测,五一之后正式运行。此后,百度文库将依靠这一系统维护版权方的权益。”朱光称。
据悉,版权DNA比对系统是百度在文库正式上线前研发的技术,通过对文档内容分析后提取的特征点进行判别,如发现侵权文档,则阻止上传。朱光表示,版权方可将作品电子文档提供给百度供提取特征点使用,百度也会自行采购一些热销、常见的文学作品制作特征点,以避免在没有版权方配合的情况下发生侵权。
百度文库相关负责人表示,全面清除侵权类作品后,下一步工作重点将放在加大与出版社及版权方的合作方面。百度将积极探索,通过用户付费、网络广告等方式,帮助版权方获益,同时将大部分利益回馈给版权方。