作者:宗华 来源:中国科学报 发布时间:2016/8/16 10:00:36
选择字号:
免费网站“试水”数据二次发布
法律困惑阻碍数据科学发展

 Daniel Himmelstein 图片来源:Steve Babuljak

将来自上百万项生物学研究的知识编译到一个网络中——这是Daniel Himmelstein对Hetionet的诱人描述。Hetionet是将来自药物、基因和疾病的28个公共资源的数据聚合在一起的免费在线资源。不过,对于一个以公共信息为基础构建的产品来说,获得法律许可异常艰难。

当身为美国宾夕法尼亚大学数据科学家的Himmelstein联系研究人员以获得公开再现其工作的许可时,很多人对于他要询问此事表示惊讶。“我从未想到这里面还存在许可问题。”奥地利科学院分子医学研究中心生物信息学家Jörg Menche说。

Menche很快表示同意,但并非每个人都这么配合。一个研究小组从未答复Himmelstein,还有3个小组给出了答复,但仍未澄清可能的法律纷争。最终,Himmelstein在今年7月公开了Hetionet的最终版本——去掉了一个禁止再次发布的数据集,但将仍缺少再出版明确许可的3个数据集包括了进来。Himmelstein表示,这种混乱表明,很多研究人员并不理解简单地公开发布数据集并非意味着其他人能合法地将其再次发布。

在Himmelstein看来,这种混乱会阻碍科学的发展,因为研究人员将不被鼓励把数据集整合到更加有用的资源中。同时,随着科学家在网上发布更多信息,它还会带来越来越多的问题。“科学正愈发依赖于对数据的再次利用。”Himmelstein说。

由于一条数据或者说一个事实无法受到版权保护,因此很多科学家认为,那些未设置使用细则和条款的公开发布的数据集能被再次发布,而不会出现法律问题。不过,英国诺丁汉大学知识产权法专家Estelle Derclaye表示,这种想法未必正确。

欧盟为特定数据库授予独立于版权的权利,目的是保护在编译数据库方面所作的投资。从法律上讲,这些权利会阻止诸如Himmelstein等研究人员在未经同意的情况下再次发布由欧盟各国科学家创建的数据集。

其他国家也有不同层次的法律保护。不过,在像美国这样的不存在单独权力管理数据集的国家,仍会出现混乱。爱丁堡数字监管中心就数据授权发布的指南显示,关于在任何特定情境中数据可能如何被利用的法律立场的缺失很难得到解决。

为此,数据分享的倡导者建议,正在创建公共数据库的研究人员应加上明确的许可,以解释他们想让数据如何得到再次利用和发布以及是否放弃对数据库持有的任何权利。

就Himmelstein来说,他想利用的一些数据集拥有明确的许可——其中一些禁止无限制地再次发布,其他的则没有。Himmelstein表示,他的项目中最令人沮丧的部分在于感觉很多好的数据将被浪费,因为它们的创建者并未讲清楚能否再次发布这些数据。

布里斯托大学知识产权专家Andrew Charlesworth认为,这可能是因为极少有研究人员对法律抱有足够的信心,从而给予Himmelstein明确的指导。

来自华盛顿Policy Bandwidth律师事务所的知识产权律师Jonathan Band表示,即便没有明确的许可,Himmelstein也不可能因发布Hetionet而面临法律的处罚,除非他搞错并违反了为数据集设置的细则和条款。在网上公开发布其数据集的学者通常想让他们的成果被其他人获取到并且自由地再次发布。Band介绍说,目前还没有人因开展像Himmelstein这样的项目而惹上麻烦。

不过,Himmelstein并不相信自己在法律上不受阻碍。同时,他感觉此类不确定性可能会阻止其他科学家再现学术数据。Himmelstein表示,如果有研究人员推出了基于公开数据集研发的商业产品,因未获得明确许可而产生的风险便有可能增加。“我认为,这是一片未经充分测试的‘水域’。大多数学者不愿冒险引起将有助于澄清这些问题的法律纷争。”(宗华)

《中国科学报》 (2016-08-16 第3版 国际)
 
更多阅读
 
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
彭慧胜院士团队把“充电宝”做成衣服 缓解肠易激综合征  饮食比服药更有效
银河系发现巨大黑洞 史上最亮伽马射线暴来自一颗坍缩的恒星
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐