作者:甘晓 来源:中国科学报 发布时间:2014-3-10 11:13:06
选择字号:
第445次香山会议研讨数据密集时代科研信息化

阎保平作主题评述报告
 
进入21世纪以来,信息化在世界范围内得到迅猛发展,正在引发当今世界的深刻变革,重塑着世界政治、经济、社会、科技、文化和军事发展的新格局。人类科技活动也进入了信息化的科技研究(e-Science)阶段,人类科技创新能力提高到了前所未有的水平。随着高性能计算机、互联网、物联网等信息技术的飞速发展,以及强子对撞机、空间遥感等大型科学装置和科研设施的建立与运行,产生了海量的科研数据。数据密集型科研越来越成为当代科学研究的特征,科技进入了“大数据”时代。
 
党的十八大报告中明确指出“科技创新是提高社会生产力和综合国力的战略支撑,必须摆在国家发展全局的核心位置”。为进一步推进科研信息化,促进科技创新,展望数据密集时代科研信息化的应用前沿和发展趋势,分析数据密集时代科学研究活动给信息技术带来的挑战,探讨科研信息化领域的学科发展方向及有关科技政策。2012年11月20日至22日在北京香山饭店召开了以“数据密集时代的科研信息化”为主题的香山科学会议第445次学术讨论会,这是十八大召开后的第一次香山科学会议,意义重大。中国科学院地理科学与资源研究所研究员孙九林、中国气象局研究员秦大河、中国医学科学院研究员刘德培、中国科学院高能物理研究所研究员陈和生和中国科学院计算机网络信息中心研究员阎保平共同担任本次会议的执行主席。来自信息科学、地理学、气候学、高能物理学、天文学、生物信息学、农学、医学、中医学、情报与文献学、科技政策与管理学等学科领域的46位专家出席了本次会议。
 
本次会议针对数据密集时代科研信息化的应用前沿,数据密集时代科研信息化的技术挑战,科研信息化的概念、方法及相关科技政策这三个中心议题进行了充分的讨论,促进了不同学科领域专家之间的交流,增强了对开展数据密集时代科研信息化的重要性和必要性的认识,对于所面临的科学问题、机遇和挑战进行了广泛而深入的讨论,对科研信息化的重要性、发展中存在的问题等达成了共识,并对我国科研信息化的下一步发展建言献策。
 
第445次香山科学会议简报(摘要)
 
中国科学院计算机网络信息中心研究员阎保平在题为《数据密集时代的科研信息化》的主题评述报告中指出:人类社会已经迈入信息化时代。信息化在世界范围内得到迅猛发展,正在引发当今世界的深刻变革。在人类社会开始迈入信息化时代的同时,人类的科技活动也进入了前所未有的大发展时期。“科研信息化”(e-Science)是推动信息社会发展的动力,促进了科技创新,也是现代科学技术发展的必由之路。科研信息化已经被欧美等发达国家立为国策,它们正在积极部署并实施自己的e-Science行动计划,以此作为下一轮全球科技实力竞争的“杀手锏”,旨在提升国家的综合创新能力。她认为由图灵奖得主微软高级工程师Jim Gary提出的“数据密集型计算的科学研究”——第四范式是e-Science的深化和拓展,具有重要的意义。我国的科研信息化刚刚起步,在科研的基础设施、共享服务、科研应用、技术研发等方面已部署了若干重点项目和计划,为推动我国的科研信息化打下了基础。但与欧美等发达国家相比,我国的科研信息化差距很大,表现在理念认知度、概念转变、基础设施、应用推动、技术研发、人才培养、资金投入、组织管理等诸多方面。特别值得关注的是我国的国家信息化规划中尚无科研信息化的相关阐述。面对信息时代“科研信息化”带来的巨大机遇和挑战,我国的科技工作者和科技管理者任重而道远。
 
数据密集时代
 
科研信息化的应用前沿
 
中国工程院院士、中国科学院地理科学与资源研究所研究员孙九林在题为《数据密集时代科研信息化的应用前沿》的中心议题评述报告中回顾科学研究方法发展历程的基础上,总结分析了数据密集时代科学研究的特点及其对科研信息化应用的需求,对全球变化、高能物理、农业、地学、生物学、天文学等不同学科领域的发展趋势和未来重点进行了总结分析,并指出相应学科领域科研信息化环境的应用发展方向,包括:提高对数据密集型科研本质规律及由于模式改变而对科技创新和社会发展作用的认识;制定数据密集时代下科研信息化国家发展战略和行动计划,加大科研经费的投入;开展数据科学研究,研究科学数据探测、管理、共享、计算、挖掘分析、可视化表征等的基础理论、技术方法与应用问题;培养数据科学家,挖掘出更有价值的数据产品,通过科学数据驱动科研的创新与发展。
 
中国科学院院士、中国气象局研究员秦大河在题为《气候变化科研信息化》的专题发言中指出气候变化研究是计算密集型的科研活动,更是数据密集型的科研活动,充分利用信息技术,有助于推动科研模式转型。加强资源共享与跨学科合作,是促进气候变化研究的有效途径。信息化技术正改变着气候变化的研究方法。可以说,气候变化研究已经进入了“数据密集型”科研时代。
 
中国科学院院士、中国科学院高能物理研究所研究员陈和生在题为《粒子物理中的数据密集型计算》的专题发言中指出粒子物理数据密集型计算的发展趋势是将网格技术与云计算技术相结合,建设下一代数据密集型计算平台,以满足粒子物理实验等领域急剧增长的需求。与网格计算平台相比,各种领域的数据密集型计算都能以虚拟机的方式方便地利用这种平台,具有广阔的应用前景。
 
中国农业科学院研究员刘旭在题为《农业科研信息化的特点与前沿》的专题发言中指出农业科研已进入信息化时代,应该积极推进农业科研协同研究,建立跨时空、跨学科的科研平台,实现资源环境的共享及科研的协作;积极开展“大数据”收集、处理和分析等核心技术的研究;研究建立高效、科学的农业科研信息化平台,打造农业科研信息共享、农业科研活动协同、农业科研管理的网络化环境,实现科研档案的电子化、科研成果数字化、科技资源的系统化。建议在“四化同步”新阶段应重点关注“现代农业基准数据”“农产品监测预警”“农业生产精准决策”等重点领域的大数据技术发展。
 
中国工程院院士、中国医学科学院研究员刘德培在题为《人口与健康领域科研信息化现状与展望》的专题发言中指出人口与健康领域科研信息化对于建立新的医学模式、推动转化医学的开展提供了有力支撑。数字化医院、区域医疗信息化等医疗卫生信息化产生了大量数据资源,成为人口与健康领域海量数据的源泉。
 
中国科学院生物物理研究所研究员陈润生在题为《基因组相关研究与高性能科学计算》的专题发言中指出基因组研究综合运用了数学、计算机科学和生物学的方法。近年来基因测序技术发展十分迅速,新一代测序设备产生了海量测序数据,而这些数据又进一步促进了交叉学科的发展,不仅生物信息学自身,而且包括系统生物学、合成生物学等也得到蓬勃发展。信息科学,尤其是高性能计算对于非编码序列与非编码基因的研究、生物大分子的结构模拟与预测等都有非常重要的作用。
 
中国人民解放军总医院教授尹岭在题为《气象医学研究与疾病预防》的专题发言中指出国家人口与健康科学数据共享平台启动了气象医学专题服务,为开展气象医学提供数据共享服务,并在积极探索利用气象和医学大数据进行科学研究的新途径。
 
中国中医科学院研究员崔蒙在题为《中医药科研信息化的关键科学问题研究》的专题发言中指出中医药科研信息化在数据获取、存储模式及技术等方面还存在问题,中医药信息数据处理结果还不能满足实际需要,数据交换程度不高。中医药数据源于中医药信息,中医药信息的特点决定了中医药数据是知识密集型数据,需要有相适应的处理方法。建立基于本体的中医概念体系、基于中医数据特点的信息采集技术体系和处理方法、建立中医药信息交换标准、建立临床决策支持数据服务模式和计算机辅助中药新药研发的新模式等是中医药科研信息化亟待突破的问题。
 
数据密集时代
 
科研信息化的技术挑战
 
中国科学院计算机网络信息中心研究员黎建辉在题为《数据密集时代科研信息化的技术挑战》的中心议题评述报告中指出数据密集时代科研信息化面临的技术挑战包括:在人机物三元融合时代,自动化的数据采集与获取手段和方法;多元数据质量与可信度验证;数据的存储、归档与保存;多学科海量数据汇聚、集成和组织、超大规模的数据高效处理;低成本可按需使用的高速网络;大规模多源数据的动态交互式可视分析;应用目标牵引下的技术集成,形成标准化的服务;基础设施集成整合,对用户和应用透明;同时满足共享与个性需求,快速构建面向特定问题的研究系统等。
 
中国科学院计算技术研究所研究员许鲁在题为《数据密集时代存储系统的关键技术》的专题发言中指出数据密集时代的科研信息化对存储系统的需求包括成本、可靠性、性能、可伸缩性、适应性、可管理性等多个方面以及存储领域的相关研究热点,即在数据密集时代的科研信息化中发挥着重要作用的网络连接式存储、文件系统和存储网络设备等。
 
北京大学教授李晓明在题为《互联网海量数据带来的机遇和挑战》的专题发言中指出互联网和Web技术的发展使得信息的产生已经实现了大众化,形成了海量数据。当前数据价值的开发远落后于数据的收集,因此任何数据工程的建设应该同时注重数据应用,他强调应关注“以小博大”和“循序渐进”等方法和技术。
 
北京大学教授袁晓如在题为《数据密集时代科研信息化的可视化与可视分析》的专题发言中指出在数据密集时代,对大数据的分析理解是关键问题。可视化是理解复杂现象、诠释复杂数据的重要手段和途径,而可视分析是可视化的新发展。他提出科学领域迫切需要发展相应的适应数据密集时代需求的可视化和可视分析新方法、新模式。
 
科研信息化的概念、方法
 
及相关科技政策
 
中国科学院研究员桂文庄在题为《科研信息化的概念、方法及相关科技政策》的中心议题评述报告中指出我国科研信息化总体上缺乏国家层面的整体战略和规划;基础设施及其应用较为落后,国家层面的部署和支持不够;对信息化条件下的科研活动政策研究不够,法规制度体系很不完善;整体上,科研信息化水平不高,服务和应用人才缺乏。
 
中国科学院国家科学图书馆研究员方曙在题为《国际科研信息化发展战略》的专题发言中指出为了抢占科技发展的先机,世界各国近年来都顺应科研信息化发展的最新趋势,采取积极的措施,从国家层面部署和实施了一系列科研信息化战略与规划。在信息化基础设施的支撑下,目前世界各国广泛开展新模式下的科研活动,实施的项目覆盖粒子物理、天文学、地球科学、生态学、海洋科学、医学、生命科学等多个学科领域。随着科研信息化的飞速发展,今后必将有越来越多的工作能够借助信息化设施开展多层次、多学科、大范围、跨地区的研究,并取得重大突破性进展。
 
中国科学院地理科学与资源研究所副研究员王卷乐在题为《科技计划项目数据汇交的政策与实践》的专题发言中指出数据是科学研究的生命,科学数据不仅是科学研究的基础,同时也是科学研究的重要成果。及时汇交和共享科学数据资源,既是国家科技投入的直接效益体现,也是促进这些数据更好地被归档、存储、共享和开发利用的重要途径。
 
中国科学院科技政策与管理科学研究所研究员赵作权在题为《数据密集时代的科技政策》的专题发言中指出美国的数据政策以“信息自由法案”和“信息质量法案”为依据,形成结构清晰的多层次多部门的政策执行体系,美国的创新政策强调“创新生态系统”思想,突出追求卓越的精神;我国的数据政策以“科技进步法”和“政府信息公开条例”为基础,形成省部级部门主导的多层次政策实施体系,偏重项目和工程层面的推动。我国创新政策以科技体制改革为动力,强调国家创新体制建设。
 
会议共识与建议
 
通过此次会议,与会专家初步达成如下共识:
 
1. 科研信息化是建设创新型国家和美丽中国的重要科技支撑条件,是现代科学技术发展的必然趋势。密集型数据的获取、传输、处理、分析、可视化、共享和利用是数据密集时代科研信息化的重要内容,数据科学应运而生。开展数据密集时代科研信息化的研究和战略部署意义重大。
 
2. 综观国际国内大势,我国科技发展正处于可以大有作为的重要战略机遇期。但目前在国家层面对科研信息化重视不够,国家的信息化规划中尚无关于科研信息化的阐述,缺乏对科研信息化的整体战略和规划。
 
3. 近十余年来,科技部、基金委、中科院等部级单位在科研信息化方面做了大量的工作,积累了相当丰富的技术和数据资源,但资源共享相关的政策法规体系不完善,支持力度有待进一步提高。
 
4. 我国科研信息化的人才匮乏,特别缺乏学科交叉型的复合人才和数据科学人才等;从管理者到科技工作者对科研信息化的重要作用和意义认识不够,亟须深刻普及科研信息化理念及知识;学科领域专家与IT技术专家的合作方式与深度亟待加强。
 
5. 我国科研数据的获取、传输、处理、分析、可视化、共享技术和应用水平有待提升;对各学科领域科研信息化共性技术的研究和相关系统工具的开发亟待加强。
 
与会专家就如何推动我国数据密集时代开展科研信息化研究,如何建立我国的科研信息化政策法规、人才队伍等提出如下建设性意见:
 
1. 在国家有关部门设立国家层面的科研信息化咨询专家组,组织制定国家科研信息化战略规划。
 
2. 针对当前数据密集时代的科技研究的新需求、新特点和新技术、新政策等问题,建议科技部、基金委、中国科学院等部门部署国家层面的科研信息化研究计划,加大对科研信息化基础设施和应用的投入。
 
3. 将数据科学作为计算机科学技术的二级学科纳入《学科分类与代码》国家标准中。
 
4. 建议将数据科学的人才培养纳入研究生培养体系,同时将数据人才的岗位纳入国家相关岗位体系,为提升国家科研信息化水平培养储备人才。
 
5. 制定《科学数据资源共享条例》及相关配套政策,建立数据共享平台,向社会公众开放科技信息资源,促进科研创新成果不断向企业转移转化,带动国家和地方产业发展。
 
(本报记者甘晓采访整理)
 
《中国科学报》 (2014-03-10 第8版 专题)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
银河系发现巨大黑洞 史上最亮伽马射线暴来自一颗坍缩的恒星
中国天眼揭秘宇宙“随机烟花” 导师:年年审毕业论文,总有这些问题!
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐