什么是科学大数据?数据科学遇到哪些挑战?重庆如何发展大数据?
5月11日,国家大数据重大科技基础设施研讨会议在重庆两江新区悦来国际会议中心隆重召开。以“数据科学和大数据的科学问题”为议题,来自全国各地的专家、学者针对科学数据计算问题进行探讨,为重庆谋划建设国际领先的数据科学和大数据技术重大科学基础设施建言献策。
什么是科学大数据?国家超算长沙中心副主任彭绍亮表示,科学大数据比较普遍的定义是把科学相关的大数据,叫科学大数据,一般是来自物理世界,内容包含科学实验数据和传感数据,特点是符合一定的科学规律,采集的代价也比较高。
“科学大数据具有复杂性、综合性、全球性等特点,从基因到宇宙黑洞,在从微观到宏观的在各个领域应用很广。”彭绍亮认为,科学大数据对IT系统提出数据中心的建设,服务质量、数据资源等多方面的需求和挑战,“我们认为科学计算能够解决一些更复杂的非线性的问题。”
大数据的终极目标是建立数据科学。建立数据科学的基础理论,需要建立一个“实验环境”。而年内拟向国家相关部委建议的在重庆建设的国家大数据重大科技基础设施(以下简称“大数据设施”)即是专家、学者们所设想的“实验环境”。
大数据设施是全球大数据领域第一个大科学装置,基本功能包括为数据科学家、大数据研发机构提供各类大数据场景、计算环境和试验验证环境,服务数据科学研究、大数据核心技术研发、数据科学和大数据人才培养、重大科学研究的数据试验,主要涉及试验能力建设、数据科学和大数据研究、人才建设等三方面的建设内容。
大数据设施怎么建?“重庆的科学数据立足点一定要思考我们做什么,不做什么。”专家们表示,重庆应该明确科学数据的定位、应用背景,结合重庆智慧城市、电子政务、工业大数据等多方面的数据资源开展数据科学的研究,搭建面向科学研究的实验平台。
重庆邮电大学教授许国良认为,大数据研究需要跨区域、跨行业的融合,希望大数据设施可以管理、存储能够体现长期规律的数据,对跨区域、跨行业、跨部门的数据进行协调支撑和融合。
“重庆有激情为科学服务非常难得,重庆支持大数据科学研究的同时,大数据设施建设也将助推重庆发展。”中国科学院院士、国家数字交换系统工程技术研究中心主任邬江兴表示,大数据设施建设应该为科学服务、为社会服务、为中国崛起服务。