长三角议事厅|上海成立长三角区域科技数据中心的设想和建议
原标题:长三角议事厅|上海成立长三角区域科技数据中心的设想和建议
产业数字化、数字产业化、发展数字经济是未来科技与经济发展的重要趋势,以新技术、新产业、新业态、新模式为引领的新经济正成为上海未来经济发展大厦的“四梁八柱”。尤其是以ABC(人工智能AI、大数据Big data、云计算Cloud computer)为代表的技术应用创新,以及集成电路、IOT、区块链、量子通信等万物互联技术,渐次带来了人脑解放、智力解放、劳动力解放,释放出巨大消费潜力,正在解构、颠覆、重组经济秩序、市场秩序和全球秩序。
因此,提供以科技资源数据化为核心的科技公共服务已是世界各国的通行做法,利用已有数据、产生科技成果、形成新的数据、继续共享利用也已成为科学数据支撑社会变革、民生及科技创新的可行模式,并得到各国政府和科技界的普遍认同。
长三角是中国大学、科研机构、创新型企业最为集中的区域之一,也是京津冀、珠三角、长三角中唯一拥有两个综合性国家科学中心的区域。同时,各地分工明确:江苏的优势在制造业;浙江的互联网、数字经济发展快速;安徽的科教行业、新型工业化是亮点。上海有责任也有义务牵头建设集成科学数据中心为一体的研发公共服务平台,并逐步推动科学数据中心在长三角城市群实现共享,助力长三角城市群实现创新驱动的高质量发展。
基于此,对在上海设立长三角区域科技数据中心作出如下设想与建议:
一、基本思路
1、建设目标:实现“科技资源开放共享+支撑科技决策咨询+服务社会、民生”
以建设具有世界影响力的科技数据中心为目标,以“科技数据支持决策”为核心业务,面向国际科技前沿,面向长三角区域经济社会发展重大需求,实现“科技资源开放共享+支撑科技决策咨询+服务社会、民生”,推进长三角区域科技创新资源数据化,为上海加快建成具有全球影响力的科技创新中心和实施长三角区域一体化国家战略提供科技公共服务支撑。
2、功能定位:数据应用、共享服务和战略咨询
(1)科技创新资源数据中心
在知识类数据方面,建设基础科学数据库,提供多途径的科学数据应用与共享服务。为长三角科研单位、重大工程项目提供数据资源的长期积累、保存整理和散发服务,满足重要数据资产的长期保存和重复利用需求。通过长期积累、编辑整理数据资源,为基础研究开发相应的数据检索、分析工具。
在应用类数据方面,做到科研能力与科技成果的“显性化”。通过辅助建设信息沟通交流平台,有效地汇集和展示长三角区域各个国家重点实验室、大科学基础设施的运行情况与产出成果,以便相关成果兴趣方与受众方更便捷、更有效地了解科技资源情况。
(2)科技发展战略咨询中心
对长三角区内外企业而言,可设立“business综合性数据库”,辅助企业发展战略决策。提供需求方感兴趣的国家重点实验室、大科学装置、科研院所、大学、企业的项目、能力、方案、设施资源,及其查询通道;通过建立交互式网站,为用户提供实用的技术转移协议模板、技术查询软件工具和成功的技术转移参考案例等。
对三省一市各级政府和管理部门而言,将大数据提升为区域的战略性资源,应用在城市和区域经济、文化、卫生、教育、生态与城市安全等社会治理上。一是结合长三角ICT(信息通信技术)产业发展,以大数据应用开发为主要战略方向,助力地区联动、民本高效、安全开放的高水平信息社会建设。二是围绕人类科学、数据共享等关键热点领域,部署推进区域性大数据建设的相关计划,服务创新、服务增长、服务治理透明。
二、建议
1、建立高效的运行管理机制,提升服务水平
(1)公立平台、非盈利性质、企业化运作
长三角区域科技数据中心的本质是“官产学研”合作,具有公立属性和非盈利特点,但在运维上,有必要建立起一套完备的企业参与机制,实现“政府引导,市场化运作”运行管理。
具体而言,第一,关于联盟合作:制定完善的法律法规和激励措施,从体制上完善“官产学研”联盟合作方式,以提高企业对平台投入的积极性。第二,关于企业参与:一是鼓励重点优势企业参与平台建设,鼓励中小企业结盟。二是通过契约、产权规则和约束条例等正式的制度安排,规范并监督企业参与行为;建立良好的企业进入和退出机制。三是充分利用三省一市政府的社会关系网络,推动大型企业高效参与平台建设和运行。
(2)设立研发公共服务平台建设基金会
设立专门的基金会,由政府主导,企业、行业协会、高校等部门参与共同出资。一方面,为科技数据中心的运转提供更多可用资金;另一方面,为科技资源库共建、共享提供经济支持。基金会还具有对外进行项目投资的功能,这使得长三角区域科技数据中心有自主权去选择合作项目。
2、建立完善的供需服务机制,提高服务效率
(1)制定科学数据采集、汇交、利用、管理的基本规范
制定长三角区域科技数据中心科技资源采集、汇交、利用、管理规范。一是对接科学研究领域,按照学科分类进行数据分类采集。依据《中华人民共和国学科分类与代码国家标准》(GB/T 13745-2009)(以下简称《学科分类与代码》),按照一级学科、二级学科分类标准对科学数据中心采集的数据进行分类。
二是明晰科研成果(论著、专利等)、科技项目、科研经费、科研人才(专家评估等)、科技舆情等科学数据的准入门槛,匹配高性能、大容量的存储设备满足如高能物理、地球系统、数字天文等领域需要处理的PB级数据需求,确保科学数据的长期保存。
三是按照如下基本分类进行科学数据的保存、汇交、利用工作:第一,单一存储:对尚不能很好利用的基础研究领域数据,形成“数据池”,先进行存储;第二,异地灾备:对国家层面布局的领域科学数据,以异地灾备方式进行合作,共享开发使用;第三,数据共享:着重研究专业领域之间数据的交叉、融合等的跨学科数据开发和共享;第四,日常管理:加强对专业领域的科学数据中心收集、汇交、共享机制的研究,由点及面成体,形成长三角科学数据体系。
(2)数据资源权威发布,有偿服务
基于科学数据中心的建设规范,实现数据资源的权威发布与有偿服务:第一,权威发布基于大数据统计与分析的行业发展趋势、企业生存现状、技术转移路径等皮书、报告;第二,对技术需求方,有偿提供可供技术的院所、机构、企业名单:重点服务长三角地区的创新主体(线上工作);第三,对技术供给方,有偿服务科技创新“最后一公里”:辅助做技术识别、评价以后的磨合工作(线下工作)。
(3)开辟社会服务新领域
在具备基本数据采集与汇交、数据决策、数据存储功能之后,可考虑拓展长三角区域科技数据中心的研究和培训功能。一是加强区域社会服务决策咨询能力建设。利用自身的数据挖掘、数据分析和技术可视化能力,将科学数据服务与社会决策相结合,提供快速、精准的技术支撑,并建立反应、反馈机制。二是提供区域性的社会培训和教育服务。在概率论与数理统计、数据挖掘、算法与数据结构、计算机网络、并行计算等多个专业方向上,培养以计算机学科为基础、以挖掘算法为核心、面向行业应用的精英人才。可联合区域内高校数据科学专业的一流师资,组成科学数据网络课程开发联盟,面向区域科学数据的采集、汇交、利用及管理开发网络课程、开设有针对性的慕课课程等。
(4)开展区域性的数据使用技能培训
组建区域性的大数据基础教学实训平台、数据科学与人工智能教学平台与底层的教学管理平台。定期组织长三角区域科技数据中心的管理人员、用户、成员单位进行培训,掌握数据挖掘全生命周期的核心技术,包括数据采集、数据预处理、特征工程、数据建模及评估调优,具体包括Hadoop、HDFS、MapReduce、Spark、Hive、Hbase等数据处理技术、熟悉了解科学数据中心整体技术的设计思想和流程、核心组件的功能、特性、结构、数据处理应用的开发方法、适用场景和常见问题等。
3、建立规范的合作共享机制,拓展服务范围
(1)建立完备的信息互动机制
一是建设完备的区域信息网络系统。系统初期投入以信息基础设施为主,属于“物理互联”,要尽量保证平台的开放性,服务更多的用户,以分摊初期高昂的硬件投资。二是以大型区域性合作科技项目促进互动。此类项目往往技术含量较高、市场容量较大、发展前景较好,要动员各方的力量也多,可探索建立多方联盟机制下的信息互通原则与手段。
(2)建立合作共享的激励与约束机制
鉴于长三角区域科技数据中心公立平台、非盈利性质、企业化运作的特点,需建立合作共享的激励与约束机制,制定公益性服务的收费规则、奖励标准、违约责任和监督原则,以保障对公众财政资助产出的科学数据提供无偿、无限制和无歧视的数据服务;向公众开放并引导合理利用科学数据;提高政府部门对科学数据资源的利用率及数据决策能力。
(3)促进区域性的科学数据立法工作
尽快启动长三角区域的科学数据立法工作,在区域创新体系的基础性地位、平台共享服务功能对创新的重要性、科技资源数据化的合法性等方面,制定相应法律予以明确。
(作者林兰系上海社会科学院城市与人口发展研究所研究员。曹贤忠系华东师范大学城市发展研究院副研究员。)
--------
“长三角议事厅”专栏由教育部人文社会科学重点研究基地·中国现代城市研究中心、上海市创新基地长三角区域一体化研究中心和澎湃研究所共同发起。解读长三角一体化最新政策,提供一线调研报告,呈现务实政策建议。