图灵奖得主、关系数据库的鼻祖Jim Gray(吉姆格雷)在2007年最后一次演讲中,将人类科学研究的发展定义成为四个范式:第一是实验,以记录和描述自然现象为主的实验科学,例如伽利略在比萨斜塔上做了“两个铁球的同时落地”的实验;第二是理论,即利用模型归纳总结过去记录的现象,采用各种数学、几何、物理等理论,构建问题模型和解决方案,是牛顿三定律和麦克斯韦方程等为代表的理论科学;第三是计算,计算机的出现,诞生了模拟复杂现象的计算科学,通过设计算法并编写程序输入计算机运行,解决复杂的问题;第四是数据,随着数据量的高速增长,计算机将不仅能做模拟仿真,还能进行分析总结得到理论,即数据科学(数据密集型科学)。从此数据科学一词逐渐被人们认可。现在人们对数据科学概念已经不完全等同于Jim Gray说的“范式”了,可以包括多重的含义:一是用数据的方法来研究科学,比较类似于之前的生物信息学、计量经济学、系统动力学等;二是用科学的方法来研究数据,比较类似于数据治理、数据处理等;三是侧重于强调数据计算的方法和工具,例如神经网络等各类深度学习的算法。可以看出,数据科学是一门交叉学科,具有横向贯通和纵向整合的特点。我们研究重点方向是以业务应用为导向,将数据治理方法、算法原理等应用于创新创业、区域经济、政府治理等领域,以期不断研发出具有价值、具有体系化特征的系列模型算法。

版权所有 2007-2019 龙信数据研究院 Copyright © 2007-2019 . All Rights Reserved