美国本科专业解析-数据科学
介绍
数据科学专业将为数学提供必要的背景,并为数据科学奠定坚实的基础,包括数据结构、算法和数据库管理、数据收集、数据挖掘、机器学习、建模和推理。获得数据科学学士学位的学生将知道如何开发软件、设计和维护数据库、在分布式环境中处理数据、使用统计、数据挖掘和机器学习技术分析数据、提供数据或分析结果的可视化,以及协助决策者。该计划将包括经验学习通过一个顶点课程,这将集中在应用所获得的知识和技能在现实世界的数据分析项目。
通过学习数据科学专业,学生可以掌握开发软件,算法的技能;设计和管理各种数据库和结构,在分布式环境中处理数据;使用来自统计,数据挖掘,机器学习的技术收集和分析数据;提供数据的可视化并建立统计模型以促进推理。通过学习数据科学解释统计分析的结果并协助做出决策。
所属院系
数据科学专业开设在文理学院统计和计算机系(Department of Statistics and Computer Science)
课程要求
必修课程:
数据科学:Data Science
数据安全和隐私:Data Security and Privacy
数据挖掘或应用多元分析和统计学:Data Mining or Applied Multivariate Analysis and Statistical Learning
数据管理:Data Base Management
应用线性代数:Applied Linear Algebra
应用实验设计:Applied Experimental Designs
应用回归分析:Applied Regression Analysis
数学据统计Mathematical Statistics I
统计推断Statistical Inferences for Data Scientists
选修课:
计算机,伦理和社会学Computing, Ethics, and Society
软件工程Software Engineering
科学与工程中的数值模型 Numerical Simulations in Science and Engineering
仿真和建模 Simulation and Modeling
算法Algorithms
生物医学图像分析Biomedical Image Analysis
金融管理Financial Management
市场营销原理Principles of Marketing
市场分析Marketing Analytics
数字市场分析Digital Marketing Analytics
图论Graph Theory
概率Probability
管理学原理Principles of Management
高级数据管理Advanced Data Management
风险管理与保险Risk Management and Insurance
抽样调查方法Sampling and Survey Methods
统计质量Statistical Quality Assurance
应用时间序列分析Applied Time Series Analysis
非参数方法Nonparametric Methods
统计软件编程Statistical Software programming
应用分类数据分析Applied Categorical Data Analysis
概率论Introduction to Probability Theory
数据科学从业者需要掌握的工具
在过去的十年中,数据科学从业者已成为必需的资产,并且几乎在所有组织中都存在。这些专业人员是具有数据处理能力的,全面的,具有高级技术技能的人员,他们能够构建复杂的定量算法,以组织和综合用于回答问题和推动组织策略的大量信息。再加上在组织和企业中为各个利益相关者带来切实成果所需的沟通和领导经验。
数据科学从业人员需要有好奇心,注重结果,以及专门的行业知识和沟通能力,以便能够向非技术同行解释高科技成果。它们拥有丰富的统计、线性代数和编程知识方面的知识方面具有很强的定量背景,重点是数据仓库,挖掘和建模,以建立和分析算法。
他们还必须能够利用关键的技术工具和技能,包括:
R 语言
Python
Apache Hadoop
MapReduce
Apache Spark
NoSQL databases
Cloud computing
D3
Apache Pig
Tableau
iPython notebooks
GitHub
为什么选择数据科学专业
2008年,当企业意识到需要善于组织和分析海量数据的数据专家时,“数据科学家”一词首次被提出。谷歌首席经济学家、加州大学伯克利分校信息科学、商业和经济学教授Hal Varian在2009年麦肯锡(McKinsey&Company)的一篇文章中预测适应技术的影响和不同行业重组的重要性.有效的数据科学家能够识别相关问题,从大量不同来源收集数据,组织信息,把结果转化成解决方案,并以对企业决策产生积极影响的方式传达他们的发现。实际上,每个行业都需要这些技能,这也使公司越来越重视熟练的数据科学家。
数据科学继续发展,成为技术人员最有前途和最需要的职业生涯之一。现在,成功的数据专家已经意识到他们必须超越传统的技能,即数据挖掘技能和编程技能来分析大量数据。要找到对组织有用的数据信息,数据科学家必须掌握整个数据科学生命周期的全貌,并且要有一定的灵活性和理解能力,以便在过程的每一阶段都能获得最大的回报。
就业
据美国就业评估网站Glassdoor的统计,数据科学专业的毕业生这一职业连续三年被评为美国最佳工作。当更多的数据变得更容易获得时,大的技术公司不再是唯一需要数据科学家的公司。各行业(不论大小)对数据科学专业人员的需求日益增加,这是一个挑战,因为缺乏合格的候选人来填补空缺职位。数据科学专业人员的需求也没有出现未来几年放缓的迹象。LinkedIn(领英)将数据科学家列为2019年和2020年最有希望的工作之一,并将许多数据科学相关技能列为企业最需要的技能。
根据领英统计,到2020年前数据科学领域的人才需求将增长28%。
学习数据科学专业的学生们,可以考虑哪些工作岗位呢?
1.数据科学家(Data Scientist)
数据科学家们研究了哪些问题需要回答,在哪里可以找到相关资料。它们有商业头脑和分析能力,能够挖掘、整理和显示数据。公司利用数据科学家对大量非结构化数据进行收集、管理和分析。结果随后被综合和传递到关键的利害关系方,从而在组织内推进战略决策。
要求的技能:编程技能(SAS,R,Python),统计和数学技能,讲故事,数据可视化,Hadoop,SQL,机器学习。
平均年薪:$120,931,高级数据科学家的年薪可达$141,257。
2.数据分析师 (Data Analyst)
数据分析师填补了数据科学家和业务分析师的差距。给他们提供组织需要回答的问题,然后对数据进行整理和分析,以找到符合高级业务策略的结果。数据分析师负责将技术分析转化为定性的行动计划,并有效地与不同的利益相关者进行沟通。
要求的技能:编程技能(SAS,R,Python),统计和数学技能,数据整理,数据可视化技能。
平均年薪:$65,470
3.数据工程师 (Data Engineer)
数据工程师管理指数级快速变化的资料。它们主要关注于数据管道和基础架构的开发、部署、管理和优化,以便将数据转换并传递给数据科学家用于查询。
必需的技能:编程语言(Java,Scala)、NoSQL数据库(MongoDB,CassandraDB)、ApacheHadoop
平均年薪:$137,776