您当前位置:首页  教学工作
数据科学与大数据技术专业

一、专业概况

数据科学与大数据技术专业是教育部为落实国家《促进大数据发展行动纲要》而批准设立的新工科专业,我校于2019年获教育部批准增设本专业,同年开始招生。本专业是一个理实结合、以计算技术为基础、兼顾数据科学理论与应用、围绕数据价值化为特色的宽口径专业。依据本校应用型人才培养目标的定位,本专业主动适应区域经济社会发展需要,毕业生能够从事有关大数据分析、开发、部署与应用等相关领域的各类工作,就业前景十分广阔。

二、培养目标

本专业培养德智体美劳全面发展具有良好的人文素养、职业道德、社会责任感和团队合作精神,掌握计算机、数学、统计学等学科的基本理论和方法,熟练掌握大数据采集、处理、分析与应用的技术和手段,具备大数据项目分析挖掘和系统开发的能力,具有较强的工程实践能力、自主学习能力以及创新能力的应用型数据工程师。

学生毕业后能够在信息技术企业从事大数据应用开发和系统维护工作;在其他数据密集型行业领域从事大数据分析与挖掘、智能决策支持等方面的工作。

三、毕业要求

要求1.工程知识:能够将数学、自然科学、大数据工程基础和专业知识用于解决大数据应用领域复杂工程问题。

要求2.问题分析:能够应用数学、自然科学、大数据工程科学的基本原理,判别关键、建模表达、并通过文献研究分析大数据应用领域复杂工程问题,以获得有效结论。

要求3.设计/开发解决方案:能够设计针对大数据应用领域复杂工程问题的解决方案,设计满足用户需求的大数据系统架构、模块或实施流程,并能够在设计与开发环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。

要求4.研究:能够基于数据科学与大数据技术相关原理和方法,对大数据应用领域复杂工程问题进行研究,构建大数据实验系统,能够分析与解释实验结果,并通过信息综合得到合理有效的结论。

要求5.使用现代工具:能够开发、选择与使用恰当的技术、资源、现代工程工具和信息技术工具,对大数据应用领域复杂工程问题进行分析、设计、模拟或实现,并能够理解其局限性。

要求6.工程与社会:能够基于计算机工程相关背景知识进行合理分析、评价大数据工程实践和解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的社会责任。

要求7.环境和可持续发展:能够理解和评价针对大数据应用领域复杂工程问题的工程实践对环境、社会可持续发展的影响。

要求8.职业规范:具有良好的人文社会科学素养、社会责任感,能够在大数据系统工程实践中理解并遵守工程职业道德和规范,履行相应的责任。

要求9.个人和团队:能够在多学科背景下的团队中承担个体、团队成员以及负责人的角色。

要求10.沟通:能够通过撰写报告、设计文稿或陈述发言等方式就大数据应用领域复杂工程问题与业界同行及社会公众进行有效沟通和交流。并具备一定的国际视野,能在跨文化背景下进行沟通和交流。

要求11.项目管理:理解并掌握大数据系统工程管理原理与经济决策方法,并能在多学科环境中应用。

要求12.终身学习:具有自主学习和终身学习的意识,能够跟踪大数据领域最新前沿,有不断学习和适应大数据技术发展的能力。

四、专业核心课程

1.数据结构(Data Structures  3.5学分

《数据结构》是处理非数值计算的程序设计的基础。本课程旨在培养学生针对具体问题对象能够选择适宜的逻辑和存储结构,并能设计适当的算法进行有效的数据存储和处理,培养学生解决实际应用问题能力,为后续课程打下基础。

2.数据库原理与NoSQL数据库(Database Principle and NoSQL Database  3.5学分

《数据库原理与NoSQL数据库》主要讲授关系型和非关系型数据库的基本概念、基本原理和实现技术。通过本课程的学习,学生应能掌握关系型和常用非关系型的数据模型、数据理论、数据操作语言、数据库安全保护、数据库设计等内容,为学生从事数据管理及系统开发等相关工作打下基础,也为今后学习数据仓库、数据挖掘、大数据分析处理等课程做好准备。

3.机器学习与Python应用(Machine Learning and Python Application  3.5学分

《机器学习与Python应用》重点讲解机器学习中的核心算法和理论,并培养学生利用Python语言掌握机器学习算法解决问题的基本能力。通过本课程的学习,使学生具备Python语言编程的基本知识和初步技能,初步了解机器学习的常用算法以及典型的应用领域,并通过编程练习和实例讲解培养学生分析和解决实际问题的能力,为将来更深入的学习和研究奠定良好基础。

4.数据仓库与数据挖掘(Data Warehouse and Data Mining  3.5学分

《数据仓库与数据挖掘》主要介绍数据仓库的结构及设计、数据访问方法及应用、数据预处理、数据挖掘常用算法等基本内容。通过本课程的学习,让学生了解数据仓库与数据挖掘的基本概念、基本原理和基本方法,培养学生分析数据、获取知识的基本能力,为其今后从事数据分析及数据工程实践打下坚实的基础。

5.多元统计分析与R语言建模(Multivariate Statistical Analysis and R Language Modeling  3.5学分

《多元统计分析与R语言建模》结合R语言主要讲解多元统计分析的基础理论、基本方法和基本技能。通过本课程的学习,旨在使学生系统地掌握多元统计思想和统计方法,学会使用多元统计方法并结合R语言进行数据分析处理,解决一些统计分析实际问题,为今后从事数据领域的分析研究工作奠定坚实的专业知识基础。

6.大数据编程(Big Data Programming  3学分

《大数据编程》重点介绍大数据系统的工具平台、开发环境和基本原理,使得学生熟悉主流大数据技术应用框架及其生态系统,主要包括HadoopHbaseHiveSparkSpark SQLOozie等。通过本课程的学习,学生应能掌握主流大数据系统工具与平台的特性、大数据处理的基本开发方式以及大数据系统构建的基本流程和方法,培养学生基于大数据工具与平台的程序开发能力,为将来从事大数据系统开发以及后续课程的学习奠定基础。