2024级大数据技术专业人才培养方案
一、专业名称及代码
大数据技术(510205)
二、入学要求
普通高级中学毕业、中等职业学校毕业或具备同等学力。
三、修业年限
基本学制3年,学习年限3-6年
四、职业面向与职业能力分析
(一)职业面向
表1 职业面向一览表
所属专业大类 | 所属 专业类 | 对应行业 | 主要职业类别 | 主要岗位类别(或技术领域)举例 | 职业资格(职业技能等级)证书举例 |
计算机类 5102 | 大数据技术 510205 | 软件和信息技术服务业 6579 | 软件和信息技术服务人员 40405 | 大数据开发岗位、大数据运维岗位、数据采集与爬取岗位、云计算维护岗位、网络工程岗位、数据库管理维护岗位;人工智能训练岗位。 | 阿里巴巴大数据分析与应用1+X认证;华为认证;HCIA-Datacom数据通信工程师;计算机程序设计员;人社局人工智能训练师 |
(二)职业能力分析
1、大数据技术专业的核心岗位(群)及相关工作岗位职业能力如下表2所示。
表2 工作岗位职业能力分析表
岗位名称 | 职业能力 | 相关课程 | 考证考级要求 |
职业证书名称与等级 | 必考/选考 |
大数据开发与工程 | ➢熟悉实时处理与离线处理: /Spark/Flink/MapReduce; ➢熟悉数据仓储组件: Hadoop/Hive/Hbase/clickhouse/ES/Diors/Redis; ➢熟悉中间件组件: Kafka/flume/RabbitMQ ➢熟悉Linux 操作系统、熟悉 Java、Python语言,能熟练编写常规运维脚本; ➢对数据仓库有基本的理解。
| 程序设计基础(JAVA语言)、Linux操作系统基础、大数据概述、Python基础、spark计算技术、Hadoop平台实践、数据库应用技术(MySQL) | HCNA华为认证 | 初级 | 必考 |
1+X大数据分析与应用 | 中级 | 选考 |
程序设计员 | 中级 | 选考 |
数据分析员 | 中级 | 选考 |
大数据运维 | ➢熟悉开源平台和组件:Hadoop/Hbase/Hive/Zookeeper/Spark ; ➢熟悉Linux 操作系统、熟悉 Java、Python语言,能熟练编写常规运维脚本; ➢掌握云计算与虚拟化技术; ➢对数据仓库有基本的理解; ➢了解大数据的生态圈,对其中一些组件比较了解并能使用; ➢能够熟练应用excel表格。
| 程序设计基础(JAVA语言)、Linux操作系统基础、大数据概述、Python基础、Hadoop平台实践、数据库应用技术(MySQL)、spark计算技术、云计算与虚拟化技术 | HCNA华为认证 | 初级 | 必考 |
1+X大数据分析与应用 | 中级 | 选考 |
程序设计员 | 中级 | 选考 |
数据分析员 | 中级 | 选考 |
云计算技术工程 | ➢掌握虚拟化、云平台、云资源管理和分发等关键技术; ➢具备大规模数据管理、分布式数据存储等相关技术的开发能力; ➢熟练掌握主流的云平台技术,如AWS、Azure、Google Cloud等,并能够根据业务需求进行云系统的规划、设计、开发、集成和部署; ➢至少掌握一种云计算编程语言,如Python、Java、C#等。 | 程序设计基础(JAVA语言)、Linux操作系统基础、网络技术、路由交换技术、云计算与虚拟化技术 | HCNA华为认证 | 初级 | 必考 |
1+X大数据分析与应用 | 中级 | 选考 |
程序设计员 | 中级 | 选考 |
数据分析员 | 中级 | 选考 |
数据采集与爬取 | ➢精通常用的爬虫语言和框架,熟悉 java、 python,且熟悉一种以上主流的爬虫工具; ➢精通网页抓取原理及技术、正则表达式、 xpath,能够从结构化的和非结构化的数据中获取信息; ➢熟悉关系型数据库MySQL。 | 程序设计基础(JAVA语言)、Linux操作系统基础、大数据概述、Python基础、Hadoop平台实践、数据库应用技术(MySQL) | HCNA华为认证 | 初级 | 必考 |
1+X大数据分析与应用 | 中级 | 选考 |
程序设计员 | 中级 | 选考 |
数据分析员 | 中级 | 选考 |
人工智能训练 | ➢深入理解人工智能的基本原理、技术和算法,包括机器学习、深度学习、自然语言处理等; ➢掌握各种人工智能工具和框架,如TensorFlow、PyTorch、Keras等; ➢具备强大的数据处理和分析能力,能够处理大规模数据集,进行数据清洗、特征提取、数据可视化等; ➢熟练掌握模型训练技术和方法,根据业务需求和数据特点选择合适的模型架构和算法; ➢具备一定的业务理解能力,能够理解业务需求,将业务需求转化为技术实现方案。 | Python基础、机器学习、数据爬虫、自然语言处理、数据分析与挖掘和通用人工智能AIGC应用基础 | 人社局人工智能训练师 | 初级 | 必考 |
1+X大数据分析与应用 | 中级 | 选考 |
程序设计员 | 中级 | 选考 |
数据分析员 | 中级 | 选考 |
数据库管理 | ➢理解数据库管理系统的基本原理、架构和技术,包括关系型数据库(如Oracle、MySQL、SQL Server等)和非关系型数据库(如MongoDB、Redis等); ➢熟悉SQL语言,以及数据库性能调优、备份恢复、高可用性和安全性等技术; ➢能够根据业务需求设计数据库结构、表关系、索引等; ➢能够安装、配置和维护数据库服务器,包括硬件、操作系统,熟练掌握数据库的恢复技术,能够在数据丢失或损坏时迅速恢复数据和数据库软件。 | 程序设计基础(JAVA语言)、Linux操作系统基础、大数据概述、Python基础、Hadoop平台实践、数据库应用技术(MySQL) | HCNA华为认证 | 初级 | 必考 |
1+X大数据分析与应用 | 中级 | 选考 |
程序设计员 | 中级 | 选考 |
数据分析员 | 中级 | 选考 |
在相关课程方法,学生在校学习期间还需要学习HTML/CSS、计算机网络技术与实践、云计算与虚拟化技术等计算机基础课程。
学生在校学习期间还应获得国家英语等级考试PET三级(A)证书或CET-4英语证书、计算机应用能力一级证书,人社部的职业技能考证项目等。
五、培养目标与培养规格
(一)培养目标
本专业培养能够践行社会主义核心价值观,德、智、体、美、劳全面发展,具有一定的科学文化水平,良好的人文素养、职业道德和创新意识,精益求精的工匠精神,较强的就业创业能力和可持续发展的能力;坚持“服务为宗旨,就业为导向”的原则,立足区域经济发展,以市场需求的变化为依据,具备扎实的大数据处理能力,面向大数据开发岗位群,掌握Hadoop、MapReduce、Spark等大数据处理技术和工具,能够从事大数据开发等岗位工作的技能型高素质技术人才。
(二)培养规格
本专业学生应在系统学习本专业知识并完成有关实习实训基础上,全面提升素质、知识、能力,掌握并实际运用岗位(群)需要的专业核心技术技能,总体上须达到以下要求:
1.素养
(1)思想政治素质:热爱社会主义祖国,拥护中国共产党的领导,能够准确理解和把握社会主义核心价值观的深刻内涵和实践要求,具有正确的世界观、人生观、价值观。
(2)文化素质:大数据专业的学生应当具备良好的文化素质,包括对人类文明和社会发展的基本了解和认识。他们应当具备广泛的知识面,包括但不限于计算机科学、数学、统计学以及相关的社会科学和自然科学知识。此外,他们还应当具备批判性思维和跨学科的综合能力,能够将技术应用于解决现实生活和社会问题。
(3)职业素质:大数据专业的学生在职业素质方面应当具备多方面的能力和素养。首先,他们应当拥有良好的职业道德和责任感,能够诚实守信,保护数据安全和隐私。其次,他们应当具备工匠精神和创新精神,追求技术的完美和创新,能够灵活应对问题并提出解决方案。此外,他们还应当具备高水平的信息素养和技术能力,熟练掌握大数据处理工具和技术。在工作中,他们应当具备高度的质量意识和安全意识,注重数据处理过程中的准确性和安全性。最后,他们还应当具备环保意识和可持续发展观念,促进数据处理工作与环境的和谐共存。
(4)身心素养:大数据专业的学生在身心素养方面应当注重全面发展,包括身体和心理健康。首先,他们应当具备良好的体质,能够达到国家学生体质健康标准要求,保持良好的体态和健康的生活方式。其次,他们应当注重心理健康,具备应对压力和挑战的能力,保持积极乐观的心态。由于大数据工作可能需要长时间的电脑操作和高度集中的思维,因此他们应当注意眼睛和颈椎的保健,合理安排工作和休息时间,避免过度疲劳和眼部疲劳等问题。另外,他们还应当注重团队合作和人际关系,建立良好的社交网络,通过与他人交流合作,增强自身的社交能力和情商。综上所述,身心素养对于大数据专业的学生来说至关重要,能够帮助他们更好地适应工作和生活的挑战,保持身心健康,更好地实现个人和职业发展的目标。
(5)精益求精素养:不断学习的素养是大数据专业学生应当具备的重要品质之一。随着科技的不断发展和行业的快速变化,他们需要具备持续学习和自我更新的能力。首先,他们应当具备积极的学习态度,保持对新知识和新技术的好奇心和求知欲,主动关注行业的发展动态和前沿技术。其次,他们应当具备自主学习的能力,能够独立获取和分析信息,利用各种学习资源和平台进行学习,包括但不限于书籍、网络课程、研讨会等。此外,他们还应当注重实践学习,通过项目实践和工作经验不断提升自己的技能和能力。最后,他们应当具备反思和总结的能力,及时总结经验教训,发现问题和不足,并不断改进和提升自己。综上所述,不断学习的素养是大数据专业学生成功的关键之一,能够帮助他们适应行业的变化和挑战,保持竞争力,实现个人和职业发展的目标。
2.知识
(1)掌握与本专业相关文化基础和人文社会科学、英语、计算机、高等数学、体育与健康等知识;
(2)掌握文献查阅的基本知识;
(3)掌握大数据的基本理论和知识;
(4)掌握大型数据库的相关知识;
(5)掌握Hadoop技术平台的专业知识;
(6)具有大数据+人工智能应用的基础知识;
(7)掌握移动开发和管理的专业知识;
(8)掌握云计算与虚拟化技术的知识
3.能力
(1)具有符合要求的口语和书面表达能力,解决实际问题的能力,终身学习能力,信息技术应用能力,独立思考、逻辑推理、信息加工等一般能力;
(2)具有从事大数据处理分析的基本能力;
(3)具有Hadoop平台的构建能力, 具备Hadoop环境下大数据采集、处理、存储能力;
(4)了解数据仓库的基本概念,具备数据仓库平台如HBase/Hive等新型数据库的操作能力;
(5)具有使用主流ETL 工具完成数据采集、处理、存储、分析、呈现的全流程的能力;
(6)具备使用Python 语言进行爬虫程序的设计,以及Python 分析、可视化模块的使用能力;
(7)具备大数据平台技术与云计算与虚拟化技术融合的能力;
(8)具备使用通用人工智能与大数据分析、挖掘的综合处理能力
六、课程设置及要求
本专业课程体系围绕人才培养目标与规格,突出德智体美劳“五育融合”培养,主要分为公共基础课程、专业技能课程、拓展教育课程三大类。总共57门课程,2832学时,154学分。具体如表3所示。
表3 课程结构表
课程类别 | 开设课程 | 总学分 | 总学时 |
公共基础课程 | 公共必修 | 1 | 思想道德与法治 | 32.5 | 508 |
2 | 毛泽东思想和中国特色社会主义理论体系概论 |
3 | 习近平新时代中国特色社会主义思想概论 |
4 | 形势与政策 |
5 | 体育 |
6 | 心理健康教育 |
7 | 大学信息技术 |
8 | 军事技能 |
9 | 军事理论 |
10 | 大学生职业发展与就业指导 |
11 | 大学英语 |
限定选修 | 12 | 劳动教育 | 9.5 | 142 |
13 | 安全教育 |
14 | 综合素质实践 |
15 | 德育测评 |
任意选修 | 16 | 职业汉语与应用文写作 | 4 | 64 |
17 | 公共艺术选修 |
18 | 公共通识选修 |
专业技能课程 | 专业基础 | 19 | 入学与专业认知教育 | 34.5 | 552 |
20 | 高等数学 |
21 | 程序设计基础 |
22 | Linux操作系统基础 |
23 | Python语言基础 |
24 | 数据库应用技术(MySQL) |
25 | HTML/CSS |
26 | 概率论与数理统计 |
27 | 自然语言处理 |
28 | 计算机网络技术与实践 |
29 | 云计算与虚拟化技术 |
专业核心 | 30 | 基于Hadoop的大数据概论☆ | 24.5 | 392 |
31 | 数据可视化 |
32 | 机器学习 |
33 | 数据采集与网络爬虫 |
34 | 路由交换技术☆ |
35 | 数据分析与挖掘☆ |
36 | Spark大数据计算技术 |
专业实践 | 37 | Linux脚本编写实践 | 39 | 1014 |
38 | Python编程实践 |
39 | Hadoop平台构建 |
40 | 专业综合实训 |
41 | 毕业实习1(跟岗实习) |
42 | 毕业实习2(岗位实习) |
拓展教育课程 | 专业拓展 | 43 | 实用软件工程 | 4 | 64 |
44 | 大模型应用技术 |
45 | 通用人工智能AIGC应用基础 |
46 | PowerBI商业数据分析 |
47 | 商品信息采编 |
48 | 图像处理 |
49 | 企业讲座 |
专业选修 | 50 | 华为HCIA认证考证实训 | 6 | 96 |
51 | 专业职场英语 |
52 | 移动开发技术 |
53 | storm大数据实时计算 |
54 | Spark Streaming流计算 |
55 | 数据统计 |
56 | 数字化媒体营销 |
57 | 客户关系管理 |
合计 | 154 | 2832 |
(一)专业核心课程描述
表4 专业核心课程描述表
序号 | 课程名称 | 课程目标 | 主要内容 | 教学要求 | 学时 |
1 | 基于Hadoop的大数据概论 | Hadoop的大数据概论课程目标: 1.素质目标:培养学生数据分析意识,让他们了解数据分析的重要性和应用场景。 2.知识目标:了解大数据的发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展。让学生了解Hadoop的发展历史、重要特性和应用现状,以及Hadoop项目结构及其各个组件。 3.技能目标:掌握Hadoop平台的安装和使用方法,具备编写符合语法规范的HDFS操作程序的能力。掌握HDFS集群结构、具备搭建HDFS集群的能力,以及YARN集群的基本概念、具备搭建YARN集群的能力。 | 1.引入大数据概念,解析其重要性与应用领域。 2.介绍Hadoop生态系统,理解其核心组件。 3.阐述HDFS分布式文件系统的工作原理与优势。 4.讲解MapReduce编程模型,实现大数据计算。 5.概览Hadoop生态中的其他工具与框架。 6.分析大数据处理流程,包括数据采集、存储、分析与应用。 7.探讨Hadoop在实际场景中的应用案例与最佳实践。 | 1.授课教师要求:具备相关知识和实践经验,良好表达和互动能力,引导学生思考和解决问题,持续学习更新知识。 2.教学方法及要求:多种教学方法,理论实践结合,注重学生自主学习和团队合作,利用现代化教学技术和工具。 3.考核评价形式及要求:多样化考核形式,综合评价学生理论和实践能力,贴近教学目标,清晰明确评分标准,鼓励学生参与课堂和实践活动。 | 56 |
2 | 数据可视化 | 知识与技能:使学生全面理解数据可视化的基本概念、原理和方法,掌握主流数据可视化工具(如Echarts、D3.js、Tableau等)的操作与应用,了解数据可视化在不同领域的应用场景。 实践能力:通过案例分析和实践操作,培养学生的数据处理、分析和可视化能力,使学生能够运用所学知识解决实际问题,如数据清洗、数据转换、数据可视化设计等。 职业素养:培养学生的团队协作、沟通表达和项目管理能力,使其具备良好的职业素养和职业道德,为未来的职业发展奠定坚实基础。 | 可视化基础项目:数据可视化的基本原理和概念,完成基础练习,如使用简单工具创建条形图、折线图等。 工具操作与应用任务:学习主流的数据可视化工具(如Echarts、D3.js等),并通过任务实践,如制作交互式数据图表,掌握这些工具的操作和应用。 数据预处理项目:学生将学习数据清洗、转换和整理等预处理技能,通过项目实践,如清理和整理实际数据集,为数据可视化做好准备。 综合案例分析:分析并讨论行业内的数据可视化案例,如商业报告、科研可视化等,从中学习设计思路和技术应用。 | 1.授课教师要求:具备扎实的数据可视化知识和实践经验,能够激发学生学习兴趣。 2.教学方法及要求:采用示范演示、实验操作等方法,理论与实践结合。 3.考核评价形式及要求:通过实验报告、项目作业等方式评价学生的理论和操作能力。 | 56 |
3 | 机器学习 | 专业知识与技能:通过系统学习,使学生全面了解机器学习的基本原理、算法和应用,掌握主流机器学习工具的使用,具备设计和实现机器学习模型的能力。 实践应用能力:结合具体案例和项目实践,培养学生的实践操作能力,使学生能够将理论知识应用于实际问题中,如数据分类、回归预测、聚类分析等,提高解决实际问题的能力。
| 搭建Python应用开发机器学习基础:介绍机器学习的基础概念、原理、历史发展以及与其他学科的关联,如模式识别、统计学习、数据挖掘等。 主要机器学习算法:深入讲解各种主要的机器学习算法,包括回归分析、神经网络、支持向量机(SVM)、聚类、降维等,并通过案例分析和实践项目让学生理解和掌握这些算法的应用。 模型评估与优化:教授学生如何评估机器学习模型的性能,如准确率、召回率、F1分数等,并介绍如何根据评估结果优化模型。 | 1.知识掌握: 学生应能够正确理解并掌握机器学习的基础概念、原理、主要算法及其应用领域。 学生应能够熟悉常用编程语言和工具(如Python、TensorFlow、PyTorch等)在机器学习中的应用。 2.技能培养: 学生应能够熟练运用机器学习的基本知识和技术,对实际问题进行分析、建模和求解;学生应能够利用编程语言和工具,独立实现机器学习算法,并解决实际应用问题;学生应能够掌握数据预处理和模型评估的方法,以提高机器学习模型的性能。 | 48 |
4 | 数据采集与网络爬虫 | 1.素养目标:培养学生对数据采集与网络爬虫技术的认知和理解,使其了解数据获取在信息处理中的重要性,并且注重合法合规的原则。 2.知识目标:理解数据采集与网络爬虫的基本原理,包括HTTP协议、HTML解析等基础知识。掌握常用的数据采集工具和技术,了解反爬虫机制及其应对策略。 3.能力目标:能够独立运用数据采集与网络爬虫技术获取特定网站或数据源的信息,并进行有效处理和分析。具备解决数据采集过程中遇到的各种问题和挑战的能力,包括反爬虫机制的应对和数据清洗处理等。 | 1.规则文件数据和关系型数据库数据抓取以及数据同步(同Hadoop/Hive数据同步) 2.日志类数据抓取 3.流数据抓取(了解并掌握Kafka) 4.能够通过Python编程语言网络爬虫抓取工具,实现网络数据抓取 | 1.授课教师要求:具备丰富的实践经验和理论基础,能够引导学生正确应用数据采集与网络爬虫技术。注重传授合法合规原则,强调以道德和法律为准则进行技术应用。 2.教学方法及要求:使用案例分析、实验操作等教学方法,结合实际项目,注重理论与实践相结合。强调合法合规原则,提倡学生在学习过程中注重以道德和法律为准则的技术应用。 3.考核评价形式及要求:考核方式多样化,包括项目报告、实验报告、考试等,评价学生的理论水平和实际操作能力。评价要求贴近教学目标,注重考察学生的合法合规意识和技术应用能力。 | 64 |
5 | 路由交换技术 | 知识目标:使学生全面了解路由交换技术的基本概念、原理、体系结构以及在网络通信中的重要作用。学生应能够掌握数据通信的基本理论和路由交换技术的核心知识,如网络协议、IP地址分配、路由算法、交换机和路由器的配置与管理等。 技能目标:通过实践教学,使学生能够熟练掌握路由交换技术的操作技能,包括交换机和路由器的配置、网络故障的诊断与排除、网络优化与升级等。学生应能够运用所学知识解决实际问题,如企业网络的规划与设计、校园网的维护与管理等。 | 网络基础知识:网络的基本概念、网络体系结构、TCP/IP协议族等。 交换机与路由器原理:交换机和路由器的工作原理、类型、功能以及在网络中的作用。 IP编址与子网划分:介绍IP地址的基本概念、分类方式、子网划分的方法以及IPv4和IPv6的异同; 交换技术:以太网交换技术、VLAN、STP等交换技术的原理和应用。 广域网技术:讲解广域网连接技术、PPP相关知识和PPP配置、帧中继等。 | 理论掌握:理解路由交换技术的基本理论,包括网络协议、IP地址管理、路由算法、交换机和路由器的功能及工作原理等。 技能操作: 熟练掌握交换机和路由器的配置方法,包括基本设置、接口配置、路由协议配置、安全策略配置等。 学生应能够独立进行网络故障的诊断与排除,掌握网络优化与升级的基本技能。 学生应能够利用仿真软件或实际设备,完成路由交换技术的实验项目,提高实践操作能力。 | 48 |
6 | 数据分析与挖掘 | 1.素养目标:引导学生认识数据分析与挖掘的重要性,培养其对数据价值的认知,同时注重数据隐私和安全保护的意识。 2.知识目标:着重介绍数据分析与挖掘的基本概念、方法和工具,包括数据清洗、数据预处理、机器学习算法等方面的知识。强调学生需要掌握的数据分析与挖掘工具和技术,如Python的数据分析库、机器学习算法等。 3.能力目标:培养学生运用数据分析与挖掘技术处理大规模数据的能力,能够挖掘数据背后的价值和规律。强调学生需要具备解决实际问题的能力,包括基于数据分析结果做出决策、优化业务流程等方面的能力。 | 1.基于MapReduce的Hive数据仓库的离线数据的数据整理和计算 2.基于Spark技术的批处理、实时流计算以及基于SQL语义的数据仓库 3.利用Mabout中的分类、聚类、频繁模式挖掘等数据挖掘算法,结合Hive数据库技术实现对数据的分析和展现。 4.通过知识技能,实现对提供数据源的分析,通过Python实现数据的展现,并根据展现结果提出结论,然后对结论进行分析,做出分析报告。 | 1.授课教师要求:要求教师具备扎实的数据分析与挖掘领域知识和实践经验,能够指导学生正确应用相关技术。强调教师需要关注数据隐私和安全保护意识,引导学生合法合规地进行数据分析与挖掘。 2.教学方法及要求:使用案例分析、实验操作等教学方法,注重理论与实践相结合,引导学生通过实际项目来深入理解相关概念和方法。教学过程中要求学生注重数据质量和准确性,培养其分析和解决问题的能力。 3.考核评价形式及要求:考核方式包括项目报告、实验报告、考试等,评价学生的理论水平和实际操作能力。考核要求贴近教学目标,注重考察学生的数据分析能力和解决实际问题的能力。 | 64 |
7 | Spark大数据计算技术
| 知识掌握:学生应深入理解Spark大数据处理的基本原理、体系架构和核心技术,包括Spark集群的搭建与管理、RDD(弹性分布式数据集)的编程模型、Spark SQL的数据处理、Spark Streaming的实时数据处理以及Spark MLlib的机器学习算法等。 技能提升:学生应能够熟练使用Scala或Python等编程语言进行Spark程序的开发,能够利用Spark处理大规模数据集,并能够优化Spark程序的性能。同时,学生应能够运用Spark的各种组件解决大数据领域的实际问题。 | Spark核心组件和架构: 包括Spark Core、Spark SQL、Spark Streaming、Spark MLlib和Spark GraphX等核心组件。 RDD(弹性分布式数据集):包括转换(Transformation)和动作(Action)两大类操作。 Spark编程模型:包括Scala、Java、Python和R等。 Spark SQL:使用Spark SQL进行数据查询、数据分析和数据挖掘的方法。 Spark Streaming: Spark集群管理与优化: 讲解Spark集群的搭建、配置和管理方法。 教授Spark程序的性能调优方法和常见问题的解决方案。 | 理论知识掌握:理解Spark大数据计算的基本概念、原理和核心技术,包括其生态系统、分布式计算框架和编程模型等。 编程技能提升: 学生应熟练掌握使用Scala、Python等编程语言进行Spark程序开发的能力,包括RDD的创建、转换和动作操作等。 学生应能够运用Spark SQL、Spark Streaming、Spark MLlib和Spark GraphX等核心组件进行数据处理、分析和挖掘等操作。 | 56 |
(二)专业实践内容描述
表5 专业实践教学安排表
序号 | 课程名称 | 学时 | 实训项目内容 | 能力目标 |
总学时 | 实践学时 |
1 | Linux脚本编程实践 | 26 | 26 | 1. 基础入门:学习Linux常用命令,编写简单的Shell脚本。 文本处理:掌握grep、sed、awk工具,进行文本搜索与格式化。 条件与循环:学习if、case条件语句和for、while循环,实现自动化脚本。 系统管理:使用系统监控工具,编写脚本进行定时任务管理。 网络编程:了解网络配置,编写脚本自动化网络服务配置。 数据库操作:使用Shell脚本与数据库交互,实现备份、查询等。 安全管理:学习系统安全管理策略,编写脚本分析日志。 项目实战:结合实际需求,完成Web服务器搭建或自动化运维系统等项目。 | 掌握Linux基础命令与脚本编写,灵活运用文本处理工具,理解编程逻辑与系统管理,具备网络编程与数据库操作能力。培养安全管理与日志分析能力,实战项目提升综合运用与团队协作能力,实现高效自动化运维。 |
2 | Python编程实践 | 26 | 26 | 1.学生成绩统计:读取成绩文件,计算平均分、最高分和最低分。 2.简易Web爬虫:爬取指定网页内容,并保存为文本文件。 3.猜数字游戏:实现一个基于随机数的猜数字游戏。 4.文本加密解密:实现简单文本加密和解密功能。 数据分析可视化:使用5.matplotlib对一组数据进行可视化展示。 | 培养学生处理和分析结构化数据的能力。 掌握文件读取和数据处理的基本技巧。 理解并应用统计函数来计算数据的平均值、最大值和最小值。学会使用Python的网络库来发送HTTP请求。 掌握网页内容解析和数据提取的基本方法。提高学生数据处理和可视化的能力。 学会使用matplotlib等库来绘制图表。 |
3 | Hadoop平台构建 | 26 | 26 | 1.Hadoop平台安装部署和基本配置 2.HDFS常用操作命令(查询文件类别、上传、删除文件、查询HDFS基本统计信息) 3.Hadoop集群节点的动态增与删 4.Hadoop集群的负载均衡 | 掌握HDFS常用操作命令(查询文件类别、上传、删除文件、查询HDFS基本统计信息);Hadoop集群节点的动态增加与删除;Hadoop集群的负载均衡 |
4 | 专业综合实训 | 52 | 52 | 1.大数据采集与网络爬虫 2.hadoop大数据存储与运算 3.Hbase大数据快速读写 4.Spark大数据快速运算 5.健康医疗大数据查询与处理 | 能够对数据进行整理、计算,具备通过Pythonapi接口,对计算分析结果导出到Hdfs中,供报表,日志分析等需求使用等技能;能够通过常用的数据挖掘算法结合数据仓库Hive应用实现数据的计算和表达;具备对大数据技术与分析的综合操作能力和分析能力 |
5 | 毕业实习1
| 260 | 260 | 数据清洗与预处理,实践数据去重、填充等技术。 数据挖掘,分析电商销售等数据集,发现潜在模式。 搭建Hadoop等大数据平台,进行简单运维。 利用Spark Streaming处理实时数据流。
| 学生需独立完成实训项目,展现对大数据技术的掌握与应用能力。 实训过程中需注重数据分析和结果解释,撰写详细的项目报告。 熟练掌握至少一种大数据处理工具(如Hadoop、Spark等)。 结合实际应用场景,选择合适的数据集进行项目实践。
|
6 | 毕业实习2 | 624 | 624 | 使用大数据集训练机器学习模型,并部署预测。 设计并实现电商推荐系统。 选用工具进行数据可视化展示。 研究并实践大数据安全与隐私保护技术。 分析系统日志,实现监控与告警功能。 基于大数据技术栈,开发并优化应用。 | 实训项目需体现创新性,鼓励探索新技术和方法。 注重团队协作,提升项目管理与沟通能力。 实训结束后,需提交完整的项目文档和成果展示。 |
七、教学进程总体安排
(一)教学活动周进程安排
表6 教学活动周进程安排表
学期 | 入学与专业认知教育 | 军训 | 理论(理实一体)教学 | 集中实践教学 | 毕业实习 | 考试 | 机动 | 合计 |
第一学期 | (1) | 2 | 16 |
|
| 1 | 2 | 20 |
第二学期 |
|
| 15 | 2 |
| 1 | 2 | 20 |
第三学期 |
|
| 15 | 1 |
| 1 | 2 | 20 |
第四学期 |
|
| 15 | 2 |
| 1 | 2 | 20 |
第五学期 |
|
|
|
| 18 |
| 2 | 20 |
第六学期 |
|
|
|
| 16 | 2 | 2 | 20 |
总计 | 1 | 2 | 58 | 5 | 34 | 4 | 14 | 120 |
(二)学时安排
表7 教学总学时结构分配表
课程类型 | 课程门数 | 学时学分 | 占总学时比(%) | 占总学分比(%) |
总学时 | 理论学时 | 实践学时 | 学分 |
公共基础课程 | 公共必修 | 11 | 508 | 292 | 216 | 32.5 | 17.9% | 21.1% |
限定选修 | 4 | 142 | 48 | 94 | 9.5 | 5% | 6.2% |
任意选修 | 3 | 64 | 64 |
| 4 | 2.3% | 2.6% |
专业技能课程 | 专业基础 | 11 | 552 | 452 | 100 | 34.5 | 19.5% | 22.4% |
专业核心 | 7 | 392 | 296 | 96 | 24.5 | 13.8% | 15.9% |
专业实践 | 6 | 1014 |
| 1014 | 39 | 35.8% | 25.3% |
拓展教育课程 | 专业拓展 | 7 | 64 | 48 | 16 | 4 | 2.3% | 2.6% |
专业选修 | 8 | 96 | 80 | 16 | 6 | 3.4% | 3.9% |
合计 | 57 | 2832 | 1280 | 1552 | 154.0 |
|
|
公共基础课程714学时,占总学时比例25.2%; 选修课程302学时,占总学时比例10.6%; 实践性教学1552学时,占总学时比例54.8%。 |
(三)教学进程表(见附录)
八、实施保障
主要包括课程思政、师资队伍、教学设施、教学资源、教学方法、学习评价、质量管理等方面。
(一)课程思政
围绕教师、教材、教法三大关键要素,创新人才培养模式,拓展育人途径,将思想政治工作贯穿于教育教学全过程。教研室定期组织课程思政专题集体备课与教学研讨,系统梳理各门课程所蕴含的思想政治教育元素和所承载的思想政治教育功能。完善教学设计,将课程思政具体落实到课堂教学、实践教学的每个环节。注重课程思政学习效果的评价,作为学生考核关键知识和衡量教学效果的首要指标,纳入命题考核内容。注重课程思政教学效果的评价,将课程思政作为教学督导和课程评价的重要内容之一。
(二)师资队伍
1.队伍结构
根据教学要求配置各类教师。专业带头人原则上应具有高级职称,双师素质。专业“双师素质”教师一般不低于60%。兼职教师应主要来自于行业企业,企业兼职教师占专任教师总数≥25%,承担专业课教学任务授课课时占专业课总课时比重≥20%。注重老、中、青三个年龄段相结合,建立年齡结构合理的教师队伍。
2.专业带头人
除满足专任教师应具备的基本条件外,还具有5年以上累计企业工作经历和深厚专业背景,能把握行业发展动态,在本专业具有较高的能力;能统筹规划和组织专业建设,引领专业发展,能够主持专业的教改科研和产品研发,技术服务等工作。
3.任课教师(含专兼职教师)
专任教师应具备以下条件:
(1)具有良好的职业素养、职业道德、服务意识及现代的职教理念,具有可持续发展的能力;
(2)具有先进的互联网+信息技术、人工智能应用技术、计算机网络技术、软件技术专业知识;
(3)能够熟练掌握实验、实训设备的使用,并能独立对学生进行实训指导、比赛指导;
(4)能够指导高职学生完成高质量的信息企业实习;
(5)具备规划、设计、建立数字化资源的能力;
(6)骨干教师应接受过职业教育教学方法论的培训,具有开发专业课程的能力,能够指导新教师完成上岗实习工作。
(7)兼职教师聘请具有工程师、技师职称或者获得高级职业资格认证的技术人员、能工巧匠,专业岗位在企业及连续工作3年以上,在专业技术与技能方面具有较高水平,具有良好语言表达能力,主要承担实训教学或顶岗实习指导教师工作。
(三)教学设施
主要包括专业教室基本条件与校内实训室等配置。
1.专业教室基本条件
一般专业教室为多媒体教室,配备多媒体计算机和投影设备、黑板、音响设备,互联网计入或WiFi环境,并具有网络安全防护措施。安装应急照明装置并保持良好状态,符合紧急疏散要求、标志明显,保持逃生通道畅通无阻。
2.校内实训室(基地)基本要求
要求从以下方面考虑:
(1)实训室(基地)的数量。包括校内生均面积、生均实训设备值、生均工位数等;
(2)实训室(基地)开展实训项目;
(3)实训室(基地)的功能。包括开展产教研协同创新,开发标准、专利等方面;
(4)建立由国家级、上海市工匠,非遗大师,劳模,行业大师等领衔的大师工作室等。
表8 校内实训场地要求一览表
序号 | 实训场地名称 | 主要实训项目 | 设施配置 | 容纳学生人数 | 适用课程 |
1 | 大数据实验室 | hadoop大数据存储与运算; Hbase大数据快速读写; Spark大数据快速运算; Hadoop、数据挖掘、网络爬虫; 健康医疗大数据查询与处理。 | 8*Inter(R)Core(TM) i7-4790 CPU @ 3.6GHz 8G内存 CentOS6.4/Hadoop2.6.0 60台 | 60 | Hadoop、数据挖掘、网络爬虫、hadoop大数据存储与运算、Hbase大数据快速读写、Spark大数据快速运算、健康医疗大数据查询与处理 |
2 | 网络安全技术实训室 | 网络组建和管理; 网络安全管理配置; 数据库开发与应用程序。 | 锐捷网络设备、PC机 1个网络机柜 50台PC机 | 50 | 网络组建和管理 网络安全管理配置 数据库开发与应用程序 |
3 | 网页设计实训室 | 网页设计实践; 大学信息技术; 数字媒体基础与实践; 网站规划与设计实践; 其它计算机应用基础实训 | 内存8GB以上; 操作系统Windows10; 高速接入互联网; 能安装运行华为模拟器eNSP; 安装其它基础教学软件 | 65 | HTML/CSS; 移动应用开发技术; 网站设计与开发; 程序设计基础(JAVA语言); 数字媒体基础与实践 |
3.校外实训基地基本要求
要求从以下方面考虑:
(1)实训基地的数量、功能、资质、类型、规模;
(2)实训基地接受教师企业实践情况;
(3)劳模精神、工匠精神学习践行情况;
(4)进行产教研合作,共同技术研发、教学资源开发、标准制定等方面合作情况。
(5)接收学生实习情况,实习实践教学基地满足实践教学的情况,包括岗位数量、师资、技术类型等;提供指导教师数量、授课课时要求。
表9 校外实践教学基地一览表
序号 | 校外实践基地名称 |
1 | 华为教育投资公司 |
2 | 大唐邦彦公司 |
3 | 上海乾韵信息科技有限公司 |
4 | 普开数据公司 |
5 | 上海微创软件股份有限公司 |
6 | 任拓数据科技有限公司 |
(四)教学资源
1.教材选用基本要求
本专业教材的选用应符合职业教育教学规律,便于课堂教学,有利于激发学生学习兴趣。具有正确的政治导向和价值导向,具有科学性、规范性、适应性和合理性,应优先选用国家和省级规划教材、精品教材及获得省部级以上奖励的优秀教材,优先选用近三年出版的新教材或修订版教材。鼓励专业教师与行业专家、技术骨干联合开发实训教材、数字化教材、特色鲜明的专业课校本教材。
2.图书文献配备基本要求
图书文献配备能满足人才培养、专业建设及教学科研需求,且按生均80册的标准配备,方便师生查询、借阅。专业类图书文献包括:专业基础课程类、专业核心课程类、专业集中实践课程类、专业拓展课程类、公共基础课程类等相适应的图书、期刊、资料、标准、规程、图集和手册等。
3.数字教学资源配备基本要求
建设、配备与本专业有关的音视频素材、教学课件、数字化教学案例库、虚拟仿真软件、数字教材等专业教学资源库,应种类丰富、形式多样、使用便捷、动态更新,能满足教学要求;建有大数据技术专业数字化教学课程或资源库、文献资料库等信息资源;有教师开发并利用的信息化教学资源、教学平台,创新教学方法,支持学生利用信息化教学条件自主学习,同时具备数据搜集分析功能,可随时把握学生的学习进度与学习状态从而进一步提升教学效果。
(五)教学方法
根据学生特点,普及项目教学、案例教学、情境教学、模块化教学等教学方式,广泛运用启发式、探究式、讨论式、参与式等教学方法,推广翻转课堂、混合式教学、实时互动、移动学习等信息化教学模式,推动课堂教学革命。加强课堂教学管理,规范教学秩序,打造优质课堂。
(六)学习评价
改进学习过程管理与评价。严格落实培养目标和培养规格要求,加大过程考核、实践技能考核成绩在课程总成绩中的比重。严格考试纪律,健全多元化考核评价体系,完善学生学习过程监测、评价与反馈机制,引导学生自我管理、主动学习,提高学习效率。强化实习、实训、毕业设计(论文)等实践性教学环节的全过程管理与考核评价。
课程考核建议以过程化考核为主,兼顾终结性考评。
(1)专业基础课程建议采用笔试与实践能力考核相结合的形式,实践成绩占20%,课堂表现与出勤占20%,笔试成绩占60%;
(2)专业核心课程和专业拓展课程建议采用技能测试、笔试相结合的方法,技能测试包括功能测试、工艺评测和过程评价,占40%;笔试或口试占60%;
(3)专业技能训练课程主要采用技能测试,重点关注功能测试、工艺评测和过程评价;
(4)顶岗实习由校企人员组成的评定委员会根据学生出勤情况、周实习报告、顶岗实习总结、指导教师对学生的鉴定报告、企业对学生的评价鉴定或答辩情况,综合评价。
(七)质量管理
建立健全校院两级的质量保障体系。以保障和提高教学质量为目标,运用系统方法,依靠必要的组织结构,统筹考虑影响教学质量的各主要因素,结合教学诊断与改进、质量年报等职业院校自主保证人才培养质量的工作,统筹管理学校各部门、各环节的教学质量管理活动,形成任务、职责、权限明确,相互协调、相互促进的质量管理有机整体。
九、毕业要求
1.学生在规定修业年限内,修满专业人才培养方案所规定的学时学分,完成规定的实训、毕业实习和社会实践;
2.实行课证融通制度,鼓励学生在获得学历证书的同时,积极取得若干职业技能等级证书或职业资格证书;
3.符合学籍管理规定的毕业条件,准予毕业,并颁发毕业证书。
十、附录
2024级大数据技术专业教学计划表如下表所示。