主办单位: | 中国高校大数据教育创新联盟 |
泰迪杯数据挖掘挑战赛组委会 | |
协办单位: | 人民邮电出版社有限公司 |
北京泰迪云智信息技术研究院 | |
支持单位: | 广东泰迪智能科技股份有限公司 |
各有关院校
国家十三五规划纲要明确提出“实施国家大数据战略,推进数据资源开放共享”,为我国在大数据领域的未来发展绘制了宏伟的蓝图,开启了我国大数据发展的新时代。教育部《高等学校人工智能创新行动计划》及国务院颁布的《新一代人工智能发展规划》,责成科技司、基教司、职成司、高教司、地方各级教育行政部门大力推动人工智能、大数据等新技术在教育教学中的深入应用,推进信息技术与高等教育教学深度融合。从发布对人工智能、大数据等新技术与教育结合的指导性文件到直接扶持建设相关教学项目,为高校进行教学改革和升级教学手段和方式指明了新的方向。
大数据及人工智能产业的发展对人才提出了新的需求,国内各高校在积极进行学术研究的同时,已经将大数据与人工智能教育纳入培养体系。为帮助高校适时调整课程体系、继续深化教学改革,指导数据智能学科建设和跨学科人才培养,进一步提升教学能力和科研能力,中国高校大数据教育创新联盟将继续推动大数据人才培养工程行动计划,“2020年第四期全国高校大数据与人工智能双师骨干师资研修班(两大专题课程:python数据分析于机器学习实战班、python人工智能实战班)”因受疫情影响,将改为线上以云课堂形式举办, 现将有关通知如下:
一、培训目标及特点
1、为参训教师提供大数据教学领域全套工具、服务、平台、数据、案例及在线课程等资源,为在高校开展大数据教育工作、培养大数据人才的教师提供深入培训及交流机会。后续将为学校开展大数据相关课程设计与实践提供完整的威斯尼斯人wns145585的解决方案和全方位授课支持。
2、本次培训采用云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导结合的方式,全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。
3、本次培训将系统讲授大数据人工智能课程知识体系、授课方法、实验环境搭建、基础编程、实训实验室建设、高校课程公共服务平台资源使用指南等方面的内容,使学员能够深入了解当下大数据与人工智能技术在世界范围内的最新发展水平,理解大数据与人工智能技术在当代各种相关产品中的应用,并掌握该领域最关键技术的原理,以及技术应用过程,旨在帮助参加培训的教师快速建立对相关课程的整体性认识,为高职院校备课和顺利开课、科研和项目开发工作打下坚实基础。
4、本次培训课程内容以“鱼骨教学法”进行编排设计,所有课程将围绕真实企业项目展开,强调培训的实战性和真实性。让教师亲身接触企业一线工作场景,充分提升教师的实践教学能力。本次学习为每位参训学员提供系统的院校大数据专业建设方案,帮助各高职院校在专业课程体系建设提供全方位、强有力的教学资源支持。
5、本次课程通过讲授、研讨、动手实操、多种灵活有效的教学方式,加强大数据专业师资队伍的建设,提升教师教学创新思维。了解大数据及人工智能岗位目前的就业形势、前景及所需相关技能,了解企业实际需求,并参与一个实际项目的全过程,将培训转化成教学成果,运用到教师自己后续的教学当中去,全部提升教师实践教学能力。
6、了解高校大数据人工智能专业的教材、实验室、实训室建设内容、产品、科研和创新创业最新讯息。本次学习为每位参训学员提供大数据教学实训平台试用帐号、课程建设与程序设计的相关资源,丰富已开设大数据专业院校课程体系。
注:所有学员自备笔记本电脑(windows7或以上操作系统(64位)、8g 内存、100g 可用磁盘)进行实验操作、紧跟老师上课过程操作练习,完全学会经典案例开发技术,完全学会使用以上工具软件开发应用。
二、研修对象
各高职院校数据、大数据、人工智能相关学科、计算机、网络通信、自动化、电子工程、数理统计等专业的科研、教学带头人、骨干教师、博士生、硕士生、本科生、大专生;
从事计算机、云计算、大数据、人工智能、互联网等相关领域项目的科研院所的项目负责人、科研人员、工程技术人员等。
三、时间地点
课程一:python数据分析于机器学习实战班 培训时间:2020年8月1日-8日(培训以线上云课堂形式进行,支持六个月内免费回看)
课程二:人工智能技术与应用实战班 培训时间:2020年8月10日-16日(培训以线上云课堂形式进行,支持六个月内免费回看)
四、培训内容
center
课程专题一:python数据分析与机器学习实战班 | 培训时间:2020年8月1日-8日 | |
---|---|---|
第一阶段 前置基础课程 学员在正式培训前自学完成 ( 学习网址:edu.tipdm.org ) | ||
时间 | 课程内容 | 学习平台 |
正式培训前 | python编程寄出 1 准备工作 2 列表操作 3 程序流程控制语句 4 字符串操作 4.1 字符串及其索引&切片 4.2 字符串的常见方法 4.3 字典的创建及索引 4.4 字典常用操作 4.5 字典推导式 5 python文件读取操作 5.1 读取文件 5.2 练习3:统计小说中的单词频次 6 函数 6.1 python函数自定义 6.2 练习4:自定义求序列偶数个数的函数 7 面向对象与模块 7.1 python方法与函数对比介绍 7.2 python面向对象示例 7.3 python模块使用 7.4 第三方库的安装与调用 8 注意事项 8.1 python工作路径说明 8.2 模块命令及存放路径的注意事项 8.3 结语 | 泰迪云课堂 |
第二阶段 正式培训学习 | 学习时间:8月1日-8日 | |
时间 | 课程内容 | 学习平台 |
第一课 | ||
8月1日(周六) 19:00 - 21:30 | 1 python数据分析概述 1.1 认识数据分析 1.2 熟悉python数据分析的工具 1.3 安装python3的anaconda发行版 1.4 掌握jupyter notebook常用功能 2 numpy数值计算基础 2.1 认识numpy数组对象ndarray 2.2 认识numpy矩阵与通用函数 2.3 利用numpy进行统计分析 3 matplotlib数据可视化基础 3.1 了解绘图基础语法与常用参数 3.2 分析特征间的关系 3.3 分析特征内部数据分布与分散状况 4 pandas统计分析基础 4.1 读写不同数据源的数据 4.2 掌握dataframe的常用操作 4.3 转换与处理时间序列数据 4.4 使用分组聚合进行组内计算 4.5 创建透视表与交叉表 5 使用pandas进行数据预处理 5.1 合并数据 5.2 清洗数据 5.3 标准化数据 5.4 转换数据 6 使用scikit-learn构建模型 6.1 使用sklearn转换器处理数据 6.2 构建并评价聚类模型 6.3 构建并评价分类模型 6.4 构建并评价回归模型 | 泰迪云课堂 |
第一课作业 | 个人pc | |
在线答疑 | 微信群 | |
第二课 python数据分析实训 | ||
8月2日(周日) 19:00 - 21:30 | 1 探索iris鸢尾花数据 1.1 将数据集存成变量iris创建数据框的列名称['sepal_length'、'sepal_width'、'petal_length'、'petal_width'、'class'] 1.2 数据框中有缺失值吗? 1.3 将列petal_length的第10到19行设置为缺失值 1.4 将petal_length缺失值全部替换为1.0 1.5 删除列class 1.6 将数据框前三行设置为缺失值 1.7 删除有缺失值的行 1.8 重新设置索引 2 探索chipotle快餐数据 2.1 将数据集存入一个名为chipo的数据框内 2.2 查看前10行内容 2.3 数据集中有多少个列(columns)? 2.4 打印出全部的列名称 2.5 数据集的索引是怎样的? 2.6 被下单数最多商品(item)是什么? 2.7 在item_name这一列中,一共有多少种商品被下单? 2.8 一共有多少个商品被下单? 2.9 将item_price转换为浮点数 2.10 在该数据集对应的时期内,收入(revenue)是多少? 2.11 在该数据集对用的时期内,一共有多少订单? 2.12 每一单(order)对应的平均总价是多少? 3 探索apple公司股价数据 3.1 读取"appl_1980_2014.csv"数据并存为一个名叫apple的数据框 3.2 查看每一列的数据类型 3.3 将date这个列转换为datetime类型 3.4 将date设置为索引 3.5 有重复的日期吗? 3.6 将index设置为升序 3.7 找到每个月的最后一个交易日(businessday) 3.8 数据集中最早的日期和最晚的日期相差多少天? 3.9 在数据中一共有多少个月? 3.10 按照时间顺序可视化adj close值 | 泰迪云课堂 |
第二课作业 | 个人pc | |
在线答疑 | 微信群 | |
第三课 机器学习实战 | ||
8月3日(周一) 19:00 - 21:30 | 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 h模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量python实现 3 回归分析(regressionanalysis) 3.1 线性回归基本形式 3.2 线性回归模型的python实现 3.3 波士顿房价预测的python实现 3.4 逻辑回归介绍 3.5 研究生入学录取预测的python实现 4 聚类分析(clusteranalysis) 4.1 聚类分析概述 4.2 相似性度量 4.3 k-means聚类分析算法介绍 4.4 利用k-means算法对鸢尾花进行聚类 4.5 聚类结果的性能度量 4.6 调用sklearn实现聚类分析 | 泰迪云课堂 |
第三课作业 | 个人pc | |
在线答疑 | 微信群 | |
第四课 机器学习实战案例 | ||
8月4日(周二) 19:00 - 21:30 | 市财政收入分析预测 1 背景与案例目标 1.1 财政收入预测背景介绍 1.2 数据基本情况介绍 1.3 分析目标解读 1.4 项目流程介绍 2 相关系数分析 2.1 求解person相关系数 2.2 person相关系数解读 3 lasso回归特征提取 3.1 了解lasso回归方法 3.2 lasso回归选取关键特征的实现 3.3 lasso回归数据写出及相应解读 4 灰色预测模型 4.1 关键特征数据读取及准备 4.2 gm11特征值预测 4.3 gm11特征数据整理及写出 5 模型训练及预测 5.1 数据标准化 5.2 模型训练及预测 5.3 结果可视化 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第五课 文本挖掘实战 | ||
8月5日(周三) 19:00 - 21:30 | 1 自然语言处理简介 2 开源中文nlp系统介绍 3 中文分成介绍 4 机械分词法 5 机器学习算法分词 6 nlp概率图介绍 7 jieba分成演示 8 文本的one-hot表达 9 tf-idf权值策略实现 10 文本的tf-idf表达 11 模型训练与预测 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第六课 文本分类案例 | ||
8月6日(周四) 19:00 - 21:30 | 垃圾自动识别 1 背景与目标 2 数据探索 2.1 数据读取 2.2 数据抽取 3 数据预处理 3.1 去除短信中的x序列 3.2 结巴分词 3.3 去除停用词 3.4 数据预处理函数封装 3.5 垃圾短信的词频统计 3.6 词云图绘制 4 文本向量的表示 4.1 文本数据的向量化表达 4.2 获取训练样本的tf-idf权值向量 4.3 获取测试样本的tf-idf权值向量 5 模型训练及评价 6 小结 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第七课 综合实战 | ||
8月7日(周五) 14:00 - 18:00 | 电商智能推荐:优惠劵使用预测 1 背景与目标 2 数据说明 2.1 线下训练集数据介绍 2.2 安线上训练集数据介绍 2.3 测试数据介绍 2.4 项目流程介绍 3 数据预处理 3.1 构建正样本 3.2 构建负样本 3.3 构建样本标签 4 特征构建 4.1 特征构建介绍 4.2 处理discount_rate列 4.3 特征1-折扣率 4.4 特征2-商户与用户之间的距离 5 模型训练 5.1 建模前数据准备 5.2 初级模型构建 5.3 roc曲线与auc值 5.4 模型性能评估 5.5 训练函数封装 5.6 模型预测 5.7 预测函数封装 6 特征完善 6.1 特征3-优惠劵流行度 6.2 特征4-用户在商家中的消费次数 6.3 如何进行特征拼接 6.4 拼接训练集的特征3&4 6.5 拼接测试集的特征3&4 7 预测 7.1 模型训练 7.2 预测 7.3 代码整理 7.4 结果提交 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
自行安排 | 拓展自学 python爬虫助力疫情数据追踪 1 明确项目需求与目标 2 环境准备 3 获取疫情数据(全球、中国各省及各地区数据) 4 疫情数据分析 5 疫情数据可视化 6 完成分析报告 | 泰迪云课堂 |
第八课 认证考试 | ||
8月8日(周六) 19:00 - 21:30 | 工信部教育与考试中心职业技术认证在线考试 | 泰迪云课堂 |
课程专题二:人工智能实战班 | ||
说明:参加该阶段学习须具备中级班的知识和技能基础 | 培训时间:8月10日-16日 | |
时间 | 课程内容 | 学习平台 |
第一课 深度学习基础-人工神经网络 | ||
8月10日(周一) 19:00 - 21:30 | 1 单个神经元介绍 2 经典网络结构介绍 3 神经网络工作流程演示 4 如何修正网络参数,梯度下降 5 网络工作原理推导 6 网络搭建准备 7 样本从输入层到隐层传输的python实现 8 网络输出的python实现 9 单样本网络训练的python实现 10 全样本网络训练的python实现 11 网络性能评价 12 调用sklearn实现神经网络算法 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第二课 tensorflow2实战 | ||
8月11日(周二) 19:00 - 21:30 | 1 任务1:构建一个线性模型 1.1 tensorflow介绍 1.2 tensorflow2常用数据类型和操作 1.3 初始化模型 1.4 构建损失函数 1.5 模型训练及可视化 1.6 使用高阶api-keras 2 任务2:mnist手写数字识别 2.1 数据读取及探索 2.2 交叉熵 2.3 模型构建及训练 2.4 调用保存好的模型对新样本进行预测 3 作业-鸢尾花分类 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第三课 人工智能核心课-深度神经网络 | ||
8月12日(周三) 19:00 - 21:30 | 1.1 深度神经网络-引言 2 卷积神经网络cnn 2.1 浅层神经网络的局限 2.2 卷积操作 2.3 卷积操作的优势 2.4 池化及全连接 2.5 高维输入及多filter卷积 2.6 实现卷积操作 2.7 实现池化操作 3 循环神经网络rnn 3.1 循环神经网络简介 3.2 循环神经网络的常见结构 4 长短时记忆网络lstm 4.1 lstm的三个门 4.2 lstm三个门的计算示例 4.3 利用rnn&lstm实现mnist手写数字识别 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第四课 利用循环神经网络(rnn)对文本进行分类 | ||
8月13日(周四) 19:00 - 21:30 | 1 明确项目需求与目标 2 环境准备 3 数据预处理 4 加载模型、构建读取接口 5 确定训练策略 6 配置参数 7 确定任务,开始训练 8 性能评估及总结 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第五课 搭建一个属于自己的聊天机器人 | ||
8月14日(周五) 19:00 - 21:30 | 1 项目背景与目标 2 语料库预处理 3 seq2seq模型计算图搭建-文件读取 4 seq2seq模型计算图搭建-encoder 5 seq2seq模型计算图搭建-decoder 6 seq2seq模型计算图搭建-seq2seq 7 模型训练 8 模型测试 9 注意力机制 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第六课 综合实战:搭建一个智能车牌识别系统 | ||
8月15日(周六) 19:00 - 21:30 | 1 明确项目目标 2 准备数据 3 照片预处理 4 定位车牌信息 5 分割车牌字符 6 搭建车牌识别网络 7 进行模型训练 8 模型结果与评估 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
实战项目介绍:基于深度学习的车牌识别系统项目 | 基于深度学习的车牌识别系统项目介绍 技能点:深度学习实战、tensorflow框架、图像处理技术、opencv应用、实际项目搭建与应用。 1 明确项目目标 2 准备数据 3 照片预处理 4 定位车牌信息 5 分割车牌字符 6 搭建车牌识别网络 7 进行模型训练 8 模型结果与评估 | |
第七课 认证考试 | ||
8月16日(周日) 19:00 - 21:30 | 工信部教育与考试中心职业技术认证在线考试 | 泰迪云课堂 |
五、课程主讲师资介绍
张敏 广东泰迪科技高级、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通python、r语言、matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省python与深度学习技术师资培训班主讲讲师,2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、二、三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《》、《》、《r语言编程基础》等。 | |
杨惠 广东泰迪智科技高级,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如ppv商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络rnn,熟悉常用机器学习算法原理及应用,如神经网络、svm、决策树、贝叶斯等算法;精通r、python、matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。 |
六、证书颁发
学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“大数据技术应用或python技术应用工程师职业技术”证书,可根据参加的培训课程专题选择其中一个方向的认证考试,证书可登录国家工业和信息化部教育与考试中心威尼斯5139手机版官网查询。
七、报名材料及费用说明
1. 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色证件照 电子版(要求背景:白色,格式:jpg,大小:14-20k)。
2. 培训费用: 课程一 python数据分析与机器学习实战研修班费用1980元/人;课程二 人工智能技术与应用实战班培训费2980元/人。两课专题联报优惠价4500元/人,包含(报名费、学习费、资料费、证书费)
3. 专题课程一全程内容共计55课时,专题课程二全程内容共计50课时,课程视频内容六个月内面向学员免费开放,可以反复学习。
4. 参加线上课程学习的学员,如后续参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。
5. 本次由广东泰迪智能科技股份有限公司收取费用并开具发票。
八、威斯尼斯人wns145585的联系方式
联 系 人:曾老师 13246821827
微 信:antonia602501
q q:804954701
邮 箱:zengaizhi@tipdm.com
机构网址:www.tipdm.com
附件一:
2020年第四期全国高校大数据与人工智能双师型骨干师资研修班v1.1(1).pdf
2020年全国高校大数据与人工智能骨干师资研修班
报名申请表
单位名称 | ||||||
部门/院系 | ||||||
通讯地址 | 邮 编: | |||||
发票抬头 | 发票内容: | |||||
纳税号 | 电子发票 接收邮箱: | |||||
课程及考试方向选择 | 课程一 python数据分析与机器学习实战研修班 | 认证一 python技术应用 | ||||
课程二 人工智能实战班 | 认证二 大数据技术应用 | |||||
联系人 | 电话: | 邮箱: | ||||
姓名 | 性别 | 职务 | 身份证号 | 手机号 | 电子邮箱 | |
费用支付时间及方式 | 1、电汇到指定账号。 3、付款时请注明"大数据研修班 单位或姓名"字样,方便查账备案。 | |||||
帐户信息 | 账户名:广东泰迪智能科技股份有限公司 开户行:中国工商银行广州花城支行 账户号:3602 0285 0920 1663 221 | |||||
备注 | 请将报名表发送至招生办公室,报名邮箱:zengaizhi@tipdm.com 联系人: 曾老师 13246821827 |