Python数据分析与数据挖掘-4天
Python数据分析与数据挖掘-4天详细内容
Python数据分析与数据挖掘-4天
Python数据分析与数据挖掘
课程背景
互联网的飞速发展伴随着海量信息的产生,而海量信息的背后对应的则是海量数据如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据分析作为大数据技术的核心一环,其重要性不言而喻。
在数据分析领域,Python语言以其简单易用,并提供了优秀、好用的第三方库和数据分析的完整框架而深受数据分析人员的青睐。可以说,Python 已经当仁不让地成为了数据分析人员的一把“利器”。程序员想要进入数据分析行业,首先要掌握 Python 数据分析技术,只有这样才能在严峻的就业市场中具有较强的竞争力。
课程收益
通过本课程学习,达到如下目的:
了解Python使用场景,能够搭建自己的编程开发环境。
掌握Python编程的基础语法知识、精髓及编程思想。
掌握常用的第三方扩展库的使用,特别是文件夹处理、word excel ppt文件处理;
学会使用Python提升职场常见办公场景的工作效率,如邮件自动化、网络爬虫。
了解Numpy库多维数组的创建、切片和索引方法,以及数组的运算和存取。
学会使用Pandas库完成数据的导入导出、数据整理和数据多角度分析的方法。
学习正则表达式及如何爬取网络数据进行数据分析。
学会使用Matplotlib模块绘制常用图表和高大上图表,以及如何与EXCEL联动;
了解机器学习概念,会使用Sklearn模块进行线性回归、逻辑回归的分析方法。
能结合课程学习到的方法和工具对本职工作中遇到的场景进行针对性分析。
培训对象
本课程适用于职场从事数据分析或和数据分析工作相关的职场人士。
授课讲师
张晓如 老师(微软OFFICE大师级认证)
授课时间
4天(6小时/天)。
课程大纲PartⅠ、数据分析理念
*了解数据分析的方法、工具和流程。
什么是数据分析?
概念与目的
发现数据规律——找到可行方案——指导管理决策。
数据分析三阶段
描述性分析,发生了何事
诊断性分析,为何发生
预测性分析,将发生何事数据分析方法
对比分析
同比分析
环比分析
回归分析
聚类分析
时间序列分析
数据分析的工具
常规工具VS高大上工具
数据分析流程
步骤1:明确目的
确定分析目的:要解决什么样的业务问题
确定分析思路:分解业务问题,构建分析框架
步骤2:数据收集
明确收集数据范围
确定收集来源
确定收集方法
步骤3:数据预处理
数据质量评估
数据清洗、数据处理和变量处理
步骤4:数据分析
选择合适的分析方法
构建合适的分析模型
选择合适的分析工具
步骤5:数据展示
选择恰当的图表
选择合适的可视化工具
步骤6:报表撰写
选择报告种类
完整的报告结构
Part2、Python环境搭建
*搭建自己的Python编程开发环境。
认识Python与环境搭建
What——什么是Python
Anaconda如何下载、安装与配置
IDLE VS Jupyter Notebook VS Spyder
Python初体验——十秒钟快速创建100个Excel工作薄并统一命名
Spyder界面介绍
Python文件的打开、编辑与保存
案例:认识一下Python代码的整体构成
模块的类别、安装、导入
内置模块
第三方模块
用PIP命令安装、卸载、升级模块
Import语句导入模块
From语句导入模块
实战:搭建并配置自己的Python运行环境。
Part3、Python编程基础
*掌握Python编程思想、编程语句、数据结构。
语法特点缩进
注释
PEP8编写规范
变量变量的赋值
变量命名规则
数据类型数值型:整型与浮点型
字符型:字符型的定义
逻辑型:1和0,或TRUE和FALSE
数据类型的查询:TYPE函数
数据类型的运算:数值型/字符型/逻辑型如何运算
数据类型的转换:Str()函数、int()函数、float()函数
数据结构列表(LIST):如何定义/访问/增加/修改/删除
字典(DICTIONARY):如何定义/访问/增加/修改/删除
元组:如何定义/访问
集合:如何定义/访问
流程控制语句If语句——选择结构
For语句——循环结构
While语句——循环结构
循环结构中的break语句和continue语句
控制语句的嵌套
函数常用内置函数:print()input()replace()/strip()/split()open()……
如何自定义函数:def语句
编程中的异常处理练习:基本Python编程语句实战操作。
Part4、NumPy入门与实战
*学习NumPy库对多维数组的创建、切片和索引方法,以及数组的运算和存取。
ndarray多维数组
创建ndarray多维数组
Ndarray的对象属性、数据类型及变换
数组的索引和切片
数组索引方法
数组切片方法
数组的运
数组和标量间的运算
数组的条件逻辑运算
统计运算
数组内如何排序
Part5、数据预处理
*学习Pandas库和xlwing库对文件的读写操作、数据整理的方法。
pandas数据结构
Series对象:如何定义/访问/增加/修改/删除
DataFrame对象:如何定义/访问/增加/修改/删除
读、写数据
读、写文本文件
读、写Excel文件
读、写数据库数据
读、写网页
数据操作
数据的增、删、改、查
NaN数据处理
时间数据的处理
数据的抽取:字段拆分、记录抽取、随机抽样
数据的预处理
处理缺失值
去除重复数据
处理异常值
合并数据:追加合并、匹配合并
数据标准化:0-1标准化
数据的分组与聚合
数据分组
数据聚合
使用xlwing库批量处理工作薄/工作表/行/列(EXCEL)
批量新建、保存、关闭工作薄
批量打开一个文件夹下的所有工作薄
批量重命名一个工作薄中的工作表名称
批量打印工作薄中的指定工作表/指定页
按条件将EXCEL中的多个工作表合并为一个工作表
按条件将EXCEL中的一个工作表拆分为多个工作薄
案例实操:超市交易数据清洗、查看员工业绩波动、分析员工业绩。
Part6、Pandas模块数据分析
*学习Pandas中常用的数据分析方法。
基础数据分析方法
批量升序/降序排序一个工作薄中的所有工作表
使用描述统计呈现数据的相关指标(如平均值、极值、%分位值、峰度系数、偏度系数等)
进阶数据分析方法
制作数据透视表进行交叉分析
分组对比分析(定性分组与定量分组)
使用相关系数判断数据的相关性
数据建模回归分析
时间序列分析
Datetime模块的时间数据类型
如何把字符型转为时间型数据
时间序列如何索引和切片数据
如何创建介于某时间区间的时间数据(天/月/固定天数)
案例实操:超市交易数据清洗、查看员工业绩波动、分析员工业绩。
Part7、爬取网络数据进行分析
*学习正则表达式及如何爬取网络数据进行数据分析。
认识网页结构和网页源代码
查看源代码
查看网页结构(区块/列表/标题/链接/元素)
正则表达式
认识普通字符和元字符
使用正则表达式提取数据
Request模块获取网页源代码
Selenium模块获取网页源代码
Selenium模块模拟鼠标和键盘操作
爬虫实战:
爬取某网站图书销量排行榜数据并分析
爬取某网站关于某关键词的实时新闻数据
爬取新闻热点排行榜
Part8、Sklearn机器学习与数据挖掘
*了解机器学习概念,掌握线性回归、逻辑回归的分析方法。
机器学习基本概念机器学习库sklearn简介.扩展库sklearn常用模块与对象.
选择合适的模型和算法
线性回归算法的原理与应用线性回归模型的原理.
sklearn中线性回归模型的简单应用+
岭回归的基本原理与sklearn实现
使用线性回归模型预测儿童身高
逻辑回归算法的原理与应用..逻辑回归算法的原理与应用sklear实现
使用逻辑回归算法预测.考试能否及格
朴素贝叶斯算法的原理与应用基本概念..
朴素贝叶斯算法分类的原理与sklearn实现
使用朴素贝叶斯算法对中文邮件进行分类...
案例:使用线性回归分析对销售收入进行分析和预测案例:使用Pandas、sklearn模块对客户价值进行分析特别注意
学员自备电脑(建议一人一台),老师讲解示范后学员操作练习;本课程内容及顺序可能根据学员需求及难度而调整。
张晓如老师的其它课程
用Power BI 驾驭企业大数据管理-2天 01.19
用PowerBI驾驭企业大数据分析课程背景PowerBI是微软官方推出的可视化数据探索和交互式报告工具,它能实现数据分析的所有流程,包括对数据的获取、清洗、建模和可视化展示,从而来帮助个人或企业来对数据进行分析,用数据驱动业务,做出正确的决策。PowerBI在推出后的短时间内就受到众多企业的青睐和广泛使用,未来掌握PowerBI工具的应用、借助其对企业数据进
讲师:张晓如详情
用Power BI 驾驭企业大数据管理-3天 01.19
数据驱动价值——用PowerBI驾驭企业大数据管理课程背景PowerBI是微软官方推出的可视化数据探索和交互式报告工具,它能实现数据分析的所有流程,包括对数据的获取、清洗、建模和可视化展示,从而来帮助个人或企业来对数据进行分析,用数据驱动业务,做出正确的决策。PowerBI在推出后的短时间内就受到众多企业的青睐和广泛使用,未来掌握PowerBI工具的应用、借
讲师:张晓如详情
职场高效办公|WPS高级应用技能提升课程背景您曾经因为要能在向上司作汇报时提供制作出精美优质专业的报告而加班不断却效果不佳吗?您曾经因为要从海量数据中统计分析出有价值的信息,却苦于找不到有效的方法和工具而困扰吗?本课程以解决实际问题为导向,以案例教学为核心,凭借教学内容的专业设计、讲师丰富的培训经验和多年项目管理背景,指导您迅速扎实的掌握WPS软件的文字、表
讲师:张晓如详情
职场高效办公——WPS三剑客在企业管理中高级应用课程背景您曾经因为要能在向上司作汇报时提供制作出精美优质专业的报告而加班不断却效果不佳吗?您曾经因为要从海量数据中统计分析出有价值的信息,却苦于找不到有效的方法和工具而困扰吗?本课程以解决实际问题为导向,以案例教学为核心,凭借教学内容的专业设计、讲师丰富的培训经验和多年管理工作背景,指导您迅速扎实的掌握WPS软
讲师:张晓如详情
职场高效工作汇报与表达-1天 01.19
向上管理——职场高效工作汇报与表达课程背景你代表公司去给客户宣讲计划方案,客户方不是低头玩手机就是出去接电话,对你的内容毫无兴趣,让你颜面尽失,无法向公司交差;同样是工作汇报,领导刚刚还在对同事的汇报频频点头报以微笑,轮你上台就开始面无表情、双眉紧锁;在项目工作汇报中,明明你做了精心的准备、资料信息都很充分,可就是无法把你的观点表达清楚;以上种种情形在职场中
讲师:张晓如详情
数据创造价值-大数据分析与应用实战-2天 01.19
数据创造价值——大数据分析与应用实战课程背景习近平总书记在中共中央政治局在实施国家大数据战略第二次集体学习(2017年12月8日)中指出:“善于获取数据、分析数据、运用数据,是领导干部做好工作的基本功。各级领导干部要加强学习,懂得大数据,用好大数据,增强利用数据推进各项工作的本领,不断提高对大数据发展规律的把握能力,使大数据在各项工作中发挥更大作用。”在企业
讲师:张晓如详情
数据化运营-大数据思维与数据分析-1天 01.19
数据化运营—大数据思维与数据分析应用课程背景大数据时代,企业缺少数据吗?不,各个信息系统已经积累了大量的数据。我们不缺乏海量的数据,也不缺少高效的工具,我们缺少思路和方法,缺少懂数据、会分析的数据分析人士!必须将数据分析的思路、方法,以及将其落实到工作实际的实战应用中,这是企业当前需面对和解决的主要问题。本课程运用企业现有的数据和工具,探讨如何将数据分析与企
讲师:张晓如详情
数据驱动价值|ExcelBI数据分析与可视化呈现课程背景随着数据采集技术和数据存储技术的发展,企业需要面对的数据越来越复杂。只有从海量数据中挖掘出有价值的海量信息,用数据来指导日常的管理和业务决策,才能有效帮助企业扩大利润并推动企业规模的扩张。微软的Excel软件在职场中广为流传,随着OFFICE2016版本和OFFICE365版本的推出,其不再仅仅数据存储
讲师:张晓如详情
数据驱动价值——基于统计学的数据分析实战-1天 01.19
用数据驱动价值——基于统计学的数据分析课程背景习近平总书记在中共中央政治局在实施国家大数据战略第二次集体学习(2017年12月8日)中指出:“善于获取数据、分析数据、运用数据,是领导干部做好工作的基本功。各级领导干部要加强学习,懂得大数据,用好大数据,增强利用数据推进各项工作的本领,不断提高对大数据发展规律的把握能力,使大数据在各项工作中发挥更大作用。”在企
讲师:张晓如详情
思维导图在职场中的高效应用-2天 01.19
思维导图职场高效应用课程背景思维导图由英国的“世界大脑先生”、“记忆力之父”——东尼·博赞所创造,它是一种有效的思维方式和学习方式,是表达发散性思维的有效图形思维工具,它简单却又很有效,是一种革命性的思维工具。思维导图常常被用在突破思维限制、职场的问题分析与解决、活动策划、新产品开发、头脑风暴、项目管理、任务管理、逻辑沟通、弹性沟通、信息整理、高效学习等领域
讲师:张晓如详情
- [潘文富] 经销商终端建设的基本推进
- [潘文富] 中小企业招聘广告的内容完
- [潘文富] 优化考核方式,减少员工抵
- [潘文富] 厂家心目中的理想化经销商
- [潘文富] 经销商的产品驱动与管理驱
- [王晓楠] 辅警转正方式,定向招录成为
- [王晓楠] 西安老师招聘要求,西安各区
- [王晓楠] 西安中小学教师薪资福利待遇
- [王晓楠] 什么是备案制教师?备案制教
- [王晓楠] 2024年陕西省及西安市最
- 1社会保障基础知识(ppt) 21159
- 2安全生产事故案例分析(ppt) 20239
- 3行政专员岗位职责 19045
- 4品管部岗位职责与任职要求 16223
- 5员工守则 15461
- 6软件验收报告 15395
- 7问卷调查表(范例) 15113
- 8工资发放明细表 14554
- 9文件签收单 14195