Python机器学习算法实战

  培训讲师:尹传亮

讲师背景:
尹传亮——平安金融高级工程师10年以上的IT工作经验,研发出身,在产品设计,项目管理均有着丰富的实战经验。14-15年,作为产品经理,参与公司爬虫系统设计。15-16年,作为项目负责人,带队在华为实施爬虫项目,并在期间打磨爬虫系统,数据爬取 详细>>

尹传亮
    课程咨询电话:

Python机器学习算法实战详细内容

Python机器学习算法实战

Python机器学习算法实战【课程目标】
本课程为高级课程,专注于机器学习算法,原理,以及算法实现及优化。
通过本课程的学习,达到如下目的:
熟悉常见的机器学习的算法。
掌握机器学习的算法原理,以及数据推导。
学会使用Python来实现机器学习算法,以及优化算法。
掌握scikit-learn扩展库来实现机器学习算法。
【授课时间】
2-3天时间
【授课对象】
IT系统部、大数据系统开发部、大数据建模等IT技术人员。
【学员要求】
课程为实战课程,要求:
每个学员自备一台便携机(必须)。
要求有Python开发基础。
要求有基本的数据分析和数据挖掘的知识。
注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。
【授课方式】
机器学习任务 + 算法原理 + 数学推导 + Python实现
从任务出发,了解算法原理,以及数学推导过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
【课程大纲】
机器学习基础
机器学习简介
机器学习的种类
监督学习/无监督学习/半监督学习/强化学习
批量学习和在线学习
基于实例与基于模型
机器学习的主要战挑
数据量不足
数据质量差
无关特征
过拟合/拟合不足
机器学习任务
监督:分类、回归
无监督:聚类、降维、关联规则
机器学习基本过程
模型评估指标
回归:R^2, MAE/MSE/RMSE/MAPE
分类:Acc,Recall,Precision,F1,ROC曲线,AUC
模型评估方法
训练集/验证集
交叉验证
过拟合评估
过拟合检验
过拟合解决方法:正则化
正则化:
L1正则项
L2正则项模型参数优化
交叉验证
网格搜索GridSearchCV
随机搜索RandomizeSearchCV
机器学习常用库
回归任务算法
线性回归模型
一元线性回归
多元线性回归
线性回归算法
损失函数
普通最小二乘法OLS
欠拟合解决方法
多项式回归
过拟合的优化算法:正则化
岭回归(Ridge)
套索回归Lasso
ElasticNet回归
各种算法的适用场景
超参优化
大规模数据集回归:迭代算法
随机梯度下降
批量梯度下降
小批量梯度下降
梯度算法的关键问题
逻辑回归
逻辑回归模型
逻辑回归的算法
原理
数学推导
正则项处理
其它优化:
迭代样本的随机选择
变化的学习率
求解算法与惩罚项的关系
多分类处理
ovo
ovr
线性判别分析
判别分析简介
基本思想
判别分析算法
数学推导
类间/类内散度矩阵
多分类处理
迭代样本的随机选择
变化的学习率
求解算法与惩罚项的关系
支持向量机
支持向量机简介
作用:回归、分类、异常检测
适用场景
线性SVM分类
基本原理
支持向量
SMO算法
非线性SVM分类
常用核函数
线性核函数
多项式核
高斯RBF核
核函数的选择原则
线性不可分处理:松弛系数
决策树
决策树模型
构建决策树的三个关键问题
决策树的训练
决策树的可视化
决策树常用算法
ID5
CART
正则化参数
决策树预测的基本步骤
神经网络
神经网络模型
工作原理:加法器、激活函数
适用场景
神经网络的建立步骤
BP算法实现
多层感知器MLP
隐藏层的数量
神经元的个数
朴素贝叶斯
贝叶斯简介
条件概率
常见贝叶斯网络
朴素贝叶斯
算法实现
连续变量处理:高斯分布
拉普拉斯修正
集成算法
分类模型优化思想
优化框架
Bagging
Boosting
Bagging集成
原理
随机森林
Boosting集成
原理
AdaBoost
无监督算法
结束:课程总结与问题答疑。

 

尹传亮老师的其它课程

Python开发语言基础实战培训【课程目标】Python已经成为稳居前三的最受欢迎的语言之一,它简单易用、跨平台、功能强大、扩展性强,而且能够将其它语言编写的程序融合起来,实现无缝连接,号称是万能胶水语言。本课程为Python语言基础学习,通过本课程的学习,达到如下目的:全面掌握Python语言以及其编程思想。掌握Python基本格式,以及常用的6种基本语句

 讲师:尹传亮详情


Python课程   06.19

Python课程一、数据挖掘导论数据挖掘的基本任务与步骤:目标、数据探索、数据预处理、建模、模型评价有监督学习无监督学习和半监督学习算法模型Sklean数据挖掘和机器学习算法库介绍大数据建模常见问题问题引出:客户行为分析-用户用电异常的识别二、Python编程快速入门Python编程环境与语法快速入门基础数据结构:字符串处理及应用数据结构:列表、元组、集合、

 讲师:尹传亮详情


Python实现大数据挖掘技术培训【课程目标】Python已经成为数据分析和数据挖掘的首选语言,作为除了Java、C/C++/C#外最受欢迎的语言。本课程基于Python工具来实现大数据的数据分析和数据挖掘项目。基于业务问题,在数据挖掘标准过程指导下,采用Python分析工具,实现数据挖掘项目的每一步操作,从数据预处理、数据建模、数据可视化,到最终数据挖掘结

 讲师:尹传亮详情


Python运用   06.19

PYTHON数据分析第一模块:python语言基础知识0.5H1.python简介2.python的特征3.第一个python程序4.搭建开发环境5.python的开发工具6.不同平台下的python第二模块:Python的基本语法2H1.Python的文件类型2.Python的编码规则3.变量和常量4.数据类型5.运算符与表达式第三模块:python的控制

 讲师:尹传亮详情


大数据变革与商业模式创新【课程目标】大数据时代已经来临,大数据战略已经上升到国家意志,拥有大数据的规模和利用大数据的能力已经成为国家竞争力的一种体现,大数据的重要性已经毋庸置疑。本课程围绕大数据产业,从大数据的基本面出发,分析大数据的应用价值;大数据作为工具,如何帮助企业提升运营效率,提升企业利润;再到大数据引起的思维变革,怎样改变企业管理、社会治理的思维;

 讲师:尹传亮详情


大数据时代的精准营销【课程目标】本课程从实际的市场营销问题出发,了解大数据在市场营销领域的价值以及应用。并对大数据分析与挖掘技术进行了介绍,通过从大量的市场营销数据中分析潜在的客户特征,挖掘客户行为特点,实现精准营销,帮助市场营销团队深入理解业务运作,支持业务策略制定以及营销决策。通过本课程的学习,达到如下目的:了解大数据营销内容,掌握大数据在营销中的应用。

 讲师:尹传亮详情


大数据挖掘工具:SPSSStatistics入门与提高【课程目标】随着大数据分析的需求越来越旺盛,大数据分析工具也越来越琳琅满目,然而,绝大多数的分析工具都只具有单一用途,无法满足企业的复杂的多样化的全面的业务分析需求,因此分析工具的选择成为了一个挑战。一个良好的分析工具必须满足如下要求:易学易用易操作。分析效率要高。满足业务分析需求。如果要说前两个要求,显

 讲师:尹传亮详情


数据分析与建模第一章数据分析与大数据平台1.大数据相关概念2.大数据特征3.大数据平台简介第二章数据分析流程1.数据分析2.数据分析工具3.数据分析流程4.典型模型场景第三章重要的python库1.NumPy2.pandas3.matplotlib4.IPython与Jupyter5.SciPy6.scikit-learn7statsmodels第4章Num

 讲师:尹传亮详情


Hadoop大数据解决方案平台技术培训【课程目标】Hadoop作为开源的云计算平台,为大数据处理提供了一整套解决方案,应用非常广泛。Hadoop作为一个平台框架,包括了如何存储海量数据,如何处理海量数据,以及相应的数据库、数据仓库、数据流处理、数据分析和挖掘算法库,等等。本课程主要介绍Hadoop的思想、原理,以及重要技术等相关知识。通过本课程的学习,达到如

 讲师:尹传亮详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有