证券投资分析
报考指南考试报名准考证打印成绩查询考试题库

重置密码成功

请谨慎保管和记忆你的密码,以免泄露和丢失

注册成功

请谨慎保管和记忆你的密码,以免泄露和丢失

当前位置:首页证券投资分析考试问答正文
如何以客户为中心进行数据挖掘与分析 如何以客户为中心进行数据挖掘与分析
如何以客户为中心进行数据挖掘与分析
aochuimi1回答 · 5890人浏览
最佳答案
用户头像
你别来我无恙 新兵答主 03-22 TA获得超过7189个赞
1、Pandas库的操作
Panda是数据分析特别重要的一个库,我们要掌握以下三点:
1)pandas 分组计算;
2)pandas 索引与多重索引;
索引比较难,但是却是非常重要的
3)pandas 多表操作与数据透视表
2、numpy数值计算
numpy数据计算主要的应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:
1)Numpy array理解;
2)数组索引操作;
3)数组计算;
4)Broadcasting(线性代数里面的知识)
3、数据可视化-matplotlib与seaborn
1)Matplotib语法
python最基本的可视化工具就是matplotlib。我们咋一看Matplotlib与matlib有点像,我们要搞清楚二者的关系是什么,这样我们学习起来才会比较轻松。
2)seaborn的使用
seaborn是一个非常漂亮的可视化工具。
3)pandas绘图功能
我们说过pandas是做数据分析的,但它也提供了一些绘图的API。
4、数据挖掘入门
这部分是最难也是最有意思的一部分,要掌握以下几个部分:
1)机器学习的定义
在这里跟数据挖掘先不做区别
2)代价函数的定义
3)Train/Test/Validate
4) Overfitting的定义与避免方法
5、数据挖掘算法
数据挖掘发展到现在,算法已经非常多了,下面只需掌握最简单的,最核心的,最常用的算法;
1)最小二乘算法;
2)梯度下降;
3)向量化;
4)极大似然估计;
5)Logistic Regression
6) Decision Tree
7) RandomForesr
8) XGBoost
6、数据挖掘实战
通过机器学习里面最著名的库scikit-learn来进行模型的理解。
这还仅仅是开始,在通往数据挖掘师与数据科学家的道路上,我们还要学习文本处理与自然语言的知识、Linux与Spark的知识、深度学习的知识等等,我们要保持持续的兴趣来学习数据挖掘。

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:service@bkw.cn 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

|
投资分析考试百宝箱离考试时间45天
学习资料免费领取
免费领取全套备考资料
测一测是否符合报考条件
免费测试,不要错过机会
提交
互动交流

微信扫码关注公众号

获取更多考试热门资料

温馨提示

信息提交成功,稍后帮考专业顾问免费为您解答,请保持电话畅通!

我知道了~!
温馨提示

信息提交成功,稍后帮考专业顾问给您发送资料,请保持电话畅通!

我知道了~!

提示

信息提交成功,稍后班主任联系您发送资料,请保持电话畅通!