月归档

一月, 2019 发表的所有文章

数据分箱技术Binning 数据科学

数据分箱技术Binning

数据分箱技术Binning 数据分箱就是按照某种规则将数据进行分类。就像可以将水果按照大小进行分类,售卖不同的价格一样。 对Series进行分箱 创建一个整形随机的series,表示学生的成绩: [c···
数据采集:如何自动化采集数据? 数据科学

数据采集:如何自动化采集数据?

上一节中我们讲了如何对用户画像建模,而建模之前我们都要进行数据采集。数据采集是数据挖掘的基础,没有数据,挖掘也没有意义。很多时候,我们拥有多少数据源,多少数据量,以及数据质量如何,将决定我们挖掘产出的···
用户画像:标签化就是数据的抽象能力 数据科学

用户画像:标签化就是数据的抽象能力

王兴说过,我们已经进入到互联网的下半场。在上半场,也就是早期的互联网时代,你永远不知道在对面坐的是什么样的人。那个年代大部分人还是QQ的早期用户。在下半场,互联网公司已经不新鲜了,大部分公司已经互联网···
时间序列的操作 数据科学

时间序列的操作

时间序列的操作 一、时间序列基础 [crayon-5df5318c47ad3540203120/] 访问数组的方法: 位置index、datatime对象访问、月份、年份 产生一定范围内的时间数据 p···
学数据分析要掌握哪些基本概念? 数据科学

学数据分析要掌握哪些基本概念?

美国明尼苏达州一家Target百货被客户投诉,这名客户指控Target将婴儿产品优惠券寄给他的女儿,而他女儿还是一名高中生。但没多久这名客户就来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。 Targ···
Python科学计算:Pandas 数据科学

Python科学计算:Pandas

今天我来给你介绍Python的另一个工具Pandas。 在数据分析工作中,Pandas的使用频率是很高的,一方面是因为Pandas提供的基础数据结构DataFrame与json的契合度很高,转换起来就···
Python基础语法:开始你的Python之旅 数据科学

Python基础语法:开始你的Python之旅

Python基础语法:开始你的Python之旅 上一节课我跟你分享了数据挖掘的最佳学习路径,相信你对接下来的学习已经心中有数了。今天我们继续预习课,我会用三篇文章,分别对Python的基础语法、Num···