Pandas 基本介绍
作者: 莫烦 发布于: 2016-01-01
编辑: 学习资料:
Numpy 和 Pandas 有什么不同¶
如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。
要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。
Series¶
Series
的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1(N为长度)的整数型索引。
DataFrame¶
DataFrame
是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame
既有行索引也有列索引, 它可以被看做由Series
组成的大字典。
我们可以根据每一个不同的索引来挑选数据, 比如挑选 b
的元素:
DataFrame 的一些简单运用¶
我们在创建一组没有给定行标签和列标签的数据 df1
:
这样,他就会采取默认的从0开始 index. 还有一种生成 df
的方法, 如下 df2
:
这种方法能对每一列的数据进行特殊对待. 如果想要查看数据中的类型, 我们可以用 dtype
这个属性:
如果想看对列的序号:
同样, 每种数据的名称也能看到:
如果只想看所有df2
的值:
想知道数据的总结, 可以用 describe()
:
如果想翻转数据, transpose
:
如果想对数据的 index
进行排序并输出:
如果是对数据 值 排序输出: