Pandas 基本介绍 - Numpy & Pandas 数据处理 | 莫烦Python
切换视频源:

Pandas 基本介绍

作者: 张能波 编辑: 莫烦 2016-11-03

学习资料:

Numpy 和 Pandas 有什么不同

如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。

要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。

Series

Series的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1(N为长度)的整数型索引。

DataFrame

DataFrame是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame既有行索引也有列索引, 它可以被看做由Series组成的大字典。

我们可以根据每一个不同的索引来挑选数据, 比如挑选 b 的元素:

DataFrame 的一些简单运用

我们在创建一组没有给定行标签和列标签的数据 df1:

这样,他就会采取默认的从0开始 index. 还有一种生成 df 的方法, 如下 df2:

这种方法能对每一列的数据进行特殊对待. 如果想要查看数据中的类型, 我们可以用 dtype 这个属性:

如果想看对列的序号:

同样, 每种数据的名称也能看到:

如果只想看所有df2的值:

想知道数据的总结, 可以用 describe():

如果想翻转数据, transpose:

如果想对数据的 index 进行排序并输出:

如果是对数据 值 排序输出:


降低知识传递的门槛

莫烦很常从互联网上学习知识,开源分享的人是我学习的榜样。 他们的行为也改变了我对教育的态度: 降低知识传递的门槛免费 奉献我的所学正是受这种态度的影响。 通过 【赞助莫烦】 能让我感到认同,我也更有理由坚持下去。