博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas DataFrame(1)
阅读量:7110 次
发布时间:2019-06-28

本文共 615 字,大约阅读时间需要 2 分钟。

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列.

但是,使用pandas DataFrame可以解决这一问题. pandas DataFrame也是二维数据,和pandas Series一样, pandas DataFrame也有'索引'这个概念,它每一列都有一个索引值:

import pandas as pddf = pd.DataFrame({
'A': [0, 1, 2], 'B': [3, 4, 5]})print df# 结果: A B0 0 31 1 42 2 5

其中 'A','B' 是索引值,  [0,1,2] ,  [3,4,5] 是索引对应的数据,也就是列

 

默认情况下,调用方法是在列上调用:

print df.sum()# 结果:A     3B    12 dtype: int64

返回一个pandas Series

 

如果需要在行上调用方法,可以设置 axis :

print df.sum(axis=1)# 结果:0    31    52    7 dtype: int64

 

如果需要在整个DataFrame上调用方法,可以使用.values

print df.values.sum()# 结果:15

 

转载地址:http://rqlhl.baihongyu.com/

你可能感兴趣的文章
c#构造函数
查看>>
git push 403
查看>>
Proximal Algorithms 7 Examples and Applications
查看>>
QTP的那些事--增删改查中的增加操作的测试用例及其脚本设计思路
查看>>
IntelliJ IDEA创建maven web项目
查看>>
马云“私聊”奥巴马 全程保密有何玄机?
查看>>
python numpy笔记:给matlab使用者
查看>>
Java常用文件操作-1
查看>>
解决Django中通过主键像外键所在的表中添加内容
查看>>
gsoap 学习 1-如何使用
查看>>
世界五百强世硕科技工作经历——03
查看>>
钢条切割问题带你彻底理解动态规划
查看>>
Amazon S3 功能介绍
查看>>
vue传变量给组件
查看>>
POJ 3273
查看>>
Tp控制器
查看>>
JQuery 操作select
查看>>
一个有趣的Ajax Hack示范
查看>>
ASP.NET真假分页—真分页
查看>>
解决Android编译时出现aapt.exe finished with non-zero exit value 1(第二篇)
查看>>