百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

Python数据分析笔记#6.2.3 Pandas-索引和选取

toyiye 2024-09-14 13:36 3 浏览 0 评论



「目录」

  • 6.1 => Pandas的数据结构
  • 6.2 => Pandas的基本功能

--------> reindex重新索引

--------> drop丢弃数据

--------> 索引和选取

  • 6.3 => 数学和统计方法

在pandas中有多个方法可以索引,选取和组合数据,下面我们来看看吧!

索引

对于Series

Series索引的方式和Numpy数组的类似:

In [3]: obj = pd.Series(np.arange(4.), index = ['a', 'b', 'c', 'd'])

In [4]: obj
Out[4]:
a    0.0
b    1.0
c    2.0
d    3.0
dtype: float64

In [5]: obj[1]
Out[5]: 1.0

In [6]: obj[2:4]
Out[6]:
c    2.0
d    3.0
dtype: float64

只不过Series允许的索引值不只是整数

In [7]: obj['a']
Out[7]: 0.0

In [8]: obj[['b', 'a', 'd']]
Out[8]:
b    1.0
a    0.0
d    3.0
dtype: float64

In [9]: obj[[1, 3]]
Out[9]:
b    1.0
d    3.0
dtype: float64

In [10]: obj[obj < 2]
Out[10]:
a    0.0
b    1.0
dtype: float64

还记得python的切片吗?pandas里的切片运算也与普通的python切片运算不同,python的切片不包含最后一个,而pandas是包含的

In [11]: obj['b':'c']
Out[11]:
b    1.0
c    2.0
dtype: float64

通过索引和切片可以设置Series的相应部分:

In [12]: obj['a'] = 5

In [13]: obj['b':'c'] = 6

In [14]: obj
Out[14]:
a    5.0
b    6.0
c    6.0
d    3.0
dtype: float64


对于DataFrame

我们再来看对DataFrame的索引,先创建一个DataFrame:

In [15]: data = pd.DataFrame(np.arange(16).reshape((4, 4)), index=['Beijing', 'Shanghai', 'Tokyo', 'New York'], columns=['one', 'two', 'three', 'four'])

In [16]: data
Out[16]:
          one  two  three  four
Beijing     0    1      2     3
Shanghai    4    5      6     7
Tokyo       8    9     10    11
New York   12   13     14    15

一个值或序列对DataFrame进行索引会获取一个或多个列

In [17]: data['two']
Out[17]:
Beijing      1
Shanghai     5
Tokyo        9
New York    13
Name: two, dtype: int32

In [18]: data[['three', 'one']]
Out[18]:
          three  one
Beijing       2    0
Shanghai      6    4
Tokyo        10    8
New York     14   12

通过切片可以选取DataFrame的行

In [19]: data[:2]
Out[19]:
          one  two  three  four
Beijing     0    1      2     3
Shanghai    4    5      6     7

我们还可以通过布尔型DataFrame设置条件来选取,比如我们要找所有小于5的元素:

In [20]: data < 5
Out[20]:
            one    two  three   four
Beijing    True   True   True   True
Shanghai   True  False  False  False
Tokyo     False  False  False  False
New York  False  False  False  False

我们可以看到所有满足条件的元素都是True,不满足的则是False。

现在将这个布尔型DataFrame当作索引传入,将所有对应为True的位置的元素改为0:

In [21]: data[data < 5] = 0

In [22]: data
Out[22]:
          one  two  three  four
Beijing     0    0      0     0
Shanghai    0    5      6     7
Tokyo       8    9     10    11
New York   12   13     14    15


用loc和iloc进行选取

对于DataFrame,pandas的作者引入了特殊的标签运算符loc和iloc,可以让我们用类似Numpy的方式从DataFrame选择行和列的子集。

loc和iloc的不同在于iloc是整数索引,而loc是轴标签索引

通过loc使用标签来选取一行和多列:

In [23]: data.loc['Shanghai', ['two', 'three']]
Out[23]:
two      5
three    6
Name: Shanghai, dtype: int32

loc函数可以传入一个标签或多个标签的切片

In [27]: data.loc[:'Beijing', 'two']
Out[27]:
Beijing    0
Name: two, dtype: int32

通过iloc使用整数进行选取:

In [24]: data.iloc[2, [3, 0, 1]]
Out[24]:
four    11
one      8
two      9
Name: Tokyo, dtype: int32

In [25]: data.iloc[2]
Out[25]:
one       8
two       9
three    10
four     11
Name: Tokyo, dtype: int32

In [26]: data.iloc[[1, 2], [3, 0, 1]]
Out[26]:
          four  one  two
Shanghai     7    0    5
Tokyo       11    8    9

iloc函数也可以传入整数的切片:

In [28]: data.iloc[:, :3]
Out[28]:
              one  two  three
Beijing        0    0      0
Shanghai    0    5      6
Tokyo         8    9     10
New York   12   13     14


at和iat

df.at,df.iat和loc,iloc相似,只不过df.at和df.iat通过行和列的标签(整数)选取单一的值

In [29]: data.at['New York', 'three']
Out[29]: 14

In [30]: data.iat[3, 2]
Out[30]: 14

但同样的事loc和iloc也能做啊,所以这俩不常用吧。


相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码