Python数据分析笔记#6.2.3 Pandas-索引和选取
toyiye 2024-09-14 13:36 3 浏览 0 评论
「目录」
- 6.1 => Pandas的数据结构
- 6.2 => Pandas的基本功能
--------> reindex重新索引
--------> drop丢弃数据
--------> 索引和选取
- 6.3 => 数学和统计方法
在pandas中有多个方法可以索引,选取和组合数据,下面我们来看看吧!
索引
对于Series
Series索引的方式和Numpy数组的类似:
In [3]: obj = pd.Series(np.arange(4.), index = ['a', 'b', 'c', 'd'])
In [4]: obj
Out[4]:
a 0.0
b 1.0
c 2.0
d 3.0
dtype: float64
In [5]: obj[1]
Out[5]: 1.0
In [6]: obj[2:4]
Out[6]:
c 2.0
d 3.0
dtype: float64
只不过Series允许的索引值不只是整数:
In [7]: obj['a']
Out[7]: 0.0
In [8]: obj[['b', 'a', 'd']]
Out[8]:
b 1.0
a 0.0
d 3.0
dtype: float64
In [9]: obj[[1, 3]]
Out[9]:
b 1.0
d 3.0
dtype: float64
In [10]: obj[obj < 2]
Out[10]:
a 0.0
b 1.0
dtype: float64
还记得python的切片吗?pandas里的切片运算也与普通的python切片运算不同,python的切片不包含最后一个,而pandas是包含的。
In [11]: obj['b':'c']
Out[11]:
b 1.0
c 2.0
dtype: float64
通过索引和切片可以设置Series的相应部分:
In [12]: obj['a'] = 5
In [13]: obj['b':'c'] = 6
In [14]: obj
Out[14]:
a 5.0
b 6.0
c 6.0
d 3.0
dtype: float64
对于DataFrame
我们再来看对DataFrame的索引,先创建一个DataFrame:
In [15]: data = pd.DataFrame(np.arange(16).reshape((4, 4)), index=['Beijing', 'Shanghai', 'Tokyo', 'New York'], columns=['one', 'two', 'three', 'four'])
In [16]: data
Out[16]:
one two three four
Beijing 0 1 2 3
Shanghai 4 5 6 7
Tokyo 8 9 10 11
New York 12 13 14 15
用一个值或序列对DataFrame进行索引会获取一个或多个列:
In [17]: data['two']
Out[17]:
Beijing 1
Shanghai 5
Tokyo 9
New York 13
Name: two, dtype: int32
In [18]: data[['three', 'one']]
Out[18]:
three one
Beijing 2 0
Shanghai 6 4
Tokyo 10 8
New York 14 12
通过切片可以选取DataFrame的行:
In [19]: data[:2]
Out[19]:
one two three four
Beijing 0 1 2 3
Shanghai 4 5 6 7
我们还可以通过布尔型DataFrame设置条件来选取,比如我们要找所有小于5的元素:
In [20]: data < 5
Out[20]:
one two three four
Beijing True True True True
Shanghai True False False False
Tokyo False False False False
New York False False False False
我们可以看到所有满足条件的元素都是True,不满足的则是False。
现在将这个布尔型DataFrame当作索引传入,将所有对应为True的位置的元素改为0:
In [21]: data[data < 5] = 0
In [22]: data
Out[22]:
one two three four
Beijing 0 0 0 0
Shanghai 0 5 6 7
Tokyo 8 9 10 11
New York 12 13 14 15
用loc和iloc进行选取
对于DataFrame,pandas的作者引入了特殊的标签运算符loc和iloc,可以让我们用类似Numpy的方式从DataFrame选择行和列的子集。
loc和iloc的不同在于iloc是整数索引,而loc是轴标签索引。
通过loc使用标签来选取一行和多列:
In [23]: data.loc['Shanghai', ['two', 'three']]
Out[23]:
two 5
three 6
Name: Shanghai, dtype: int32
loc函数可以传入一个标签或多个标签的切片:
In [27]: data.loc[:'Beijing', 'two']
Out[27]:
Beijing 0
Name: two, dtype: int32
通过iloc使用整数进行选取:
In [24]: data.iloc[2, [3, 0, 1]]
Out[24]:
four 11
one 8
two 9
Name: Tokyo, dtype: int32
In [25]: data.iloc[2]
Out[25]:
one 8
two 9
three 10
four 11
Name: Tokyo, dtype: int32
In [26]: data.iloc[[1, 2], [3, 0, 1]]
Out[26]:
four one two
Shanghai 7 0 5
Tokyo 11 8 9
iloc函数也可以传入整数的切片:
In [28]: data.iloc[:, :3]
Out[28]:
one two three
Beijing 0 0 0
Shanghai 0 5 6
Tokyo 8 9 10
New York 12 13 14
at和iat
df.at,df.iat和loc,iloc相似,只不过df.at和df.iat通过行和列的标签(整数)选取单一的值:
In [29]: data.at['New York', 'three']
Out[29]: 14
In [30]: data.iat[3, 2]
Out[30]: 14
但同样的事loc和iloc也能做啊,所以这俩不常用吧。
相关推荐
- 为何越来越多的编程语言使用JSON(为什么编程)
-
JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...
- 何时在数据库中使用 JSON(数据库用json格式存储)
-
在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...
- MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)
-
前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...
- JSON对象花样进阶(json格式对象)
-
一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...
- 深入理解 JSON 和 Form-data(json和formdata提交区别)
-
在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...
- JSON 语法(json 语法 priority)
-
JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...
- JSON语法详解(json的语法规则)
-
JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...
- MySQL JSON数据类型操作(mysql的json)
-
概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...
- JSON的数据模式(json数据格式示例)
-
像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...
- 前端学习——JSON格式详解(后端json格式)
-
JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...
- 什么是 JSON:详解 JSON 及其优势(什么叫json)
-
现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...
- PostgreSQL JSON 类型:处理结构化数据
-
PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...
- JavaScript:JSON、三种包装类(javascript 包)
-
JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...
- Python数据分析 只要1分钟 教你玩转JSON 全程干货
-
Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...
- 比较一下JSON与XML两种数据格式?(json和xml哪个好)
-
JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- r语言矩阵 (127)
- browsererror (114)
- exportexcel (119)
- cv2.bitwise_not (137)
- dump命令 (128)
- es6concat (126)
- heapify (127)
- java.security.egd (130)
- javax.annotation (117)
- jsstringsplit (117)
- js数字 (115)
- maven编译 (132)
- mysqlleft (128)
- nodejsbuffer (149)
- org.apache.commons.httpclient (126)
- org.jsoup (141)
- org.springframework.web (128)
- robotframework-ride (115)
- setnocounton (141)
- socket.gethostbyname (122)
- sqlmid (121)
- time.strptime (133)
- vscode格式化 (125)
- win32con (129)
- window.localstorage (126)