百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

闲鱼上哪些商品抢手?Python 分析后告诉你

toyiye 2024-07-08 23:01 9 浏览 0 评论

转载:【Airpython】

https://mp.weixin.qq.com/s?__biz=MzU1OTI0NjI1NQ==&mid=2247484313&idx=1&sn=2006aeb9ce1e687625aaf3626d4ee630&chksm=fc1b7d59cb6cf44fe3463e56ee696c5ecc98929b08413a08eceb2fe5985139cd204e67a68fbe&mpshare=1&

准 备 工 作

在编写代码之前,需要做如下准备工作:

1、配置好 Android ADB 开发环境

2、Python 虚拟环境内安装 pocoui 依赖库

3、安装数据可视化依赖库 pyecharts

# pocoui
pip3 install pocoui
?
# 数据可视化图表
pip3 install pyecharts -U

编 写 代 码

我们分 7 个步骤来实现这个功能,分别是:打开目标应用客户端、检索关键字到商品列表界面、计算最佳滑动距离、筛选商品、获取商品链接地址、写入文件排序并统计商品、配置参数。

第 1 步,使用 pocoui 自动化打开目标应用。

def __pre(self):
 """
 准备工作
 :return:
 """
 home()
 stop_app(package_name)
 start_my_app(package_name, activity)
?
?
 # 等待到达桌面
 self.poco(text='闲鱼').wait_for_appearance()
 self.poco(text='鱼塘').wait_for_appearance()
 self.poco(text='消息').wait_for_appearance()
 self.poco(text='我的').wait_for_appearance()
?
 print('进入闲鱼主界面')

进入到闲鱼首页之后,应用端会拿到剪切板的数据,当存在特定规律的口令的时,会立马弹出一个对话框,因此需要模拟关闭对话框的操作。

# 如果指定时间内内有淘口令,就关闭
for i in range(10, -1, -1):
 close_element = self.poco('com.taobao.idlefish:id/ivClose')
 if close_element.exists():
 close_element.click()
 break
 time.sleep(1)

打开应用之后,就可以进行第 2 步操作了。

通过要检索的关键字,模拟输入到输入框内,然后点击搜索按钮,一直等待搜过列表出现为止。

另外,为了更加方便地处理数据,商品列表切换到列表模式,即一行只显示一个商品。

def __input_key_word(self):
 """
 输入关键字
 :return:
 """
 # 进入搜索界面
 perform_click(self.poco('com.taobao.idlefish:id/bar_tx'))
?
 # 搜索框内输入文本
 self.poco('com.taobao.idlefish:id/search_term').set_text(self.good_msg)
?
 # 点击搜索按钮
 while True:
 # 等待检索结果列表出现
 if not self.poco('com.taobao.idlefish:id/list_recyclerview').exists():
 perform_click(self.poco('com.taobao.idlefish:id/search_button', text='搜索'))
 else:
 break
?
 # 等待商品列表完全出现
 self.poco('com.taobao.idlefish:id/list_recyclerview').wait_for_appearance()
?
 # 切换到列表
 perform_click(self.poco('com.taobao.idlefish:id/switch_search'))

第 3 步,计算最佳滑动距离。

为了保证爬取数据的高效性,获取计算出每次滑动的最佳距离。

首先先拿到当前界面的 UI 控件树,然后通过控件的属性 ID 拿到商品的坐标,进而得到每一项商品的高度。

最后,通过观察屏幕中出现商品的数目得到最佳滑动距离。

def __get_good_swipe_distance(self):
 """
 获取每次滑动,最合适的距离
 :return:
 """
 element = Element()
 # 保存当前的UI树到本地
 element.get_current_ui_tree()
?
 # 第一个商品Item的坐标
 position_item = element.find_elment_position_by_id_and_index("com.taobao.idlefish:id/card_root",
 "1")
 # 商品的高度
 item_height = position_item[1][1] - position_item[0][1]
?
 # 通过观察,当前屏幕有3件商品
 return item_height * 3

第 4 步,筛选商品。

上面的步骤拿到最佳的滑动距离,不停的滑动页面遍历列表元素的子 Item。

需要注意的是,为了避免滑动惯性导致的误差,每一次的滑动时长最好设置为 2s 以上。

通过商品 Item 筛选出想要数目大于预设数字的商品。

# 多少人想要
want_element_parent = item.offspring('com.taobao.idlefish:id/search_item_flowlayout')
?
if want_element_parent.exists():
 # 想要数/已付款数目
 want_element = want_element_parent.children()[0]
?
 want_content = want_element.get_text()
?
 # 过滤掉【已付款】等其他商品,只保留个人发布商品
 if '人想要' not in want_content:
 continue
?
 # 拿到商品想要的具体数目,代表商品热度
 want_num = get_num(want_content)
?
 if int(want_num) < self.num_assign:
 # print('不达标,过滤掉')
 pass
 else:
 # 商品想要数达标,加入统计

第 5 步,获取商品链接地址。

对于上一步满足条件的商品,点击商品 Item 进入到商品详情页面。

接着点击右上角的分享按钮,会立即弹出分享对话框。

然后点击口令控件,会提示口令复制到系统剪切板成功。

# 点击更多
while True:
 if self.poco('com.taobao.idlefish:id/ftShareName').exists():
 break
 print('点击更多~')
 perform_click(self.poco(text='更多'))
?
# 点击复制淘口令
perform_click(self.poco('com.taobao.idlefish:id/ftShareName', text='淘口令'))
?
# 拿到口令码
taobao_code_element = self.poco('com.taobao.idlefish:id/tvWarnDetail')
?
taobao_code = taobao_code_element.get_text() 
?

第 6 步,写入商品、排序并统计数据。

将上面获取到的商品标题、想要数、分享地址写入到 CSV 文件中。

然后读取数据文件,通过对表格中的第二列进行反向排序,使商品按照想要数进行降序排列。

def __sort_result(self):
 """
 对爬取的结果进行排序
 :return:
 """
 reader = csv.reader(open(self.file_path), delimiter=",")
 # 头部标题
 head_title = next(reader)
 # 按照第二列进行逆序排列
 sortedlist = sorted(reader, key=lambda x: (int(x[1])), reverse=True)
 # 写入头部数据
 write_to_csv(self.file_path, [(head_title[0], head_title[1], head_title[2])], False)
 for value in sortedlist:
 write_to_csv(self.file_path, [(value[0], value[1], value[2])], False)
 return sortedlist

最后拿到前 10 项数据,利用 pyecharts 生成统计图表。

def draw_image(self, sortedlist):
 """
 画图
 :param sortedlist:
 :return:
 """
?
 # 标题列表
 titles = []
?
 # 销量
 sales_num = []
?
 # 拿到爬取结果的标题、销量两个列表
 with open(self.file_path, 'r') as csvfile:
 # 读取文件
 reader = csv.DictReader(csvfile)
?
 # 加入列表中
 for row in reader:
 titles.append(row['title'])
 sales_num.append(row['num'])
?
 # 数目限制
 if len(titles) > self.num:
 titles = titles[:self.num]
 sales_num = sales_num[:self.num]
?
 # 画图
 bar = (
 Bar()
 .add_xaxis(titles)
 .add_yaxis("哪些好卖", sales_num)
 .set_global_opts(title_opts=opts.TitleOpts(title="我要卖货"))
 )
 bar.render('%s.html' % self.good_msg)

第 7 步,配置参数。

编写 yaml 文件,指定要爬取商品的关键字、爬取时间、想要数考核指标数、筛选商品数目。

goods:
 # 搜索商品1,包含搜索关键字、爬取时间
 good1:
 key_word: '资料' # 搜索关键字
 key_num: 100 # 筛选【想要数】的临界点
 num: 10 # 只筛选爆款
 time: 600 # 爬取时间(秒)

结 果 结 论

提前配置好商品关键字、爬取时间等参数,即可以爬取到符合要求的、最好卖的商品数据,最终以图表的方式展示出来。

..

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码