百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

我用 Python 破解了微信聊天记录,自动同步微信文章

toyiye 2024-06-21 11:56 11 浏览 0 评论

本文转自:老胡的储物柜(公众号),已获得作者授权。

在我日常工作中,我会将各种互联网以及生活中产出的信息汇总到Bear,再通过Bear的云同步使我各个终端的信息保持一致。

以前在使用有道云笔记的时候,有个功能我很喜欢,就是当看到一篇想收藏的文章的话,就可以直接右上角发送到有道云笔记,如下图:

顺便一提:熊掌记是一款优雅、灵活的写作笔记应用。

回到正题,我现在面临的需求是能不能在看到喜欢的文章的时候,也通过类似于右上角分享一下就可以直接将文章同步到我各个终端上的Bear,最终成果如下:

解决方案

要实现上述的需求,我大概思考了如下的解决方案:

1) 准备一个微信号(这里直接称作小号)专门接收待收藏到Bear的文章

2) 编写一个服务监控小号的消息,比如收到推文类型的消息就进行内容提取

3) 监控服务将提取后的内容发送到Bear(这里要求服务运行在Mac OS上)

所以在继续之前,你需要有以下条件:

?基本的Python基础知识(写小脚本Python真的很方便)?一台装有Bear的Mac OS

方案调研

上面的解决方案看起来还是挺好实现,第一步不用多说,这年头谁没个小号,第二点的话,我印象中Python是有个第三方库可以直接监听微信对应账号的消息。

因为这些第三方库都是基于Web版的微信,所以在使用之前我想验证下此方案是否可行,刚准备登录网页版微信,就直接提示:

<error><ret>1203</ret><message>To protect your account, logging in to WeChat via the web has been suspended. Use WeChat for Windows or WeChat for Mac to log in on a computer. Download WeChat for Windows or Mac at http://wechat.com.</message></error>

果不其然现在微信准备加强Web版本的限制了,心里凉凉的,第二步还没开始就已经被宣判死刑。

只能换个思路了,怎么办。其实这一步走不通我还是能接受的,因为我一直觉得依赖Web版总有一天会挂掉,毕竟多了个依赖总是会增加复杂度。

能不能依靠客户端

我们知道,微信数据是有同步功能的,开发过客户端的都知道,这就意味着微信的数据必然保存一份在客户端本地系统上。

所以对于第二点的解决思路就转换成了如何获取微信保存在客户端本地的数据,找到某个软件的数据文件夹自然是很简单的事情,比如微信客户端的数据就存放在:

# howie6879是我的用户名,请自行替换/Users/howie6879/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9

具体有如下目录:

├── 988eebd1078a0d794bff2b6f5c8d5176├── Avatar├── CGI├── CrashReport├── KeyValue├── MMResourceMgr├── checkVersionFile├── d41d8cd93400b204e9800998ecf8427e├── f965739b566114f907dc394322e1e826├── topinfo.data├── upgradeHistoryFile├── whatsNewVersionFile└── wx.dat
8 directories, 5 files

不知道上面那三个32位的字符串大家看起来熟悉不熟悉:

一想到32,就是md5加密,我第一反应就是对于每个登录账号的id加密值,我们先不管,直接进去看更深一层的文件夹:

├── Account├── Avatar├── Contact├── Favorites├── FileStateSync├── FunctionMsg├── Group├── Message├── RevokeMsg├── Session├── Stickers├── Sync├── complexSearch├── mmexpt└── newabtest
15 directories, 0 files

Message出来了,这是不是我们想要的呢?再往下看里面的目录:

├── MessageTemp├── fts├── msg_0.db├── msg_0.db-backup├── msg_0.db-shm├── msg_0.db-wal├── msg_1.db

如果你登录过该台电脑并同步过信息,那么不出意外会有挺多*.db后缀的文件。大胆地猜测一下,这是不是我们想要的聊天数据存放路径呢?

不要管太多,先看看总不会错,一般本地存储的数据库,咱们程序员第一反应应该就是SQLite,要不要试试?

sqlite3 Message/msg_0.dbsqlite> .schemaError: file is not a databasesqlite>

??提示不是数据库,此时陷入了瓶颈,怎么就不是数据库了呢。反思一下,是不是打开的姿势不对。

会不会是加密了?依照这个思路,我了解到有一款基于SQLite的扩展数据库SQLCipher[1]SQLCipher是一个在SQLite基础之上进行扩展的开源数据库,它主要是在SQLite的基础之上增加了数据加密功能。

实践证明,我猜想的是对的,接下来主要做的怎么打开Message/msg_0.db这个文件并成功读取里面的数据。

最后我参考到一份有意思的问答,我就是参考这个问答[2]对数据库进行解密,这里我复述一下:

?打开微信,但是先不登录?打开终端,输入lldb -p $(pgrep WeChat)?会看到进入了lldb,然后输入br set -n sqlite3_key,按回车?在lldb中,输入c,按回车?打开微信并扫码登录?然后回到lldb中,输入memory read --size 1 --format x --count 32 $rsi

此时就会得到以下类似的输出:

0x600003888340: 0xd1 0x05 0x29 0x04 0x75 0xc5 0x45 0x050x600003888348: 0x92 0x26 0xa1 0x65 0x95 0xe5 0x15 0x3f0x600003888350: 0xf3 0xc7 0x43 0x85 0x05 0x35 0x45 0x3d0x600003888358: 0x84 0xc8 0x64 0xe5 0x35 0x65 0x45 0xe2

去掉冒号前面的那一串,后面是四行八列的数据,再去除掉0x空格\n等,就会得到一串64位的字符串,举个例子:

df012f587cc546000025a56599e81530f9cc49800329423d8ec460e1386549e2

这就是我们进入数据库的钥匙,接下来,请安装sqlcipher的相关软件,如:

brew install sqlcipherbrew cask install db-browser-for-sqlite

让我们用db-browser-for-sqlite打开db后缀的文件看看有什么不一样吧:

点击OK,成功打开!

随便进入一个表:

很显然,我们成功获取了本地的聊天记录,总算将第二步流程打通了,如今我们可以监控发送收藏文章的微信账户的聊天记录,只要收到此账号发来的推文消息,此时监控服务可以立马反应过来并解析发送到Bear。

有个小问题,怎么知道发推文的账号在哪个库哪个表呢?可以这样看,在电脑上登录发推文的账号,打开文件``:

cd /Users/howie6879/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9/988eebd1023a0d794bff2b6f5c8d5176/Accountcat userinfo.data

大概输出如下:

":BHPpx127417592694754732wxid_epXXXXXXXfj12 Howie6879老胡的储物柜

这里很明显我的wxid就是:wxid_epXXXXXXXfj12,那么对应需要监控的表名就是:Chat_md5(wxid_epXXXXXXXfj12),形式如同这样

Chat_f965739xxxx114fxxxxc394322exxxx

随后实现在库里面找到对应的表即可,我本机发现对应账户的表存在于库 msg_5.db中。

接下来要做的事情就很简单了,就是将提取后的内容发送到Bear,这里可以利用X callback url Scheme documentation[3],比如你在终端输入:

open 'bear://x-callback-url/create?title=Test%20Bear&text=Hello%20Bear'

立马就可以看到Bear自动建立了一篇笔记

编码实现

终于到了编码阶段,好心酸:

第一步,拿到必须要的常量:

?S_ACCOUNT_ID:微信发送账户ID,可以在Account/userinfo.data下查看?R_ACCOUNT_ID:微信接收账户ID,同上?RAW_KEY:解密Key,就是上面介绍的64位字符串?DB_PATH_TEM:定义的是消息DB路径,比如:"/Users/howie6879/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9/{0}/Message/"

定义这四个常量,接下来的事情就一帆风顺了哈,我将项目开源在Github,地址见w2b[4],接下来我直接说说怎么用:

git clone https://github.com/howie6879/w2bcd w2b# 推荐使用pipenv 你也可以使用自己中意的环境构建方式pipenv install --python=/Users/howie6879/anaconda3/envs/python36/bin/python3.6 --skip-lock# 运行前需要填好配置文件pipenv run python w2b/run.py

随后,会有日志输出:

[w2b] pipenv run python w2b/run.py Loading .env environment variables…[2019:09:13 09:16:35] INFO w2b 目标表 Chat_f965739b676114fxxxxc394322e1e826 存在于库 msg_5.db

好,代码跑起来后,接下来电脑上登录你的小号(也就是接收微信文章的微信号),然后在手机上登录发送文章的微信号,最终成功就和文章一开始的动图一样了~

如果觉得对你有帮助,点个好看然后帮忙转发一下吧。

References

[1]SQLCipher:[https://github.com/sqlcipher/sqlcipher](https://github.com/sqlcipher/sqlcipher

[2]问答:https://www.v2ex.com/t/466053#reply15

[3]X callback url Scheme documentation:https://bear.app/faq/X-callback-url%20Scheme%20documentation/

[4]w2b:https://github.com/howie6879/w2b

末送书活动

活动规则大家请一定要查看,点击这篇推文哦:从今天起,每天至少送大家一本书

这篇推文的福利赠书是:《Python 数据科学入门》,送给本篇文章点赞最多、且符合活动要求的精选留言者。

回复下方「关键词」,获取优质资源

回复关键词「 pybook03」,立即获取主页君与小伙伴一起翻译的《Think Python 2e》电子版

回复关键词「入门资料」,立即获取主页君整理的 10 本 Python 入门书的电子版

回复关键词「book 数字」,将数字替换成 0 及以上数字,有惊喜好礼哦~

题图:pexels,CC0 授权。

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码