Pyecharts人物关系图开发
1. Pyecharts版本说明
Pyecharts的版本最新版本为1.7.0版本,此版本跟0.5版本的使用方法不一样了。很多参数方法配置不一样了。Import的内容也不一样了。官方的例子主要是采用函数定义,方法采用链式传导操作方法,参数配置项也有变化。建议使用json或字典模式,时候前后台系统,更符合echart的开发思路,方便扩展。
2. 基础人物关系图开发说明
关系图参数设置有两种方法可以采用(函数参数和字典数据)。第一种方法利用python程序直接在代码中设置各种参数,如下例所示:
import jsonimport osfrom pyecharts import options as optsfrom pyecharts.charts import Graph, Pageimport webbrowsernodes = [ opts.GraphNode(name="结点1", symbol_size=10), opts.GraphNode(name="结点2", symbol_size=20), opts.GraphNode(name="结点3", symbol_size=30), opts.GraphNode(name="结点4", symbol_size=40), opts.GraphNode(name="结点5", symbol_size=50), ]links = [ opts.GraphLink(source="结点1", target="结点2",value=1,linestyle_opts=opts.LineStyleOpts(width=20)), opts.GraphLink(source="结点2", target="结点3",value=2), opts.GraphLink(source="结点3", target="结点4",value=3), opts.GraphLink(source="结点4", target="结点5",value=4), opts.GraphLink(source="结点5", target="结点1",value=5),]mygraph=Graph()mygraph.add("系列名称",nodes,links,repulsion=8000,edge_label=opts.LabelOpts( is_show=True, position="middle", formatter="{b} {c}"))mygraph.set_global_opts(title_opts=opts.TitleOpts(title="Graph-基本示例"))mygraph.render()webbrowser.open("render.html")
图 1 函数参数配置人物关系图
(1) 节点和链路
利用库options函数的方法定义节点和链路,里面有各种参数。这里重点说明
linestyle_opts=opts.LineStyleOpts(width=20))
在线段的参数设置中,利用options的子方法进行二级属性的设置。
(2) 图形添加属性
在利用graph()生成图形后,给图形添加节点、链路和图形的各种属性。
(3) 具体函数参数设置
函数的参数非常多,需要参考官方的函数说明
https://pyecharts.org/#/
3. 高级人物关系图开发说明
(1) 数据及参数来源
在官方的例子中,复杂数据后大量数据展示,采用的是读取json数据格式。在json数据中利用字典形式定义了各种属性和对应的值。这里需要注意的就是,参数如果有二级的子参数设置,在json中,也需要在字典的形式。坑是,在json中这种字典的一级key不是参数配置方法的名字,而是一个函数定义的缩写,大小写跟参数配置的还有区别,如下所示。在链路设置中,线型的属性设置用的是"lineStyle": {"width": 10} 这里的lineStyle是函数名字的缩写,函数名字是lineStyleopt,也没看到说明。只能自己分析了。推荐采用这种字典方式设置参数,这个方法类似于echart,方便后台数据与前台UI交换数据,方便后期扩展
(2) json数据
{ "categories": [ { "name": "类目0" }, { "name": "类目1" }, { "name": "类目2" }, { "name": "类目3" }, { "name": "类目4" }, { "name": "类目5" }, { "name": "类目6" }, { "name": "类目7" }, { "name": "类目8" } ], "nodes": [ { "id": "0", "name": "张零", "symbolSize": 10, "value": 28.685715, "label": { "normal": { "show": true } }, "category": 0 }, { "id": "1", "name": "张一", "symbolSize": 15, "value": 4, "label": { "normal": { "show": true } }, "category": 0 }, { "id": "2", "name": "张二二", "symbolSize": 20, "value": 9.485714, "label": { "normal": { "show": true } }, "category": 1 }, { "id": "3", "name": "张三三", "symbolSize": 25, "value": 9.485714, "label": { "normal": { "show": true } }, "category": 1 }, { "id": "4", "name": "CountessDeLo", "symbolSize": 30, "value": 4, "label": { "normal": { "show": true } }, "category": 0 }, { "id": "5", "name": "Geborand", "symbolSize": 35, "value": 4, "label": { "normal": { "show": true } }, "category": 0 }, { "id": "6", "name": "Champtercier", "symbolSize": 40, "value": 4, "label": { "normal": { "show": true } }, "category": 0 } ], "links": [ { "id": "0", "source": "1", "target": "0", "lineStyle":{"width": 20} }, { "id": "1", "source": "2", "target": "0", "lineStyle": {"width": 10} }, { "id": "2", "source": "3", "target": "0" }, { "id": "3", "source": "3", "target": "2" }, { "id": "4", "source": "4", "target": "0" }, { "id": "5", "source": "5", "target": "0" }, { "id": "6", "source": "6", "target": "0" } ]}
(3) 调用json代码
调用json方法,利用字典传递参数
import jsonimport osfrom pyecharts import options as optsfrom pyecharts.charts import Graph, Pageimport webbrowserdef graph_les_miserables(): with open("les-miserables.json", "r", encoding="utf-8") as f: j = json.load(f) nodes = j["nodes"] links = j["links"] categories = j["categories"] print(nodes) print(links) c = ( Graph(init_opts=opts.InitOpts(width="1000px", height="600px")) .add( "", nodes=nodes, links=links, categories=categories, layout="circular", #圆形 is_rotate_label=True, linestyle_opts=opts.LineStyleOpts(color="source", curve=0.3), label_opts=opts.LabelOpts(position="right"), ) .set_global_opts( title_opts=opts.TitleOpts(title="Graph-Les Miserables"), legend_opts=opts.LegendOpts( orient="vertical", pos_left="2%", pos_top="20%" ), ) ) return cmygraph=graph_les_miserables()mygraph.render()webbrowser.open("render.html")
图 2 json参数配置人物关系图
4. 红楼梦人物关系图
(1) 思路
数据源:
1 第一种方法,读取文本,截词分析,利用csv建立人物关系的矩阵图。
2 第二种方法,模拟矩阵人物关系矩阵。
数据读取
3 利用pandas读取矩阵数据
4 类似于json,利用pandas,把第一类转换为node,把行转换为link。
数据填充
5 利用字典形式填充人物关系图,利用字典数据配置各种参数。
6 生成人物关系图。
图 3 人物关系矩阵
(2) 代码
from pyecharts import options as optsfrom pyecharts.charts import Graph, Pageimport webbrowserimport randomimport pandas as pdimport jiebaimport jieba.posseg as pseg# 构建一个模拟数据集,矩阵形式#停用词stopwords = [line.strip() for line in open('baidu_stopwords.txt',encoding='UTF-8').readlines()]#数据来源一:读取小说f=open("红楼梦.txt","r",encoding="utf-8")jieba.load_userdict("红楼梦人名表.txt")#加载人物表names = {}# 保存人物,键为人物名称,值为该人物在全文中出现的次数relationships = {}#保存人物关系的有向边,键为有向边的起点,值为一个字典 edge ,edge 的键为有向边的终点,值是有向边的权值lineNames = []# 缓存变量,保存对每一段分词得到当前段中出现的人物名称for line in f.readlines(): poss = pseg.cut(line) # 分词,返回词性 lineNames.append([]) # 为本段增加一个人物列表 for w in poss: if w.flag != 'nr' or len(w.word) < 2 or w.word in stopwords: continue # 当分词长度小于2或该词词性不为nr(人名)时认为该词不为人名 lineNames[-1].append(w.word) # 为当前段的环境增加一个人物 if names.get(w.word) is None: # 如果某人物(w.word)不在人物字典中 names[w.word] = 0 relationships[w.word] = {} names[w.word] += 1f.close()# 对于 lineNames 中每一行,我们为该行中出现的所有人物两两相连。如果两个人物之间尚未有边建立,则将新建的边权值设为 1,# 否则将已存在的边的权值加 1。这种方法将产生很多的冗余边,这些冗余边将在最后处理。for line in lineNames: for name1 in line: for name2 in line: if name1 == name2: continue if relationships[name1].get(name2) is None: relationships[name1][name2] = 1 else: relationships[name1][name2] = relationships[name1][name2] + 1#构建人物关系矩阵#行row_name={}for key0,value0 in relationships.items(): for key1,value1 in value0.items(): if value1>100: #设置门限,关系10次以上的提取 #print(key0,key1,value1) row_name[key0]=row_name.get(key0,0)+1 row_name[key1]=row_name.get(key1,0)+1#row_nameprint(len(row_name))namepd0=pd.DataFrame()namepd0['name']=list(row_name.keys())print(namepd0.tail(10))#%%#列for i in row_name.keys(): col_name=i col_data=[ ] for j in row_name.keys(): if relationships[i].get(j)!=None and relationships[i].get(j)>100: col_data.append(relationships[i][j]) else: col_data.append(0) namepd0[col_name]=col_datanamepd0.to_csv("data.csv",index=False)namepd0##%%#第二种方案,模拟随机产生矩阵数据N=6x1=[]mypd0=pd.DataFrame()for i in range(0,N): x1.append("张三"+str(i))mypd0["name"]=x1for i in range(0,N): x2=[] for j in range(0,N): if i==j: x2.append(0) else: x2.append(random.randint(0,6)) mypd0[x1[i]]=x2mypd0.to_csv("data.csv",index=False)mypd0
#====================# 读取数据集mypd2 = pd.read_csv("data.csv")print(mypd2)print("**" * 10)# 构建关系图节点# 分类my_categories = [{"name": "类目0"}, { "name": "类目1" }, { "name": "类目2" }, { "name": "类目3" }, {"name": "类目4" }, {"name": "类目5" }, {"name": "类目6" }]# node数据name = list(mypd2['name']) # 节点名称mynode1 = []for i in range(0, mypd2.shape[0]): # 节点 mynode0 = { "id": str(i), "name": name[i], "symbolSize": 10, "value": 28.685715, "label": { "normal": { "show": "true"} }, "category": random.randint(0,7) #分类 } mynode1.append(mynode0)print(mynode1)# link数据mylink1 = []for i in range(0, mypd2.shape[0]): # 行 source_node = mypd2.iloc[i, 0] # 第一个数据为 人物姓名,做源节点 for j in range(1, mypd2.shape[1]): # 列 des_node = name[j - 1] # 目标人物姓名 w = mypd2.iloc[i, j] # 线的权重 # print(i,jsource_node,des_node,w) if w==0: continue mylink0 = { "id":str(i*(mypd2.shape[1]-1)+(j-1)), "source": str(i), "target": str(j-1), "lineStyle": {"width":1} # str(w/10*4) } mylink1.append(mylink0)print(mylink1)#构建图形函数def graph_les_miserables(nodes,links,categories): print("**"*20) print(nodes) print(links) c = ( Graph(init_opts=opts.InitOpts(width="1000px", height="600px")) .add( "", nodes=nodes, links=links, categories=categories, layout="circular", #圆形 is_rotate_label=True, linestyle_opts=opts.LineStyleOpts(color="source", curve=0.2), #公共线条属性 label_opts=opts.LabelOpts(position="right"), ) .set_global_opts( title_opts=opts.TitleOpts(title="人物关系图"), legend_opts=opts.LegendOpts( orient="vertical", pos_left="2%", pos_top="20%" ), ) ) return c#生成图形mygraph=graph_les_miserables(mynode1,mylink1,my_categories)mygraph.render()webbrowser.open("render.html")
图 4 红楼梦人物关系图
图 5 随机数人物关系图