报表的自动化探索(报表自动化工具)
toyiye 2024-09-14 13:40 3 浏览 0 评论
“ 引言 ”
报表是日常工作中主要的一项,报表自动化是提升工作效率的一种重要方式。随着共享文档的出现与普及,大大简化了报表的收集汇总这一繁琐的过程。但是在一些对保密要求较高的场景,往往不方便使用共享文档,因此大多还停留在手动汇总的阶段。本文旨在通过使用 Python ,为这些场景提供一些报表自动化的尝试与可能性。
难度:????
小工具系列文章:
一、excel 表格的自动化汇总
在日常报表中,excel 的表格汇总是较常出现且繁琐的场景。如图所示,我们这边尝试实现多个文件的汇总与分 Sheet 保存。
1、思路
① 读取每个文件的数据
② 每个文件写入到汇总表的分页,将分页修改成各个文件名
③ 将所有文件的数据合并,存放至汇总页
2、相关依赖库安装与导入
1) openpyxl
① 安装:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl
② 导入:
from openpyxl import load_workbook
2) pandas
① 安装
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas
② 导入:
import pandas as pd
3、准备报表模板
定好报表模板,汇总 Sheet 命名为汇总。
4、实现方案
1、使用 openpyxl 实现
1)读取所有 excel 文件名
# 获取excel文件夹内所有文件名
def find_excel(excel_dir_path):
excel_names = [] # 存放excel名字
filenames = os.listdir(excel_dir_path)
for filename in filenames:
if filename.find('xls') != -1:
excel_names.append(filename)
print(f'excel文件名:{excel_names}')
return excel_names
运行结果:
excel文件名:['东莞.xlsx', '广州.xlsx', '深圳.xlsx']
2)提取所有excel文件内容,暂存到list并返回
def get_excel_data(excel_names, excel_dir_path):
print('正在提取,请稍后')
file_count = 0
all_excel_data = [] # 存放所有文件的数据
for excel_name in excel_names:
# 判断文件是否存在
excel_path = excel_dir_path + '\\' + excel_name
if os.path.exists(excel_path) is False:
print(excel_path + ' 文件不存在,请重试')
continue
file_count += 1
data = load_workbook(excel_path) # 打开excel文件
sheet = data['Sheet1'] # 打开sheet
start_row = 1 # 从第二行开始(第一行为表头)
excel_data = [] # 存放单个文件的数据
for i in range(1, sheet.max_row + 1)[start_row:]:
row_data = [] # 存放单行文件的数据
for j in range(1, sheet.max_column + 1):
row_data.append(sheet.cell(i, j).value)
excel_data.append(row_data)
all_excel_data.append(excel_data)
print('提取完成')
print(f'总文件数:{file_count}')
print(f'总数据量:{len(all_excel_data)}条')
return all_excel_data
运行结果:
正在提取,请稍后
提取完成
总文件数:3
总数据量:3条
3)追加到汇总表,同时分 Sheet
def summary_data(summary_file_path, excel_names, all_excel_data):
if os.path.exists(summary_file_path) is False:
print(f'{summary_file_path} 文件不存在,请重试')
exit()
summary_file = load_workbook(summary_file_path)
summary_sheet = summary_file['汇总']
table_name = [] # 存放表头
# 获取汇总页表头
for t in range(1, summary_sheet.max_column + 1):
table_name.append(summary_sheet.cell(1, t).value)
# 将数据同时保存至汇总Sheet和各分Sheet
for num, e in enumerate(all_excel_data):
# 新建分Sheet,文件名去掉后缀
sep_sheet = summary_file.create_sheet(excel_names[num].split('.')[0], 0)
sep_sheet.append(table_name) # 填充表头
for row in e:
summary_sheet.append(row)
sep_sheet.append(row)
summary_file.save(summary_file_path)
2、使用 Pandas 实现
在制作报表时如需对数据进行二次加工,使用 Pandas 会更方便,下面提供 Pandas 实现方案。
excel_dir_path = './excel_file'
summary_file_path = '汇总表.xlsx'
# 读取所有文件名
excel_names = find_excel(excel_dir_path)
# pd.ExcelWriter 可使用 engine="xlsxwriter"或"openpyxl" 实现excel读写功能
summary_file = pd.ExcelWriter(summary_file_path)
df_summary = pd.DataFrame() # 存放所有数据
for excel_name in excel_names:
# 判断文件是否存在
excel_path = excel_dir_path + '\\' + excel_name
if os.path.exists(excel_path) is False:
print(excel_path + ' 文件不存在,请重试')
continue
df_sep = pd.read_excel(excel_path) # 读取每个excel数据
# 保存分页
df_sep.to_excel(summary_file,
sheet_name=excel_name.split('.')[0],
index=False,
encoding="gbk")
# 将分页内容合并到汇总的 Dataframe
df_summary = pd.concat([df_summary, df_sep], axis=0)
# 汇总页重建索引
df_summary.reset_index(drop=True, inplace=True)
# 保存汇总页
df_summary.to_excel(summary_file,
sheet_name="汇总",
index=False,
encoding="gbk")
summary_file.save() # 汇总表保存
五、实现效果
二、PPT 与 Excel 的自动化整理
在日常报表中,也经常会遇到将 excel 的表格数据整理 PPT 报表中的场景。如图所示,我们这边尝试 PPT 报表数据的更新和周环比的计算。
1、python-pptx 库的安装与导入
① 安装:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-pptx
② 导入:
from pptx import Presentation
from pptx.enum.shapes import MSO_SHAPE_TYPE
from pptx.util import Pt
from pptx.enum.text import PP_ALIGN
from openpyxl import load_workbook
2、代码
1)获取 excel 数据
def get_excel_data(excel_path):
excel_data = [] # 存放所有文件的数据
data = load_workbook(excel_path) # 打开excel文件
sheet = data['Sheet1'] # 打开sheet
start_row = 1 # 从第二行开始(第一行为表头)
for i in range(1, sheet.max_row + 1)[start_row:]:
row_data = [] # 存放单行文件的数据
for j in range(1, sheet.max_column + 1):
row_data.append(sheet.cell(i, j).value)
excel_data.append(row_data)
return excel_data
2)主程序
ppt_path = '报表.pptx'
# 打开ppt文件
prs = Presentation(ppt_path)
# 获取excel数据
excel_data = get_excel_data('报表数据.xlsx')
# slides_num为第几页ppt,slice为该页ppt的内容
for slides_num, slice in enumerate(prs.slides):
for shape in slice.shapes:
if shape.shape_type == MSO_SHAPE_TYPE.TABLE: # 判断元素是否为表格
_table = shape.table
rows = len(_table.rows) # 获取行数
cols = len(_table.columns) # 获取列数
for row_num in range(1, rows):
# 计算周环比,并追加到excel_data
t0_value = int(_table.cell(row_num, 2).text_frame.text)
data = int(excel_data[row_num - 1][2]) - t0_value
excel_data[row_num - 1].append(data)
for col_num in range(0, cols):
# 计算周环比
_table.cell(row_num, col_num).text = str(excel_data[row_num - 1][col_num]) # 填充内容
_table.cell(row_num, col_num).text_frame.paragraphs[0].font.size = Pt(11) # 设置字体大小
_table.cell(row_num, col_num).text_frame.paragraphs[0].font.name = '微软雅黑'
_table.cell(row_num, col_num).text_frame.paragraphs[0].alignment = PP_ALIGN.CENTER # 居中
elif shape.shape_type == MSO_SHAPE_TYPE.TEXT_BOX: # 判断元素是否为文本框
text_ud = lambda a: "上升" if a >= 0 else "下降"
# 填充文本框内容
texts = ''
for i, data in enumerate(excel_data):
text = f'{i+1}、{data[1]}指标1:{data[2]},' \
f'较上周{text_ud(float(data[3]))}' \
f'{str(abs(data[3]))}\n\n'
texts = texts + text
shape.text = texts
# 设置文本框格式
for i in range(6):
shape.text_frame.paragraphs[i].font.size = Pt(14) # 设置字体大小
shape.text_frame.paragraphs[i].font.name = '微软雅黑'
prs.save(ppt_path)
3、运行结果:
三、小结
通过 Python 进行报表的自动化整理,从便利性而言远不及在线文档,只在一些特定场景有利于提升效率,需视场景选择。
大家平时被烦人报表折磨吗?欢迎在评论区 留言 偷偷吐槽 ~
(你不说我不说,老板就不会发现)
相关推荐
- 为何越来越多的编程语言使用JSON(为什么编程)
-
JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...
- 何时在数据库中使用 JSON(数据库用json格式存储)
-
在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...
- MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)
-
前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...
- JSON对象花样进阶(json格式对象)
-
一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...
- 深入理解 JSON 和 Form-data(json和formdata提交区别)
-
在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...
- JSON 语法(json 语法 priority)
-
JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...
- JSON语法详解(json的语法规则)
-
JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...
- MySQL JSON数据类型操作(mysql的json)
-
概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...
- JSON的数据模式(json数据格式示例)
-
像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...
- 前端学习——JSON格式详解(后端json格式)
-
JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...
- 什么是 JSON:详解 JSON 及其优势(什么叫json)
-
现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...
- PostgreSQL JSON 类型:处理结构化数据
-
PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...
- JavaScript:JSON、三种包装类(javascript 包)
-
JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...
- Python数据分析 只要1分钟 教你玩转JSON 全程干货
-
Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...
- 比较一下JSON与XML两种数据格式?(json和xml哪个好)
-
JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- r语言矩阵 (127)
- browsererror (114)
- exportexcel (119)
- cv2.bitwise_not (137)
- dump命令 (128)
- es6concat (126)
- heapify (127)
- java.security.egd (130)
- javax.annotation (117)
- jsstringsplit (117)
- js数字 (115)
- maven编译 (132)
- mysqlleft (128)
- nodejsbuffer (149)
- org.apache.commons.httpclient (126)
- org.jsoup (141)
- org.springframework.web (128)
- robotframework-ride (115)
- setnocounton (141)
- socket.gethostbyname (122)
- sqlmid (121)
- time.strptime (133)
- vscode格式化 (125)
- win32con (129)
- window.localstorage (126)