# 读取数据 data = pd.read_excel('C:/Users/yyz/Desktop/python办公技巧/data/百度经纬度转高德.xlsx') data.head()
1 2 3 4 5 6 7 8 9 10 11 12
wd = data['纬度'].tolist() jd = data['经度'].tolist() # 定义一个空列表 li1 = [] for i inrange(len(data)): j = bdToGaoDe(jd[i],wd[i]) li1.append(j) li1 data['经度_re'] = [i[0] for i in li1] data['纬度_re'] = [i[1] for i in li1] data.head()
5 Excel文件批量合并
5.1 工具包
1 2 3
# 导入工具包 import pandas as pd import os
5.2 获取文件列表
1 2 3 4 5 6 7 8 9 10
# 设置文件路径 path = 'C:/Users/yyz/Desktop/python办公技巧/data/数据合并/' # 空列表, 用于存放文件路径 files = [] for file in os.listdir(path): if file.endswith(".xlsx"): files.append(path+file)
# 查看列表 files
5.3 转换存储数据
1 2 3 4 5 6 7 8 9 10 11 12
# 定义一个空的dataframe data = pd.DataFrame()
# 遍历所有文件 for file in files: datai = pd.read_excel(file) datai_len = len(datai) data = data.append(datai) # 添加到总的数据中 print('读取%i行数据,合并后文件%i列, 名称:%s'%(datai_len,len(data.columns),file.split('/')[-1])) # 查看是否全部读取,格式是否出错 # 重置索引 data.reset_index(drop=True,inplace=True)
6 Word文件批量转pdf
只能转docx文件,转doc文件会报错, 工具包安装
1
pip install docx2pdf
6.1 导入工具包
1 2 3 4
# 安装工具包: # 导入工具包 from docx2pdf import convert import os
# 文件位置 path = 'C:/Users/yyz/Desktop/python办公技巧/data/word转pdf/' # 定义空list,存放文件列表 files = [] for file in os.listdir(path): if file.endswith(".docx"): files.append(path+file) files for file in files: convert(file,file.split('.')[0]+'.pdf') print(file+'转换成功')
import pandas as pd import os os.chdir('C:/Users/yyz/Desktop/python办公技巧/data/word信息/')
1 2 3 4 5 6 7 8 9 10 11 12
lis1=[] for file in os.listdir('.'): if file.endswith('.docx'): doc = docx.Document('./'+file) biaoges = doc.tables rowi = len(biaoges[0].rows) for i inrange(1,rowi): lis1.append([biaoges[0].cell(i,0).text, biaoges[0].cell(i,1).text, biaoges[0].cell(i,2).text, biaoges[0].cell(i,3).text, biaoges[0].cell(i,4).text])