main
黄海 9 months ago
parent 6e67bfbc24
commit 79643be110

@ -0,0 +1,49 @@
import os
import win32com
from win32com.client import Dispatch
import re
# pip install pywin32 openpyxl
# pip install pywin32
working_dir = r"D:\dsWork\YunNanDsBase\Doc\全省及州市县区人口与教育报告集20241023\133个县区报告2022\县区研究报告"
import openpyxl
# 在工作目录下创建Excel目录
excel_dir = r'D:\dsWork\YunNanDsBase\Doc\全省及州市县区人口与教育报告集20241023\133个县区报告2022\Excel'
if not os.path.exists(excel_dir):
os.mkdir(excel_dir)
# 遍历working_dir目录下的所有子文件夹
for root, dirs, files in os.walk(working_dir):
for dir in dirs:
# 获取县区名称
county_name = dir
# 获取县区文件夹路径
county_dir = os.path.join(root, dir)
# 遍历县区文件夹下的所有文件
for file in os.listdir(county_dir):
# 获取文件路径
file_path = os.path.join(county_dir, file)
# 判断文件是否是Word文档
if file_path.endswith('.docx') and not file.startswith('~'):
areaName = file
areaName = re.sub(r'[^\u4e00-\u9fa5]', '', areaName)
if '' not in areaName and '' not in areaName and '' not in areaName:
continue
# 打开文件文件,按行读取
with open('replaceBlank.txt', 'r', encoding='utf-8') as f:
for line in f:
# 去除每行前后的空白字符,包括空格、制表符和换行符
line = line.strip()
# 将文本中的关键字替换为空字符串
areaName = areaName.replace(line, '')
# 打开文件文件,按行读取
with open('replaceText.txt', 'r', encoding='utf-8') as f:
for line in f:
# 去除每行前后的空白字符,包括空格、制表符和换行符
line = line.strip()
# 将文本中的关键字替换为空字符串
areaName = areaName.replace(line.split(' ')[0], line.split(' ')[1])
#
print(f"正在处理文件:{areaName}")
print("恭喜,所有县区数据整理工作成功完成!")

@ -0,0 +1,33 @@
人口变化及其对教育的影响
辖区人口变化趋势对基础教育的影响
样稿
市教育数据统计
区报告
人口变化趋势对基础教育的影响修改
人口变化趋势对基础教育的影响审稿
人口变化趋势对基础教育的影响陈副改终稿
县区最终版
人口变化趋势对基础教育的影响
人口变化及其对基础教育影响的报告
修改终稿
人口变化及其对教育影响的报告
正确
附件
定稿
省级课题
人口变化及其对基础教育的影响报告
县区
人口变化对教育的影响
报告
研究报告
文本
修改稿
已审核
已经审核
报告
总人口数常住人口数统计局提供
初稿
人口变化及其对教育影响的研究
人口变化趋势对基础教育影响的研究
研究

@ -0,0 +1,11 @@
县县 县
曲靖市马龙区 马龙区
曲靖市麒麟区 麒麟区
曲靖市沾益区 沾益区
江城江城县 江城县
墨江 墨江县
盐津 盐津县
盈江 盈江县
芒市 芒市县
宾川 宾川县
镇康 镇康县
Loading…
Cancel
Save