# 导入必要的库
from docx import Document
def read_word(file_path):
# 创建Document对象,加载word文档
doc = Document(file_path)
# 初始化一个空字符串,用于存储文档内容
full_text = []
# 遍历文档中的每个段落
for para in doc.paragraphs:
# 将每个段落的文本添加到列表中
full_text.append(para.text)
# 使用换行符连接所有段落文本,并返回
return '\n'.join(full_text)
# 示例调用函数
file_path = 'example.docx' # 替换为你的Word文件路径
content = read_word(file_path)
print(content)
python-docx
库来读取 .docx
文件。你可以通过 pip install python-docx
安装该库。Document(file_path)
会加载指定路径的 Word 文档。doc.paragraphs
是一个包含文档中所有段落的列表。我们遍历这些段落并提取文本。如果你需要处理更复杂的 Word 文档(如表格、图片等),可以进一步扩展代码。
上一篇:python legend
下一篇:python两个字典合并
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站