首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python-pptx集校对语言

python-pptx集校对语言
EN

Stack Overflow用户
提问于 2017-11-01 16:47:04
回答 1查看 417关注 0票数 4

我想使用python模块来更改给定powerpoint演示文稿中每个包含文本的形状的校对语言。不幸的是,我没有做到。:(

我正在使用Python3.6.3和python-pptx0.6.7。

我的代码如下所示:

代码语言:javascript
复制
from pptx import Presentation
from pptx.enum.lang import MSO_LANGUAGE_ID

# In this example code, all proofing language is set to ENGLISH_UK
# all languages can be found in the docs for python-pptx
new_language = MSO_LANGUAGE_ID.ENGLISH_UK

input_file = 'test_pptx.pptx'
output_file = input_file[:-5] + '_modified.pptx'

# Open the presentation
prs = Presentation(input_file)

# iterate through all slides
for slide_no, slide in enumerate(prs.slides):
    # iterate through all shapes/objects on one slide
    for shape in slide.shapes:
        # check if the shape/object has text (pictures e.g. don't have text)
        if shape.has_text_frame:
            # print some output to the console for now
            print('SLIDE NO# ', slide_no + 1)
            print('Object-Name: ', shape.name)
            print('Text -->', shape.text)
            # check for each paragraph of text for the actual shape/object
            for paragraph in shape.text_frame.paragraphs:
                for run in paragraph.runs:
                    # display the current language
                    print('Actual set language: ', run.font.language_id)
                    # set the 'new_language'
                    run.font.language_id = new_language
        else:
            print('SLIDE NO# ', slide_no + 1, ': This object "', shape.name, '" has no text.')
        print(' +++++ next element +++++ ')
    print('--------- next slide ---------')

# save pptx with new filename
prs.save(output_file)

这个代码现在起作用了!(再次感谢史蒂夫!)

请帮帮我!提前感谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-11-01 17:31:46

实际上,我并不完全确定校对功能决定使用什么字典的所有规则,但是语言是在运行级别设置的,我认为这是一个很好的起点。

这在一定程度上是有意义的,因为在一段文字中可以有一个外文短语,而只有一个形状级别的语言设置不支持这一点。

因此,一旦通过了.has_text_frame测试,就需要一些额外的代码:

代码语言:javascript
复制
for paragraph in shape.text_frame.paragraphs:
    for run in paragraph.runs:
        font = run.font
        print(font.language_id)

这应该会给你这样的东西:

代码语言:javascript
复制
TURKISH (1055)
ENGLISH_UK (2057)
...

请注意,语言id值通过.xml_value属性上可用的标准语言代码提供了一些附加信息,因此您可以详细说明输出如下:

代码语言:javascript
复制
    for run in paragraph.runs:
        font = run.font
        language_id = font.language_id
        print('\'%s\'' % run.text, language_id, language_id.xml_value)

得到这样的东西:

代码语言:javascript
复制
'the rain in ' ENGLISH_US (1033) en-US
'España' SPANISH (1034) es-ES_tradnl
...
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47059757

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档