首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python在尝试用日语编码调用wget时表现得很奇怪

Python在尝试用日语编码调用wget时表现得很奇怪
EN

Stack Overflow用户
提问于 2017-11-13 06:54:34
回答 1查看 193关注 0票数 2

我正在创建一个python脚本,它使用bash对文件中包含的日语单词列表执行wget操作。我只想用卷发,但这有编码问题。使用wget,它确实下载了html,但它将其转储到当前目录中,其中包含诗意标题,如:

代码语言:javascript
复制
   試%E8%A1%8C%E9%8C%AF誤

我希望它能把html放到诸如“output/混合..txt”这样听起来不错的地方。它确实创建了这些听起来不错的文件,但里面没有任何内容。

代码语言:javascript
复制
#!/usr/bin/env python
# -*- coding: utf-8 -*-

import os

with open("words") as f:
    for line in f:
        text = unicode(line, "utf-8")
        os.system("wget \'https://kotobank.jp/word/" + line.strip() + "'> output/" + line.strip() + ".txt")
        #print("wget \'https://kotobank.jp/word/" + line.strip() + "'>> output/out.txt")

文件"words“如下:

代码语言:javascript
复制
追究
花器
陶磁器
枯渇
風合い
繊維
混合
アボード
受け継い
試行錯誤
硬質
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-11-13 07:22:50

使用-O file选项而不是重定向输出:

代码语言:javascript
复制
os.system("wget \'https://kotobank.jp/word/" + line.strip() + "' -O " + line.strip() + ".txt"

有关更多信息,请参见wget 文档

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47258602

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档