首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >chatterbot twitter_trainer ASCII编码错误

chatterbot twitter_trainer ASCII编码错误
EN

Stack Overflow用户
提问于 2017-06-22 19:40:59
回答 1查看 144关注 0票数 1

我试图在一个单独的程序上运行chatterbot的TwitterTrainer,如下所示:

代码语言:javascript
复制
from chatterbot import ChatBot
from chatterbot.trainers import TwitterTrainer
from settings import TWITTER
import logging

# Comment out the following line to disable verbose logging
logging.basicConfig(level=logging.INFO)

chatbot = ChatBot("TwitterBot",
    logic_adapters=[
        "chatterbot.logic.BestMatch"
    ],
    input_adapter="chatterbot.input.TerminalAdapter",
    output_adapter="chatterbot.output.TerminalAdapter",
    database="./twitter-database.db",
    twitter_consumer_key=TWITTER["CONSUMER_KEY"],
    twitter_consumer_secret=TWITTER["CONSUMER_SECRET"],
    twitter_access_token_key=TWITTER["ACCESS_TOKEN"],
    twitter_access_token_secret=TWITTER["ACCESS_TOKEN_SECRET"],
    trainer="chatterbot.trainers.TwitterTrainer",
    random_seed_word="random"
)

chatbot.train()

chatbot.logger.info('Trained database generated successfully!')

我会犯这样的错误:

文件"C:\Python27\lib\json\decoder.py",第364行,在解码obj中,end = self.raw_decode(s,idx=_w(s,0).end() File "C:\Python27\lib\json\decoder.py",第380行,在raw_decode obj中,end = self.scan_once(s,idx) UnicodeDecodeError:'utf8‘编解码器无法解码94号位置的字节0x85 :无效开始字节

这个程序不会连续运行3秒,但是一些tweet会被写入twitter数据库,直到出现异常。

在查看trainer.py时,我还看到了以下内容:

代码语言:javascript
复制
# TODO: Handle non-ascii characters properly

你知道为什么会发生这种事吗?我怎么解决这个问题?

EN

回答 1

Stack Overflow用户

发布于 2017-06-23 13:25:31

您能否尝试在文件# -*- coding: utf-8 -*-的顶部添加Python编码。由于此原因,将发生这些类型错误。更多信息,可在这里获得http://chatterbot.readthedocs.io/en/stable/encoding.html#fixing-encoding-errors

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44708053

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档