我正试图为一个学校项目制作一个网络爬虫。当我试图刮一些网站时,我会发现以下错误:
不正确的字符串值:'\xC4\x82\xC5\xA4 \xC3.‘用于第1行的“内容”列
表内容的配置如下所示
CREATE TABLE IF NOT EXISTS scotchbox.content (
id INT(11) NOT NULL AUTO_INCREMENT,
url INT(11) NOT NULL,
content LONGTEXT CHARACTER SET 'utf8' NOT NULL,
content_raw LONGTEXT CHARACTER SET 'utf8' NOT NULL,
content_raw_hash VARCHAR(255) CHARACTER SET 'utf8' NOT NULL,
PRIMARY KEY (id),
INDEX idx_content__url (url ASC),
CONSTRAINT fk_content__url
FOREIGN KEY (url)
REFERENCES scotchbox.url (id))
ENGINE = InnoDB
AUTO_INCREMENT = 4
DEFAULT CHARACTER SET = utf8mb4;有人能告诉我我需要更改什么/做什么才能将页面输入数据库吗?
发布于 2018-03-29 10:45:10
我相信这将帮助你解决你的问题从上一个问题。
https://stackoverflow.com/questions/49553774
复制相似问题