首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在python的lark-parser中解析包含unicode字符的字符串?

如何在python的lark-parser中解析包含unicode字符的字符串?
EN

Stack Overflow用户
提问于 2020-06-10 10:55:07
回答 2查看 204关注 0票数 0

我正在尝试使用Python中的lark解析器来解析一些sql字符串。其中一些语句包含unicode字符,导致解析器抛出错误(带ó,é的字符串)。我使用以下几行在.lark文件中定义字符串

代码语言:javascript
复制
LATIN_LETTER: /[u"\u00a1-\u02af"]/
STRING: (LATIN_LETTER|LETTER|DIGIT|PUNCTUATION)+

抛出错误

代码语言:javascript
复制
E   UnexpectedCharacters: No terminal defined for '�' at line 154 col 126
E   
E   jillo', 'Owner', 'Avda. de la Constitución 2222', 'México D.F.', NULL, '05021'

我是否在.lark文件中错误地指定了unicode字母?这样做的正确方法是什么?

EN

回答 2

Stack Overflow用户

发布于 2020-06-11 03:39:55

改变

代码语言:javascript
复制
LATIN_LETTER: /[u"\u00a1-\u02af"]/

代码语言:javascript
复制
LATIN_LETTER: ("¡".."ʯ")

成功了

票数 1
EN

Stack Overflow用户

发布于 2021-07-15 16:58:50

代码语言:javascript
复制
CHINESE_LETTER: ("\u4e00".."\u9fff") | ("\u3000".."\u303f")
票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62295067

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档