假设有以下情况:
grammar Lang
start: CHAR;
CHAR: [\uE001];
WS: [ \t\r\n]+ -> skip;当此批处理文件运行时:
@echo off
setlocal
call antlr4 -o .\javatarget LangFile.g4 -encoding UTF-8
cd .\javatarget
call javac LangFile*.java
call grun LangFile Lang -gui -diagnostics -trace -encoding UTF-8
endlocal
@echo on当我粘贴Unicode字符时发生此错误:
^Z
line 1:0 token recognition error at: '?'
enter Lang, LT(1)=<EOF>
consume [@0,3:2='<EOF>',<-1>,2:0] rule Lang
exit Lang, LT(1)=<EOF>尽管我搜索了其他答案(例如-encoding选项),但我似乎无法让这种Unicode (私有使用区域)解析工作。
编辑:我的版本是4.8。
问题似乎出在grun工具上。用Python手动运行它运行得很好,指定一个输入文件也是如此。但是直接将内容粘贴到控制台失败了。恢复使用输入文件对我来说已经足够好了,但是当grun的直接输入模式工作时,这个问题可能已经得到了回答。
发布于 2020-10-26 04:53:01
可能是grun脚本处理输入的方式有问题,因为当我生成一个词法分析器和解析器并运行以下代码时:
LangLexer lexer = new LangLexer(CharStreams.fromString("\uE001"));
LangParser parser = new LangParser(new CommonTokenStream(lexer));
parser.start();它解析时不会出现任何警告或错误。
https://stackoverflow.com/questions/64528589
复制相似问题