首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Haskell/Trifecta:解析完全可选的分号而不污染AST

Haskell/Trifecta:解析完全可选的分号而不污染AST
EN

Stack Overflow用户
提问于 2013-11-22 08:07:41
回答 1查看 1K关注 0票数 4

我已经重写了这个问题,因为它最初是用一个更简洁的代码示例发布的:

考虑一种具有完全可选分号的语言几乎完全是糖,即:

  • ;; foo; bar;;;;有效
  • foo bar foobar有效
  • if (+1); foo在语义上不同于if (+1) foo,因此不能将;视为空白。

下面是一个示例解析器:

代码语言:javascript
复制
{-# LANGUAGE OverloadedStrings #-}

import Text.Trifecta
import Text.Trifecta.Delta
import Text.PrettyPrint.ANSI.Leijen (putDoc, (<>), linebreak)
import Control.Monad.Trans.State.Strict
import Control.Applicative

type TestParser a = StateT Int Parser a

data AST a = Foo a | Bar a deriving (Show)

pFoo :: TestParser (AST (Delta, Int))
pFoo = curry Foo <$ string "foo" <*> position <* modify (+1) <*> get

pBar :: TestParser (AST (Delta, Int))
pBar = curry Bar <$ string "bar" <*> position <*> get

pStmt :: TestParser (AST (Delta, Int))
pStmt = semi *> pStmt <|> pFoo <|> pBar <?> "statement"

pTest :: TestParser [AST (Delta, Int)]
pTest = some pStmt

main :: IO ()
main
 = do   let res = parseByteString (evalStateT pTest 0)
                    (Directed "(test)" 0 0 0 0) ";;foo;bar;\nfoo;; foobarbar;;"
        case res of
            Success ast
             -> print ast
            Failure errdoc
             -> putDoc (errdoc <> linebreak)

这样一个解析器的问题是,我需要能够跳过分号而不需要解析pStmt。目前发生以下错误:

代码语言:javascript
复制
(test):2:18: error: unexpected
    EOF, expected: statement
foo;; foobarbar;;<EOF>

这是因为它需要一个语句(在semi *> pStmt中),但是,因为堆叠的分号可以在表达式的开始和结束时使用糖,所以我无法确定我是否真的希望在预期之前期望/解析一个表达式。

我开发的一种方法是让Nop作为构造函数出现在我的AST中,但我真的不想这样做--感觉就像一次黑客攻击,随着一些文档中分号的数量,它将大大增加内存的使用。

我正在寻找解决办法/建议。

尝试使用所需语法的EBNF形式:

代码语言:javascript
复制
expr = "foo" | "bar"
expr with sugar = expr | ";"
program = { [white space], expr with sugar, [white space] }
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-11-29 23:35:40

好的,这里是:

代码语言:javascript
复制
pStmt = pFoo <|> pBar

pWhiteStmt = do
    many whitespace
    p <- pStmt
    many whitespace
    return p

pTest = do
    many semi
    pS <- sepEndBy pWhiteStm (some semi)
    eof
    return pS

并测试它:

代码语言:javascript
复制
> parse pTest "" ";;foo;bar;\nfoo;; foo;bar;bar;;"
Right ["foo","bar","foo","foo","bar","bar"]

> parse pTest "" ";;foo;bar;\nfoo;; foobarbar;;"
Left (line 2, column 10):
unexpected 'b'
expecting ";" or end of input

如果我们希望有一个有效的"; foobarbar;",那么我们需要将pWhiteStmt解析器更改为next:

代码语言:javascript
复制
pWhiteStmt = do
    many whitespace
    p <- some pStmt
    many whitespace
    return p

检查一下:

代码语言:javascript
复制
> parse pTest "" ";;foo;bar;\nfoo;; foobarbar;;"
Right [["foo"],["bar"],["foo"],["foo","bar","bar"]]

最后,如果我们仍然希望有有效的"; foo bar baz;",那么我们还需要将pTest函数改为next:

代码语言:javascript
复制
pTest = do
    many semi
    pS <- sepEndBy (some pWhiteStm) (some semi)
    eof
    return pS

并测试它

代码语言:javascript
复制
> parse pTest "" ";;foo;bar;\nfoo;; foo bar bar;;"
Right [[["foo"]],[["bar"]],[["foo"]],[["foo"],["bar"],["bar"]]]

如果有许多括号,则需要将return p替换为pWhiteStmt中的return (concat p)

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20139957

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档