首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >禁用标点符号LUIS.ai上的令牌中断

禁用标点符号LUIS.ai上的令牌中断
EN

Stack Overflow用户
提问于 2016-08-03 16:38:00
回答 1查看 686关注 0票数 3

我正在使用微软认知服务的语言理解服务API,LUIS.ai

每当LUIS解析文本时,总是在标点符号周围插入空格标记。

根据文档的说法,这种行为是故意的。

英语、法语、意大利语、西班牙语:在任何空格和标点符号周围插入标记符。

对于我的项目,我需要保留原始的查询字符串,没有这些标记,因为一些为我的模型训练的实体将包含标点符号,从解析的实体中去掉额外的空格是很烦人的,也有点麻烦。

此行为的示例:

有办法让这个失效吗?这将节省相当多的精力。

谢谢!!

EN

回答 1

Stack Overflow用户

发布于 2016-08-05 15:02:42

不幸的是,目前还没有办法禁用它,但好消息是返回的预测将处理原始字符串,而不是您在示例标记过程中看到的标记字符串。

如何理解JSON响应的文档中,您可以看到示例输出保留了原始的“查询”字符串,而提取的实体在原始字符串中有基于零的字符索引("startIndex", "endIndex");这将允许您处理索引而不是解析的实体短语。

代码语言:javascript
复制
{
"query": "Book me a flight to Boston on May 4",
"intents": [
  {
    "intent": "BookFlight",
    "score": 0.919818342
  },
  {
    "intent": "None",
    "score": 0.136909246
  },
  {
    "intent": "GetWeather",
    "score": 0.007304534
  }
],
"entities": [
  {
    "entity": "boston",
    "type": "Location::ToLocation",
    "startIndex": 20,
    "endIndex": 25,
    "score": 0.621795356
  },
  {
    "entity": "may 4",
    "type": "builtin.datetime.date",
    "startIndex": 30,
    "endIndex": 34,
    "resolution": {
      "date": "XXXX-05-04"
    }
  }
]

}

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38749246

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档