总之,我试图根据一些工作示例将Twitter typeahead和Bloodhound应用到我的项目中,但我无法理解下面的代码。
datumTokenizer: Bloodhound.tokenizers.obj.whitespace('songs'),
queryTokenizer: Bloodhound.tokenizers.whitespace,原始代码如下所示。
var songlist = new Bloodhound({
datumTokenizer: Bloodhound.tokenizers.obj.whitespace('songs'),
queryTokenizer: Bloodhound.tokenizers.whitespace,
limit: 10,
remote: '/api/demo/GetSongs?searchTterm=%QUERY'
});正式文件刚刚说:
datumTokenizer --一个具有签名(数据)的函数,它将一个数据转换成一个字符串标记数组。必填项。 queryTokenizer -具有签名(查询)的函数,它将查询转换为字符串标记数组。必填项。
这是什么意思?有人能帮忙告诉我更多关于这件事的事吗,这样我才能更好地理解它?
发布于 2017-04-20 18:16:35
我在这里找到一些有用的信息:
最常见的标记化方法是在空格或非单词字符上拆分给定的字符串。“血犬”为这些方法提供了现成的实现: //返回“1”、“2”、“25”Bloodhound.tokenizers.whitespace(“一二二五”);//返回“一”、“二”、“二十”、“五”Bloodhound.tokenizers.nonword(“一二二五”); 对于查询标记化,您可能需要使用上述方法之一。对于数据标记化,您可能希望在这里做一些更高级的事情。 对于数据,有时您希望将令牌从多个属性中剥离。例如,如果您正在为GitHub存储库构建一个搜索引擎,那么从回购程序的名称、所有者和主要语言派生令牌可能是明智的: var repos ={ name:‘示例’,owner:'John‘,language:'JavaScript’},{ name:‘owner’,owner:'Joe‘,language:'Scala’};customTokenizer(datum) { var nameTokens = Bloodhound.tokenizers.whitespace(datum.name);var ownerTokens =Bloodhound.tokenizers.whitespace languageTokens = Bloodhound.tokenizers.whitespace(datum.language);返回nameTokens.concat(ownerTokens).concat(languageTokens);} 还可能有这样的场景,您希望在后端执行数据标记。最好的方法是向包含这些令牌的数据中添加一个属性。然后,您可以提供一个只返回已经存在的令牌的令牌程序: [{值:‘足球’,记号:‘足球’,‘猪皮’},{值:‘篮球’,记号:‘篮球’,'bball‘};函数customTokenizer(资料){返回datum.tokens}; 还有很多其他的方法可以对数据进行标记化,这实际上取决于您想要完成的任务。
不幸的是,这些信息在主要文档中并不容易找到。
发布于 2016-04-13 14:39:13
它是用于将数据或查询拆分为一个字数组以执行搜索/匹配的令牌。datumTokenizer引用您的数据,queryTokenizer引用所做的查询(通常是输入的文本)。
如果您的数据是一个对象数组(即json),datumTokenizer允许您指定要执行搜索的对象的哪个字段。例如,如果要搜索名称和代码字段,可以输入类似Bloodhound.tokenizers.obj.whitespace(['name','code'])的内容或提供自定义函数。
您可以在以下网站找到更多信息:https://github.com/twitter/typeahead.js/blob/master/doc/migration/0.10.0.md#tokenization-methods-must-be-provided
https://stackoverflow.com/questions/33381801
复制相似问题