我想实现一个信息检索系统,它使用向量空间模型,但具有多术语标记和自定义术语加权函数。
我正在考虑在PostgreSQL而不是文件系统中建立我的倒排索引。我读到过关于GIN索引的文章,它在tsvector列上构建这样的索引。
我可以在不调用to_tsvector函数的情况下手动构建tsvector值吗?这样我就可以用自定义标记和自定义权重构建我的“自定义”向量了吗?
发布于 2020-01-11 08:29:51
你可以手工制作tsvectors。但据我所知,您只能分配4种不同的权重,A、B、C或D。多个单词标记必须放在单引号中,以便将它们放在一起作为一个标记。
select $$'two words':1c oneword$$::tsvector;
tsvector
--------------------------
'oneword' 'two words':1C发布于 2021-03-03 02:46:49
如果它对任何人有帮助,请在原始答案的基础上进行构建:
select $$'foo':1 'bar':2 'baz':10$$::tsvector;
tsvector
--------------------------
'bar':2 'baz':10 'foo':1
(1 row)https://stackoverflow.com/questions/59687591
复制相似问题