看这里。
我正在尝试利用tsvector来计算词频。我想我就快到了,但是我找不到从tsvector结构中获取词条的方法。
我所做的是,在创建tsvector column:select term_tsv, count(*) count from (select unnest(term_tsv) term_tsv from document_tsv) t group by term_tsv order by count desc;之后,结果是这样的:stem_tsv | count ------------------------+------- (3,{9},{D}) | 1我不知道括号代表的是哪种表达式。谁能告诉我如何从shell中提取术语?谢谢。
发布于 2016-06-30 16:07:12
我算出了下面列出的前10个常用条目,这是官方手册中写的。SELECT * FROM ts_stat('SELECT vector FROM apod') ORDER BY nentry DESC, ndoc DESC, word LIMIT 10;只是为了记录。
https://stackoverflow.com/questions/38115901
复制相似问题