我有业务列表的节点,这些节点有业务的标题、主体和其他联系人字段。我想对我所有的内容"10000节点“进行研究,并在每个节点的标题和正文字段中找到最重复的单词,这样我就可以使用找到的关键字标记内容。
有什么想法吗?
发布于 2015-12-16 23:54:57
听起来你想要安装Solr,它提供了开箱即用的东西。
现在Solr服务器可以提供这样的信息,因为您可以登录到Solr web接口并执行特定的查询来获取统计信息,或者使用Luce (Lucene Index Browser)来显示这些统计信息。
或者,您可以使用SQL或shell命令。
例如:
drush sqlq "SELECT title, COALESCE(r.body_value, '') FROM node n LEFT JOIN field_data_body r ON n.nid = r.entity_id AND n.vid = r.revision_id" | sed -e 's/<[^>]*>//g' | grep -o "\w\+" | sort | uniq -c | sort -r | head -n20将从所有节点打印前20个最常用的单词。对于特定的节点或类型,使用WHERE缩小结果范围。
https://drupal.stackexchange.com/questions/184126
复制相似问题