我想把2TB的文本转换成一个可搜索的数据库,在那里我通常会搜索数据库中是否存在2-4个单词表达式(例如,我可能会进行搜索,看看文本中是否出现了短语"these are four words“或"three我还想尽可能地减少开销,这样我就可以减少我需要的数据库服务器的数量。
有没有人对我应该如何设置这个数据库有什么建议?包含所有三个存在键)组成的,所以对于表达式“than are four word”,我首先搜索“than are",然后搜索"are four",检查是否有匹配的”then are“比"