我想把2TB的文本转换成一个可搜索的数据库,在那里我通常会搜索数据库中是否存在2-4个单词表达式(例如,我可能会进行搜索,看看文本中是否出现了短语"these are four words“或"three这些搜索将经常发生,所以将数据库设置为使用尽可能少的处理是非常重要的。我还想尽可能地减少开销,这样我就可以减少我需要的数据库服务器的数量。
有没有人对我应该如何设置这个数据库有什么建议?编辑:我将使用这个数据库做的唯一一件事就是做这些2-4个单词的精确匹配搜索,它是供内部使用的。我希望这个数据库能够做的就是让我知道在我所