首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏johnhuster

    solr synonyms.txt不支持输入中文

    为了实现实际使用中有些简称的准确匹配,这个时候我们就需要定义一些同义词,具体做法就是在solr自带的synonyms.txt文件中填写我们想要的缩写与全称对应关系: 配置完成后需要重启solr 对应core managed-schema: java.nio.charset.MalformedInputException: Input length = 1错误 这是一个典型的编码错误,solr在加载相关配置时导致无法识别synonyms.txt 中的配置导致的,具体原因是默认下载到windows系统的文本编码格式是ANSI,解决方法就是把synonyms.txt文本的编码格式改成utf-8然后保存即可,查询结果如下:

    64620编辑于 2022-03-29
  • 来自专栏机器之心

    资源 | Synonyms:一个开源的中文近义词工具包

    机器之心也尝试使用 Synonyms 搜索一段中文的近义词,并有非常不错的反馈。 此外,Synonyms 的安装十分便捷,我们可以直接使用命令 pip install -U synonyms 完成。 ,因此 Synonyms 采用的词向量维度为 100。 用法 输出近义词向量: import synonyms print("人脸: %s" % (synonyms.nearby("人脸"))) print("识别: %s" % (synonyms.nearby 以友好的方式打印近义词,方便调试,display 调用了 synonyms#nearby 方法: >>> synonyms.display("飞机") '飞机'近义词: 1.

    2K80发布于 2018-05-10
  • 来自专栏杨建荣的学习笔记

    11g升级性能问题之一 重建user_synonyms (笔记27天)

    USER_SYNONYMS" ("SYNONYM_NAME", "TABLE_OWNER", "TABLE_NAME", " DB_LINK") AS select /*+ RULE */

    68250发布于 2018-03-13
  • 来自专栏Elastic Stack专栏

    如何使用ES的同义词API自动化同义词生成和上传

    创建同义词集示例PUT _synonyms/my-synonyms-set{ "synonyms_set": [ { "id": "rule-1", "synonyms": (results): synonyms_set = [{"id": slugify(product), "synonyms": synonyms} for product, synonyms in (results): synonyms_set = [{"id": slugify(product), "synonyms": synonyms} for product, synonyms in (id="products-synonyms-set", synonyms_set=synonyms_set) logging.info(json.dumps(response.body, 这个索引将使用synonyms_filter,应用之前创建的products-synonyms-set。

    54621编辑于 2025-04-23
  • 来自专栏ElasticSearch

    同义词的几个关键点

    同义词最好以文件的形式存储在config目录,配置updateable=true,synonyms_path GET my_synonyms/_settings GET my_synonyms/_mapping DELETE my_synonyms PUT my_synonyms { "settings": { "analysis": { "analyzer": { " } } } } POST my_synonyms/_close PUT my_synonyms/_settings { "analysis": { " "elk,elkb,elastic" ] } } } } POST my_synonyms/_open POST my_synonyms/_doc/1 { POST my_synonyms/_doc/3 { "content":"Elastic Stack is very powerful" } POST my_synonyms/_search {

    31810编辑于 2025-02-13
  • 来自专栏铭毅天下

    Elasticsearch 8.10 同义词管理新篇章:引入同义词 API

    6、Elasticsearch 同义词 API 实操指南 6.1 创建同义词集 你可以用以下API请求创建一个新的同义词集: PUT _synonyms/my-synonyms-set { "synonyms_set ", "synonyms_set": "my-synonyms-set", "updateable": true } PUT _synonyms/my-synonyms-set { "synonyms_set": [ { "id": "pc", "synonyms": "pc => " } ] } 6.3.2 单个更新 或者,你也可以管理单个同义词规则: PUT _synonyms/my-synonyms-set/computer { "synonyms": /my-synonyms-set-v1 { "synonyms_set": [ { "id": "huawei", "synonyms": "huawei, yylx

    1.6K40编辑于 2023-10-09
  • 来自专栏程序猿的大杂烩

    Kafka核心API——AdminClient API

    (name=compression.type, value=producer, source=DEFAULT_CONFIG, isSensitive=false, isReadOnly=false, synonyms =segment.bytes, value=1073741824, source=STATIC_BROKER_CONFIG, isSensitive=false, isReadOnly=false, synonyms =message.format.version, value=2.5-IV0, source=DEFAULT_CONFIG, isSensitive=false, isReadOnly=false, synonyms name=file.delete.delay.ms, value=60000, source=DEFAULT_CONFIG, isSensitive=false, isReadOnly=false, synonyms (name=max.message.bytes, value=1048588, source=DEFAULT_CONFIG, isSensitive=false, isReadOnly=false, synonyms

    2.9K10发布于 2020-09-23
  • 来自专栏Michael阿明学习之路

    LeetCode 1258. 近义词句子(哈希+并查集+排序+回溯)

    题目 给你一个近义词表 synonyms 和一个句子 text , synonyms 表中是一些近义词对 ,你可以将句子 text 中每个单词用它的近义词来替换。 示例 1: 输入: synonyms = [["happy","joy"],["sad","sorrow"],["joy","cheerful"]], text = "I am happy today <= 10 synonyms[i].length == 2 synonyms[0] ! = synonyms[1] 所有单词仅包含英文字母,且长度最多为 10 。 text 最多包含 10 个单词,且单词间用单个空格分隔开。 , string text) { int i = 0; for(auto& s : synonyms) { if(!

    74210发布于 2021-02-19
  • 来自专栏johnhuster

    solr之positionIncrementGap

    -- in this example, we will only use synonyms at query time <filter class="solr.SynonymGraphFilterFactory " synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/> <filter class="solr.FlattenGraphFilterFactory ignoreCase="true" words="stopwords.txt" /> <filter class="solr.SynonymGraphFilterFactory" synonyms ="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.LowerCaseFilterFactory

    37310编辑于 2022-03-29
  • 来自专栏飞鸟的专栏

    Elasticsearch 高级操作-分析器(二)

    "my_analyzer": { "tokenizer": "my_tokenizer", "filter": ["lowercase", "my_synonyms "my_tokenizer": { "type": "whitespace" } }, "filter": { "my_synonyms ": { "type": "synonym", "synonyms": [ "computer, pc", "laptop my_analyzer" } } }}在上述示例中,我们创建了一个名为“my_analyzer”的分析器,使用了自定义的“my_tokenizer”分词器和“lowercase”和“my_synonyms 此外,我们定义了一个名为“my_synonyms”的过滤器,将一些同义词(如“computer”和“pc”)转换为相同的单词。

    35010编辑于 2023-05-08
  • 英文单词做成动画!

    OUTPUT_DIR, exist_ok=True)# ===================== 工具函数 =====================def create_text_image(word, synonyms 0.25 - word_height/2 draw.text((x_word, y_word), word, font=word_font, fill="white") # 近义词 synonyms_text = ", ".join(synonyms) bbox_syn = draw.textbbox((0,0), synonyms_text, font=syn_font) syn_width , font=syn_font, fill="yellow") return imgdef generate_video_for_word(word, synonyms): # 生成语音 in words_dict.items(): generate_video_for_word(word, synonyms)print("所有视频生成完成!")

    23010编辑于 2025-10-06
  • 来自专栏第三方工具

    es语法 rest api 模拟query 根据中文姓名搜索demo

    prefix_length": 0, "max_expansions": 50, "zero_terms_query": "NONE", "auto_generate_synonyms_phrase_query "lenient": false, "zero_terms_query": "NONE", "auto_generate_synonyms_phrase_query "lenient": false, "zero_terms_query": "NONE", "auto_generate_synonyms_phrase_query lenient": false, "zero_terms_query": "NONE", "auto_generate_synonyms_phrase_query lenient": false, "zero_terms_query": "NONE", "auto_generate_synonyms_phrase_query

    25910编辑于 2024-10-09
  • 来自专栏乐沙弥的世界

    使用datapump 导出导入同义词(export and import synonym using datapump)

    ------------- db_name string XM6320 SQL> select count(*) from dba_synonyms string KM3625 --下面的查询中仅有两个同义词,这两个同义是在创建DB的时候手动创建的,非使用datapump导入产生的 SQL> select count(*) from dba_synonyms logfile=exp_syns.log full=y \ > include=PUBLIC_SYNONYM/SYNONYM:\"IN \(SELECT synonym_name FROM dba_synonyms syns.dmp logfile=exp_syns.log full=y include=PUBLIC_SYNONYM/SYNONYM:"IN (SELECT synonym_name FROM dba_synonyms ------------ db_name string KM3625 SQL> select count(*) from dba_synonyms

    1.5K30发布于 2018-08-14
  • 来自专栏咸鱼不闲

    solr中使用IKAnalyzer配置同义词,停止词,扩展词

    <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.SynonymFilterFactory" synonyms ="synonyms.txt" ignoreCase="true" expand="true" /> </analyzer> <analyzer type="index"> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.SynonymFilterFactory" synonyms ="synonyms.txt" ignoreCase="true" expand="true" /> </analyzer> </fieldType> 使用IKAnalyzer2012FF_u1 第三步 新建synonyms.txt文件,放在con目录下,保存同义词的字典格式如下 什么 => 啥 啥 => 什么 或者 什么,啥(逗号是英文格式下的) 注意:synonyms.txt文件写完必须另存为选择

    1.9K40发布于 2018-10-31
  • 来自专栏全栈程序员必看

    中文情感词典的构建与使用_文本情感识别

    使用的链接在这里:哈工大同义词林扩展版 使用代码编写时也可以利用Python的Synonyms库来获取同义词。 其已经开源,链接为:synonyms 如: import synonyms print("人脸: %s" % (synonyms.nearby("人脸"))) print("识别: %s" % (synonyms.nearby

    2.7K30编辑于 2022-09-23
  • 来自专栏杨建荣的学习笔记

    关于dual表的破坏性测试(r3笔记第60天)

    select count(*)from dual * ERROR at line 1: ORA-01775: looping chain of synonyms select *from dual * ERROR at line 1: ORA-01775: looping chain of synonyms --如果没有尝试重启数据库的情况下 dual; select sysdate from dual * ERROR at line 1: ORA-01775: looping chain of synonyms Disconnection forced ORA-01775: looping chain of synonyms Process ID: 434 Session ID: 237 Serial number ORA-01775: looping chain of synonyms *** 2014-11-20 06:31:11.947 USER (ospid: 434): terminating the

    1K130发布于 2018-03-15
  • 来自专栏Michael阿明学习之路

    程序员面试金典 - 面试题 17.07. 婴儿名字(并查集)

    示例: 输入:names = ["John(15)","Jon(12)","Chris(13)","Kris(4)","Christopher(19)"], synonyms = ["(Jon,John string,int> m;//名称,频次 public: vector<string> trulyMostPopular(vector<string>& names, vector<string>& synonyms [name] = count;//获取每个名字的次数 father[name] = name;//并查集初始化 } for(auto& n : synonyms [name1] = name1;//并查集初始化 father[name2] = name2;//并查集初始化 } for(auto& n : synonyms

    41910发布于 2020-07-13
  • 来自专栏Java随想录

    学好Elasticsearch系列-分词器

    然后我们在 my_synonyms 分析器中使用了该过滤器。 我们可以使用synonyms_path 指定同义词规则路径,这个文件中列出了所有你定义的同义词,每行都是一组同义词,各词之间用逗号分隔。 使用 synonyms_path 参数的主要优点是,你可以在不重启 Elasticsearch 或重新索引数据的情况下,通过更新这个文件来动态地改变同义词规则。 过滤器中的 synonyms_path 参数指向了存放同义词的 synonyms.txt 文件。 注意:synonyms_path 是相对于 config 目录的路径。 例如,如果你的 config 目录在 /etc/elasticsearch/,那么 synonyms.txt 文件应该放在 /etc/elasticsearch/analysis/synonyms.txt

    1.4K20编辑于 2023-10-16
  • 来自专栏Java随想录

    学好Elasticsearch系列-分词器

    然后我们在 my_synonyms 分析器中使用了该过滤器。 我们可以使用synonyms_path 指定同义词规则路径,这个文件中列出了所有你定义的同义词,每行都是一组同义词,各词之间用逗号分隔。 使用 synonyms_path 参数的主要优点是,你可以在不重启 Elasticsearch 或重新索引数据的情况下,通过更新这个文件来动态地改变同义词规则。 过滤器中的 synonyms_path 参数指向了存放同义词的 synonyms.txt 文件。 注意:synonyms_path 是相对于 config 目录的路径。 例如,如果你的 config 目录在 /etc/elasticsearch/,那么 synonyms.txt 文件应该放在 /etc/elasticsearch/analysis/synonyms.txt

    1.2K20编辑于 2023-08-08
  • 来自专栏天意云&天意科研云&天意生信云

    从60%到5%!用ChatGPT给论文降重,看着一篇就够了(附详细指令)

    英文指令: Rephrase this passage by restructuring the sentences, adjusting word counts, and substituting synonyms original text by adjusting word order, increasing or decreasing the number of words, and substituting synonyms 英文指令: First, rearrange the sentences, modify the wording by adding or removing terms, and employ synonyms 英文指令: Replace key terms in the text with appropriate synonyms to lower repetition and enhance the originality

    3.3K10编辑于 2025-03-06
领券