首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >sense2vec v1.0:重构与现代化升级

sense2vec v1.0:重构与现代化升级

原创
作者头像
用户11764306
发布2026-04-27 07:10:35
发布2026-04-27 07:10:35
50
举报

v1.0.0:重构与现代化,支持 spaCy v2.2,更多功能,2019 年向量模型及 Prodigy 配方

✨ 新特性与改进

  • 从头开始完全重写代码包。
  • 使用 spaCy 的 Vectors 替代内置向量存储,使此包成为纯 Python 包,并支持轻松开箱即用的向量序列化。
  • 添加了完全可序列化的 spaCy 流水线组件和扩展属性。
  • 新增 get_best_senseget_other_senses 方法,并改进了 most_similar 方法。
  • 添加了预计算最近邻索引的脚本,用于实现超快速的“最相似”查询。
  • 为 Prodigy 添加了标注配方,可使用 sense2vec 向量从相似短语中轻松创建词表及匹配模式(类似 terms.teach 配方,但支持多词表达式)。
  • 使用 GloVe 和 fastText 实现了新的、更高效的训练与预处理脚本。

⚠️ 向后不兼容的变更

  • 移除了 sense2vec.load 方法。请改用 Sense2Vec.from_disk
  • 移除了原有的 VectorMapVectorStorage
  • 此包现在要求 Python 3.6+ 版本。
  • 此更新需要使用新的向量格式(参见附件文件)。

📖 文档与示例

👥 贡献者

感谢 @kabirkhan 贡献了初始的 Prodigy 配方!FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • v1.0.0:重构与现代化,支持 spaCy v2.2,更多功能,2019 年向量模型及 Prodigy 配方
    • ✨ 新特性与改进
    • ⚠️ 向后不兼容的变更
    • 📖 文档与示例
    • 👥 贡献者
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档