首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏xiaosen

    Chroma 向量数据入门

    Chroma 是 AI 原生的开源矢量数据库。Chroma 使知识、事实和技能可插入 LLM,从而可以轻松构建 LLM 应用程序。Chroma 是 AI 原生的开源矢量数据库。 Chroma 使知识、事实和技能可插入 LLM,从而可以轻松构建 LLM 应用程序。 Chroma是一个文档检索系统,它存储了一组文档以及它们相应的嵌入向量。 尝试 import chromadb chroma_client = chromadb.Client() collection = chroma_client.create_collection(name 也可以通过docker下载chroma: docker pull chroma/chroma # 拉取 ChromaDB 镜像 docker run -p 8000:8000 chroma/chroma client.reset() 重置数据库 在客户端-服务器模式下运行Chroma Chroma 客户端连接到在单独进程中运行的 Chroma 服务器。

    95810编辑于 2024-09-27
  • 来自专栏悟空被FFmpeg玩

    使用FFmpeg实现抠图合并功能(chroma key)

    在很多视频中可以看到图像是合成的,例如有些神剧里面某大侠跳下万丈深渊的场景,某人在三昧真火中被烧的场景,还有些游戏主播,体育主播在主场景前面有个人解说的场景,都是chroma key的技术实现的,具体的链接可以参考 : http://www.cs.utah.edu/~michael/chroma/ 效果图如下: ? 在最新版本的ffmpeg中,已经增加了chroma key功能的filter,只需要一条命令即可搞定 点击(此处)折叠或打开 .

    2.5K20发布于 2019-03-05
  • 来自专栏码匠的流水账

    langchain4j+Chroma小试牛刀

    序本文主要研究一下如何使用langchain4j对接Chroma向量数据库步骤安装Chromadocker run -d \ --name chromadb \ -p 8000:8000 \ -v "$(pwd)/chroma_data:/chroma/chroma" \ -e IS_PERSISTENT=TRUE \ -e ANONYMIZED_TELEMETRY=TRUE \ docker .1ms.run/chromadb/chroma:latestpom.xml <dependency> <groupId>dev.langchain4j</groupId 模块用于访问Chroma。 需要注意的是Chroma无法根据字母数字元数据的大于或小于进行过滤,仅支持整数和浮点数。

    63500编辑于 2025-03-05
  • 来自专栏后端技术漫谈

    向量数据库Chroma极简教程

    由于大模型的火热,现在市面上的向量数据库众多,主流的向量数据库对比如下所示: 向量数据库 URL GitHub Star Language chroma https://github.com/chroma-core 的使用和实战,主要包括以下内容: Chroma设计理念 Chroma常见概念(数据集,文档,存储,查询,条件过滤) Chroma快速上手 Chroma支持的Embeddings算法 实战:在Langchain 中使用Chroma对中国古典四大名著进行相似性查询 Chroma快速上手 设计理念 Chroma的目标是帮助用户更加便捷地构建大模型应用,更加轻松的将知识(knowledge)、事实(facts)和技能 Demo: import chromadb chroma_client = chromadb.Client() collection = chroma_client.create_collection 此外,Chroma还支持服务端,客户端模式,用于跨进程通信。

    3.4K31编辑于 2023-11-08
  • 来自专栏智汇编程工坊

    Chroma数据库:使用指南与实践案例

    未来,Chroma 的开发者们计划继续改进和优化 Chroma,以满足用户不断增长的需求。 Python HTTP-only 客户端:Chroma 提供了一个轻量级的客户端库,使得用户无需安装完整的 Chroma 库就可以连接到 Chroma 服务器。 如何使用 Chroma?接下来,我们将一起探索如何使用 Chroma。我将会以一个简单的例子来说明如何使用 Chroma 的各种功能。 初始化 Chroma 客户端首先,我们需要初始化 Chroma 客户端。 启动 Chroma 服务器接下来,我们可以启动 Chroma 服务器。

    10K31编辑于 2024-04-11
  • 来自专栏DeepHub IMBA

    开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate

    Chroma 向量数据库 Chroma 是一种专门设计用来高效管理和查询向量数据的数据库系统。Chroma 通过其高效的数据结构和算法优化,能够快速处理和检索大量的向量数据。 以下是 Chroma 向量数据库的一些主要特点: 高效的向量索引:Chroma 使用高效的索引结构,如倒排索引、KD-树或基于图的索引,以加快向量搜索速度。 可扩展性和弹性:Chroma 能够支持水平扩展,适应大规模数据集的需要。同时,它也能有效处理数据的动态变化,适应快速发展的存储需求。 易于集成和使用:Chroma 设计有易于使用的API接口,支持多种编程语言接入,便于开发者在不同的系统和应用中集成使用。 实时性能优化:Chroma 优化了查询处理过程,支持实时的数据查询和更新,满足实时分析和决策的需求。

    39.4K41编辑于 2024-04-25
  • 最近发现一个宝藏-Chroma Walnut UI

    背景最近在使用Chroma向量数据库时发现命令行比较麻烦,有几个待选项:1:Chroma官方自带的SwaggerUI。也不是很方便,每一个API都是单独调用。 使用方法展开代码语言:TXTAI代码解释1.克隆项目gitclonehttps://github.com/deepin_sir/chroma-walnut-ui.gitcdchroma-walnut-ui2

    10510编辑于 2026-05-04
  • 来自专栏云云众生s

    Chroma 初探:面向 LLM 的开源向量数据库

    Chroma 初探:面向 LLM 的开源向量数据库 Chroma 是一个开源的嵌入式数据库,通过使知识、事实和技能可以插入到 LLM 中,从而轻松构建 LLM 应用程序。这里可以了解它的工作原理。 在本文中,我们将更详细地介绍 Chroma ,一个轻量级的开源向量数据库。 Chroma 概述 Chroma 可用于 Python 或 JavaScript 代码以生成词嵌入。 现在,让我们来看看 Chroma 向量数据库的运作方式。 通过 Python 使用 Chroma 使用 Chroma 的第一步是通过 pip 安装。 chroma_client = chromadb.PersistentClient(path="/path/to/save/to") Chroma 将一组相关内容称为一个集合(collection)。 由于我们依赖于 Chroma 提供的内置词嵌入模型,所以我们只会摄取数据,并让 Chroma 自动为集合中的每个文档生成嵌入。 我们可以继续创建一个集合。

    2.4K10编辑于 2024-03-27
  • 来自专栏自然语言处理

    【RAG落地利器】向量数据库Chroma入门教程

    /volumes/index_data:/chroma/chroma -e IS_PERSISTENT=TRUE -e ANONYMIZED_TELEMETRY=TRUE chromadb/chroma :0.6.4.dev19 其中-v H:/Projects/chroma/volumes/index_data:/chroma/chroma代表将本地的目录映射到容器的数据存储目录。 Chroma的核心特点 Chroma 是一个开源的向量数据库,专注于简化文本嵌入的存储和检索过程。 Chroma的设计理念 Chroma的设计目标是为开发者提供一种简单、高效的工具,帮助他们将现实世界中的知识、事实和技能整合到大模型中。 使用和服务端docker部署 ChromaDB教程 Chroma向量数据库完全手册 向量数据库Chroma极简教程 Python Chromadb 向量数据库快速入门 Chroma向量数据库使用教程

    10.1K01编辑于 2025-01-23
  • 来自专栏云云众生s

    教程:使用 Chroma 和 OpenAI 构建自定义问答机器人

    教程:使用 Chroma 和 OpenAI 构建自定义问答机器人 翻译自 Tutorial: Use Chroma and OpenAI to Build a Custom Q&A Bot 。 我们将用一个查询替换掉该函数,以在Chroma中搜索存储的集合。 为了完整起见,我们将开始设置环境并准备数据集。这与本教程中提到的步骤相同。 让我们将 Pandas dataframe 中的文本列转换为可以传递给 Chroma 的 Python 列表。 由于 Chroma 中存储的每个文档还需要字符串格式的 ID ,所以我们将 dataframe 的索引列转换为字符串列表。 本教程演示了如何利用诸如 Chroma 之类的向量数据库来实现检索增强生成(RAG),以通过额外的上下文增强提示。

    1.2K10编辑于 2024-03-27
  • 来自专栏自然语言处理

    【RAG落地利器】Weaviate、Milvus、Qdrant 和 Chroma 向量数据库对比

    关键特性: 按相关分数过滤 单次请求负载多个搜索操作 推荐API 分组操作 全文过滤器搜索 前缀搜索和语义即时搜索 Chroma 简介:Chroma 是一个专门设计用来高效管理和查询向量数据的数据库系统 Chroma 目前不支持分布式架构,适合单机或小规模部署。 5. Chroma 适合快速开发和轻量级应用。 6. Chroma 目前主要支持 Python,适合 Python 开发者。 7. Qdrant 和 Chroma 则适合资源受限或快速开发的项目。

    5.1K13编辑于 2025-01-23
  • 向量数据库选型:从Chroma到Milvus,企业场景怎么选

    五、分阶段选型建议阶段一:POC验证期(0-1个月)使用Chroma。快速验证RAG效果,不用在生产环境花太多时间。数据量小、并发低、部署简单,Chroma完全够用。 当文档量超过5万份、并发用户超过10人时,Chroma的性能瓶颈会开始显现。Qdrant的Docker部署方式成熟,单机版可以支撑百万级向量,运维成本可控。 10万条向量以下的场景,用Chroma或Qdrant更轻量。坑二:选型后才发现不支持过滤很多场景需要在检索时按条件过滤(时间、类别、部门)。 Chroma的过滤能力较弱,Qdrant和Milvus支持更好。坑三:忽视向量维度的影响不同的Embedding模型输出不同维度的向量(768d、1024d、1536d)。 开发测试 → Chroma小规模生产 → Qdrant(或PGVector)大规模生产 → Milvus不想自己运维 → 云托管从Chroma开始,在Qdrant上规模化,到Milvus进阶。

    38210编辑于 2026-05-06
  • 来自专栏DeepHub IMBA

    向量数据库对比:Pinecone、Chroma、Weaviate 的架构与适用场景

    三种选择:Pinecone 用于生产级规模,Chroma 用于本地原型开发,Weaviate 用于混合搜索。 Chroma:从原型开发开始 Chroma 开源,通过 pip install chromadb 安装,支持本地内存运行或持久化到磁盘,5 分钟内即可搭建一个可用的向量存储。 ids=['id1','id2']) # 查询 results = collection.query(query_texts=['your question'], n_results=5) 但是Chroma Chroma没有悬念。pip 安装,本地运行,零配置,免费。 先用 Chroma 搭建第一个 RAG 系统,日后需要扩展至生产环境,迁移到 Pinecone 或 Weaviate 只需几小时——前提是接口足够干净。

    51710编辑于 2026-04-15
  • 来自专栏福大大架构师每日一题

    chroma 1.0.5 来了!新增图像嵌入支持、日志优化,开发者必看更新

    引言: Chroma 团队近日正式发布了1.0.5 版本,带来了多项性能优化、BUG 修复和新功能增强!无论是垃圾回收机制、日志系统,还是 WAL3 的回归,本次更新都让 Chroma 更加稳定高效。 升级建议 如果你是 Chroma 用户,强烈建议升级到1.0.5版本,以获得更好的性能和稳定性! 升级方式: pip install --upgrade chromadb 结语 Chroma 1.0.5 是一次重要的迭代更新,不仅修复了关键问题,还大幅提升了性能和开发者体验。

    46910编辑于 2025-04-22
  • 来自专栏福大大架构师每日一题

    langserve v0.3.2 更新详解:依赖升级、Python版本调整与Chroma导入优化

    Chroma 导入方式优化 在以下两个示例服务器文件中,Chroma 的导入路径由旧版本的 langchain_community.vectorstores.chroma 更新为新版本的 langchain_chroma server.py • examples/auth/per_req_config_modifier/server.py 修改前: . from langchain_community.vectorstores.chroma import Chroma 修改后: . from langchain_chroma import Chroma 此更改能够提升未来版本兼容性,减少运行时警告。 Chroma 导入路径调整,避免弃用警告。 3. CI 移除 Python 3.8 支持,最低版本提升至 3.9。 4. 贡献者配置文件更新,完善 CLA 流程。 5.

    13810编辑于 2025-12-18
  • 来自专栏AI大模型应用开发炼丹房

    手把手实战:用Chroma+Docker搭建生产级RAG知识库

    norm1, norm2)ps:关于RAG检索增强技术文档,由于文章篇幅有限,我这边整理成了一份2W字技术文档,自行领取《检索增强生成(RAG)》五、向量数据库选型:五大维度对比选型建议:初创项目 → Chroma (轻量级本地部署)企业生产 → Milvus(分布式+高吞吐)云原生方案 → DashVector(免运维)六、Chroma实战:从部署到查询6.1 Docker生产环境部署# 启动带持久化的Chroma 服务docker run -d \ --name chromadb \ -p 8000:8000 \ -v /data/chroma:/data \ chromadb/chroma:latest \ chroma run --path /data6.2 Python客户端操作全流程import chromadbfrom chromadb.utils.embedding_functions import query, candidates)生成阶段:提示工程注入检索置信度:请基于以下内容(可信度{score})回答问题:{context}7.2 性能监控看板注:所有代码测试环境 Python 3.10 + Chroma

    1.5K10编辑于 2025-07-16
  • 来自专栏福大大架构师每日一题

    独家解析Chroma 0.6.3:异步限流、Go并发支持,你的AI应用该升级了!

    引言: “从HNSW内存泄漏修复到分布式多租户支持,Chroma 0.6.3 版本堪称「Bug杀手」!” 作为AI领域最热门的向量数据库之一,Chroma此次更新虽是小版本迭代,却暗藏多项性能炸弹——无论是开发者痛点的UniqueConstraintError兼容性问题,还是Cohere嵌入函数的API适配 ——后端架构师 升级命令: # Docker用户 docker pull chromadb/chroma:0.6.3 # PIP用户 pip install chroma-0.6.3.tar.gz 避坑指南 结语: 这次更新堪称Chroma的“性能分水岭”,无论是AI应用开发者还是企业运维团队,升级后都能感受“飞一般”的体验!你在使用Chroma时遇到过哪些坑? 引用链接 [1] 点击查看: https://github.com/chroma-core/chroma/releases/tag/0.6.3 [2] Chroma 0.6.3新特性: https://

    53720编辑于 2025-03-27
  • 来自专栏前端专精

    从模糊搜索到语义搜索的进化之路——探索 Chroma 在大模型中的应用价值

    2、Chroma 语义搜索的原理 Chroma 语义搜索基于向量嵌入技术,将文本或查询映射到多维向量空间,以下是其基本实现原理: 文本嵌入生成:Chroma 使用大模型将文本转化为嵌入向量 拓展到n维就是: (xi,yi代表空间两个点分别在 i 轴上的两个坐标) 三、如何在项目中应用 Chroma Chroma官方文档:Chroma Docs 1、Chroma 2、安装Chroma(python环境) 首先安装 Chroma 及其依赖的 NLP 模型,确保环境中可以运行预训练的大模型: pip install chroma pip install transformers 3、创建嵌入索引 将文本数据转化为向量并创建索引,这些向量将用于语义相似度的计算: from chroma import Chroma from transformers 3、Chroma 语义搜索与传统搜索的对比 比较维度 传统模糊搜索 Chroma 语义搜索 原理 关键词匹配,编辑距离算法 向量嵌入,语义相似性 理解能力 无法理解上下文 深度语义理解 性能 数据量大时性能下降

    1.3K10编辑于 2025-01-22
  • 来自专栏福大大架构师每日一题

    chroma 1.0.4 重磅发布!全面优化GC系统+增强CLI集成,开发者体验再升级

    Container Registry:ghcr.io/chroma-core/chroma:1.0.4 3. 四、社区互动与反馈 Chroma团队持续倾听开发者声音! 如果你遇到问题或有新需求: • GitHub提交Issue:chroma-core/chroma[1] • 加入Discord社区:Chroma Discord[2] 结语 Chroma 1.0.4 引用链接 [1] chroma-core/chroma: https://github.com/chroma-core/chroma [2] Chroma Discord: https://discord.gg /chroma

    47710编辑于 2025-04-13
  • 来自专栏技术分享

    Chroma 向量数据库:大规模高维向量数据处理的解决方案

    随着大数据和人工智能技术的进一步发展,我们相信 Chroma 向量数据库的应用将会更加广泛。那么,Chroma 向量数据库有哪些主要特性和关键技术呢? 以下是安装 Chroma 向量数据库的步骤:安装 Python:Chroma 是用 Python 编写的,所以首先需要在你的系统上安装 Python。 在终端中输入以下命令:pip3 install chroma验证安装:安装完成后,你可以通过运行以下命令来验证 Chroma 是否已经成功安装:python3 -c \"import chroma; print (chroma. __version__)\"如果一切顺利,这个命令将输出 Chroma 的版本号,这就意味着你已经成功安装了 Chroma。安装完 Chroma 后,你可能会想知道如何使用它来处理向量数据。

    1.8K10编辑于 2024-04-10
领券