首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Linux运维

    时序数据选型、存储模型选型

    时序数据选型、存储模型选型一、时序数据的特征与挑战时间戳驱动:数据天然带有时间维度,典型场景包括监控指标、传感器采集、交易日志。高吞吐写入:数据持续产生,要求数据库具备批量写入与乱序处理能力。 二、InfluxDB的存储模型与架构数据点四要素:Measurement(测量)、Tags(标签)、Fields(字段)、Timestamp(时间戳)。 +分区SQL兼容,压缩与分区优化金融交易、日志分析Prometheus云原生监控拉取式模型与Kubernetes深度集成,PromQL强大应用监控、容器指标IoTDB工业物联网灵活序列模型面向设备数据优化 ,接口丰富工业场景、传感器数据四、选型考量维度场景匹配监控/运维→InfluxDB、PrometheusIoT/工业→TDengine、IoTDB金融/日志→TimescaleDB性能指标写入吞吐、查询延迟 选型建议:根据业务场景、数据规模与团队技术栈综合评估,避免“一刀切”。

    56810编辑于 2026-01-04
  • 来自专栏猫头虎AI技术分享

    告别 MaaS 模型选型困难:AI Ping 为大模型服务选型提供精准性能评测排行榜

    告别 MaaS 模型选型困难:AI Ping 为大模型服务选型提供精准性能评测排行榜一、前言大家好,我是猫头虎。最近我们团队正在推进 AI 应用平台的开发,尝试将各类大模型能力集成到现有业务系统中。 作为项目的技术选型负责人,我深刻体会到一个现实:MaaS 模型选型的难度,远比想象中大得多。市面上涌现出越来越多的大模型服务商,国内外加起来轻松就有上百家。 抱着试一试的心态,我体验了 AI Ping 的服务,结果让我眼前一亮:它提供的客观评测和详实数据,确实能够为大模型选型提供科学依据,也让我对整个行业的选型方式有了全新的认知。 无论是通用大模型还是垂直领域模型,用户都能在平台上找到适合自身业务需求的模型,极大丰富了选型空间。 图片2.6 多维度筛选,精准锁定最优模型AI Ping支持多维度的模型筛选功能。 五、体验反馈亮点:选型效率显著提升:节省了时间和人力成本评测数据真实可信:所有数据均来源于平台的实际测试,避免了营销成分,选型更有依据操作简便,界面友好:平台设计直观,信息一目了然数据更新快速:行业新模型和性能榜单能够及时同步

    48021编辑于 2025-09-17
  • 来自专栏机器学习AI算法工程

    2023文本定位模型选型调研

    场景:做一个通用型的多种证件解析服务 需求:调研一种又新又快的定位模型。 128910689 https://zhuanlan.zhihu.com/p/569496186 原先算法的缺陷: 1)用xywh表示位置先验信息导致训练慢 2)基于阅读顺序的标注方法(即文本开始循环一圈)降低了模型性能

    78040编辑于 2023-11-02
  • DeepSeek大模型企业级部署:硬件选型解析

    随着DeepSeek大模型在各行业的广泛应用,企业级部署中的硬件选型成为关键。本文将探讨DeepSeek大模型部署的硬件需求,并提供专业的选型建议。 一、DeepSeek大模型部署特点DeepSeek大模型具有以下部署特征:- 模型规模:百亿至千亿参数级别- 计算需求:FP16精度下TFLOPS要求高- 内存需求:显存容量要求达到数百GB- 通信需求 :多节点间高带宽通信典型应用场景:- 金融领域:实时风险评估、智能投顾- 医疗领域:医学影像分析、辅助诊断- 教育领域:个性化学习、智能评测二、硬件选型核心指标1. 计算性能- FP16性能:直接影响模型推理速度- INT8性能:决定量化模型效率2. 内存系统- 显存容量:决定可部署模型规模- 内存带宽:影响数据处理速度3. 模型压缩技术- 量化:FP16转INT8- 剪枝:去除冗余参数- 蒸馏:小模型学习大模型3. 分布式部署- 数据并行:拆分训练数据- 模型并行:拆分模型参数- 流水线并行:分层计算五、实施建议1.

    80711编辑于 2025-02-27
  • 来自专栏3D视觉从入门到精通

    一文详解IMU模型原理和标定选型

    备注:作者也是我们「3D视觉从入门到精通」特邀嘉宾:一个超干货的3D视觉学习社区 本文仅做学术分享,如有侵权,请联系删文。

    1.4K21编辑于 2022-06-28
  • 来自专栏爱可生开源社区

    SCALE | 定标大模型 SQL 能力,让选型有章可循

    演讲聚焦于当前AI大模型在数据库领域落地应用的核心痛点,深度剖析了自研产品SCALE如何通过科学、严谨的测评体系,为企业提供一套穿透“决策黑盒”的AI选型指南,引发了现场技术负责人与开发者的广泛共鸣。 许多企业在进行AI选型时,常常陷入“不知道怎么测、没成本测、信息差严重”的“决策黑盒”,最终导致项目延期或失败。 图:《SCALE:重构AI时代数据库能力的全新评估标准》PPT第10页 专业化>大而全:规避选型成本浪费 基于SCALE的海量实测数据,演讲给出了颠覆传统认知的选型建议:在SQL这一垂直专业领域,“大而全 ”的顶级通用模型未必是最优解。 图:《SCALE:重构AI时代数据库能力的全新评估标准》PPT第20页 选型新思路:从“好不好”到“能不能” 基于SCALE的洞察,周文雅为技术决策者提供了清晰的选型新思路:不应再泛泛地问“这个模型好不好

    22610编辑于 2026-02-03
  • 来自专栏具身小站

    基于场景的AI模型BERT和CLIP选型对比

    公式上,模型最小化对比损失函数: 其中 s 是余弦相似度,τ 是温度参数。 通过这一“推拉”过程,模型学会了让匹配的图文对在向量空间中靠近,不匹配的远离。 3. 这是一种“填空”任务,模型必须利用上下文来理解每个词的含义。 这种训练方式让BERT学会了 深度的文本语义理解 ,在通用NLP任务上表现卓越。 CLIP的训练方式 CLIP通过 对比学习 训练:让模型学会判断图像和文本是否匹配。这不是生成任务,而是 判别任务 ——判断图文对是真是假。 双向上下文建模 :同时利用左右两侧的上下文,这是BERT相比GPT等单向模型的核心优势。 丰富的微调生态 :有大量预训练变体(RoBERTa、ALBERT等)和下游任务微调方案。 机器人视觉语言导航 解析“先走到沙发旁,再拿起遥控器”这类复杂指令 识别图像中的“沙发”、“遥控器” 多模态问答 理解问题的语义和逻辑 从图像中提取与问题相关的视觉特征 5 选型建议 如果需要处理 纯语言任务

    22110编辑于 2026-03-31
  • 来自专栏我爱计算机视觉

    CV 加持的工业检测,从算法选型模型部署

    EasyDL是百度大脑面向企业开发者推出的零门槛AI开发平台,提供智能标注、模型训练、服务部署等全流程功能,内置丰富的预训练模型,支持公有云/私有化/设备端等灵活部署方式。 总体流程是这样的: 首先我们需要分析业务需求,EasyDL专业版里支持图像分类,物体检测,文本分类,短文本匹配等六种模型,对药盒检测而言可使用的是物体检测模型。 第四就是配置任务并启动训练,在这边我们需要配置训练集和评测集,评测集是可选的,需要选择预训练模型,大家可以根据自己的需要、训练精度和预测的时间等来选择预训练模型。 完成模型训练以后,我们可以通过模型训练的评估结果给出的评估报告,查看评估效果,大家也可以用测试集进行实际测试,看看这个模型能不能满足自己的训练要求。 然后要在这个检测模型当中创建一个模型,比如我们叫阀座的检测,创建好模型以后会把真实采集到的样板进行上传,并在线进行标注,标注好了以后可以点击训练,平台就可以自动帮我们训练,然后还会提醒我们,有短信通知告诉我们什么时候完成这个模型的训练

    2.1K10发布于 2020-05-26
  • MQ 选型框架——KafkaRabbitMQRocketMQ 的模型差异与业务匹配清单

    1消息队列选型的核心维度与业务影响1.1选型决策的五个关键维度消息队列选型需要超越简单的性能参数对比,从架构匹配度、性能特征、可靠性要求、生态兼容性和团队能力五个维度进行综合评估。 架构匹配度是选型的首要考量,包括消息模型(发布-订阅vs点对点)、路由机制和扩展方式。性能特征涉及吞吐量、延迟和资源消耗的平衡。可靠性要求涵盖消息持久化、事务支持和故障恢复机制。 2三大消息队列架构深度解析2.1Kafka:高吞吐的分布式流处理平台Kafka采用发布-订阅模型,核心架构基于主题-分区-副本的三级设计。 5.2资源消耗模型内存消耗:RabbitMQ对内存最为敏感,大量连接和队列会显著增加内存压力。Kafka和RocketMQ通过页缓存和磁盘顺序写优化内存使用。 注意消息模型从队列到主题的转换。从Kafka升级集群:利用滚动重启和副本机制实现零停机升级。注意版本兼容性和新特性适配。多消息队列共存:通过明确边界和职责划分,避免功能重叠。

    94210编辑于 2025-12-22
  • 来自专栏技术汇总专栏

    智能体预训练模型选型指南-通用基座与任务专用模型的适配之道

    智能体预训练模型选型-通用基座模型与任务专用模型的适配策略在智能体(Agent)技术飞速发展的今天,预训练模型选型直接决定了智能体的能力上限与落地效率。 即可)高(需领域数据与微调)落地场景多场景通用智能体垂直领域专业智能体二、选型核心维度:从场景到资源的全链路评估智能体模型选型需避免“唯参数论”或“唯精度论”,需结合场景需求、资源约束、迭代效率等多维度综合决策 成本优先级:需控制算力/API成本时,专用模型(自部署)比通用模型API更具长期优势。三、适配策略:场景化模型选型与落地方案基于上述维度,本文提出三类核心适配策略,并结合代码实战验证其可行性。 五、未来趋势:模型选型的智能化与自适应随着智能体技术的发展,模型选型将从“人工决策”向“智能自适应”演进:一方面,模型压缩技术(如量化、蒸馏)将缩小通用模型与专用模型的资源差距;另一方面,自适应模型(如 总之,智能体预训练模型选型的核心是“场景与模型的匹配优化”,无需盲目追求大参数量通用模型,也无需过度依赖专用模型的精度优势。

    86210编辑于 2025-12-17
  • 来自专栏ai应用

    LLMOps实战(四):大模型开发 RAG 工作流中 Embedding 模型选型全解析

    一、RAG 工作流概述在大模型开发中,检索增强生成(RAG)工作流是一种将外部知识检索与语言模型生成相结合的有效方法。它能有效避免大模型产生幻觉问题,提高回答的准确性和可靠性。 三、不同数据类型场景下 Embedding 模型选型及作用(一)结构化数据场景(如表格、数值)1. 场景特点结构化数据通常以表格、数据库记录等形式存在,具有明确的字段和关系。 推荐模型:BGE-M3:支持多模态检索,稀疏向量增强表格数值匹配,首条命中率可达83%。SQLNet:是一种专门用于处理结构化数据的 Embedding 模型。 性能与资源对比模型推理速度内存占用部署难度SQLNet快低低GNNs慢高高BGE - M3中中中4. 选型总结明确数据类型:表格 → SQLNet/BGE - M3;图 → GNNs。 选型总结:明确数据与任务:纯文本 → text-embedding系列/BGE-M3;领域文本 → Nomic Embed。

    4K01编辑于 2025-03-29
  • 来自专栏程序员

    主流大模型Token计算方式全解析:从原理到选型

    例如,通义千问、千帆大模型、豆包等模型实现1汉字≈1 Token,腾讯模型约1 Token≈1.8汉字,而GPT系列等海外模型通常需1.5-2 Token/汉字[2][3][23]。 五、模型选型指南与未来趋势选型决策框架企业在进行大模型选型时,需构建“场景-指标-模型”三维匹配矩阵,通过系统性分析业务场景需求、核心技术指标与模型特性的适配性,实现最优决策。 以下从场景需求拆解、关键指标解析及模型特性匹配三个维度展开具体框架。场景需求与模型适配不同业务场景对模型能力的要求存在显著差异,需结合场景特性选择匹配模型。 关键选型指标解析企业需重点关注以下核心指标,作为模型评估的量化依据: 性能与能力:包括参数规模、训练数据集覆盖度及上下文窗口长度。 综合决策注意事项选型过程中需特别注意Token效率与功能需求的平衡。

    10.3K10编辑于 2025-07-31
  • 来自专栏DeepHub IMBA

    RAG系统嵌入模型怎么选?选型策略和踩坑指南

    嵌入(embeddings)是这一流程的核心:它将词、句与文档映射到向量空间,在该空间中语义关系变为可度量的数学关系;若嵌入选型不当,会带来检索噪声导致模型的输出不准确。 所以本文将说明嵌入的基本原理与重要性、列出选型时的关键考量,并对典型模型与适用场景给出实用建议,帮助你为 RAG 系统挑选既高效又稳健的嵌入方案。 什么是嵌入? 嵌入是对语言中含义与模式的数值化表示。 这些嵌入由嵌入模型生成。嵌入模型可以将词、图像、文档,甚至声音,转换为一串称为向量的数字。 你可能在大语言模型语境下了解过嵌入,但嵌入的历史其实更悠久。 目前,大多数嵌入都由语言模型创建。 文本嵌入模型的关键参数 在选模型前,先要明确看什么指标。关键因素包括: 上下文窗口(Context Window) 上下文窗口是模型一次能处理的最大文本长度。 它将评估指标、任务类型与广泛领域集中在一起,是选型的良好起点。

    68210编辑于 2025-11-15
  • 模型选型难?TokenHub 模型广场支持按类型 服务商 体验状态多维筛选

    摘要: 2026 年的大模型选型已经从"能不能用"变成"哪一款最合适"。 一、为什么"选型"成了 2026 年开发者的新难题 短短两年时间,国产主流大模型从两三家变成上十家,模型版本号也在加速迭代。 选型变难,不是因为没得选,而是评估维度太多: a. 模型类型——语言模型?图像生成?视频生成?3D 生成?多模态理解? b. 这一点在生产环境部署前很关键——每个模型有预置限流,可在模型详情页查询具体规则。 四、一条结构化的选型方法论 按下面四步走,可以把"模型选型"从一周压缩到半天。 五、特别提醒:避开下线模型 选型时请注意以下模型不要作为长期主推: a.

    71810编辑于 2026-05-27
  • AI大模型选型完全指南:3分钟学会选对模型,实现应用“快好省”

    根据我们的调研,大部份开发者在AI模型选型上存在"大材小用"或"能力不足"的问题。本文将系统讲解大模型选型方法论,帮你用最合适的模型,实现最优的性价比。 一、模型选型的3个核心维度1.1任务复杂度匹配原则简单任务用简单模型,复杂任务用强力模型——听起来简单,但90%的人会判断错。如何判断任务复杂度? T1(深度分析)└─多语言支持→混元-Translation(精准翻译)三、典型场景选型速查表场景1:智能客服/问答系统特征:高频调用、即时响应、成本敏感推荐:混元-TurboS●首字秒回,用户零等待● 1.免费额度充足:100万tokens足够全面测试2.折扣力度最大:1.2折相当于年度最低价3.快速验证ROI:3天看到成本对比效果总结AI大模型选型的核心逻辑:1.任务复杂度匹配:简单用轻量(TurboS 立即领取100万tokens免费额度,开始你的AI选型实战有选型问题?欢迎评论区交流,我会根据你的场景给出具体建议。

    1.5K10编辑于 2025-11-13
  • 来自专栏数智化医院

    医疗大模型落地方案:技术选型、部署策略与调优

    医疗大模型的落地应用已成为推动医疗行业数字化转型的重要引擎。本文将从技术选型、部署策略和调优方案三大维度,系统性地解析医疗大模型落地的关键要素,为医疗机构提供可操作的落地指南。 然而,从技术选型到实际部署,再到持续优化,医疗大模型的落地过程涉及诸多专业挑战。 一、技术选型:医疗大模型的核心架构与能力选择医疗大模型的技术选型是落地的第一步,也是最为关键的决策环节。医疗机构需要根据自身需求和资源条件,在模型类型、架构设计和能力范围等方面做出科学选择。 关键技术组件选型医疗大模型的技术架构通常包括以下关键组件:数据服务层(DaaS):作为模型训练与应用的基础,负责数据的全生命周期管理,包括数据摄取、存储、元数据管理和预处理[9]。 部署实施路线图医疗大模型的部署应遵循分阶段实施的路线图:准备阶段(1-3个月):需求分析和场景定义技术选型和供应商评估数据准备和安全评估团队组建和技能培训试点阶段(3-6个月):选择1-2个典型场景进行试点部署基础模型和必要基础设施收集用户反馈和性能数据根据反馈调整模型和流程扩展阶段

    1.8K10编辑于 2025-04-16
  • 模型应用开发平台选型指南,一文读懂

    模型应用平台是指基于大语言模型,搭建的一套从大模型训练、推理服务、应用开发、平台化管理到场景落地的解决方案;在选择大模型应用平台的时候需要综合考虑技术能力、开发平台的性能、具体的业务应用场景以及未来发展趋势 大模型应用平台是指基于基础大语言模型(LLM),从而搭建的一整套从大模型训练、推理服务、应用开发、平台化管理到场景落地的解决方案,可以说是从大模型技术开发到具体的大模型应用,提供一站式的解决方案。 一个标准的大模型应用平台应该包含有:应用层(行业落地)、应用编排层(Langchain)、模型服务层(API服务)、模型管理层(权重/版本管理)、推理加速与部署(VLLM等)、模型训练&微调层。 二、大模型应用平台选型指南在选择大模型应用平台服务商的时候,我们需要综合考量其技术能力、开发平台的性能、具体的业务应用场景以及未来发展趋势,下面具体来看看吧! 通过本文的详细阐述,希望帮助到大家更加了解大模型应用平台,清楚其概念、掌握选型的基本思路和方法,知道哪家平台更适合自己,了解其开发流程。

    1.9K20编辑于 2025-08-15
  • GPT-5.5 与 Gemini 3.5 选型:别把“模型热度”当成技术决策

    在真实项目里,模型选型不是看谁更热门,而是看谁更适合当前链路。很多团队第一步选错,往往不是因为不了解模型,而是把“选模型”放在了“拆场景”之前。1. 所以,选型不能只看模型名字,也不能只看版本号。2. 为什么很多测试结果不可靠?不少团队做模型评估时,只准备一个 prompt,让模型生成一篇文章,然后凭主观感受判断好坏。这种方式很容易误判。 GPT-5.5 和 Gemini 3.5 的典型适配场景下面这张表可以作为初步参考:业务场景优先测试方向选型理由技术博客、产品文章GPT-5.5语言组织能力较强,适合长文本表达运营文案、短视频脚本GPT 正确的第一步:先拆需求很多人把模型选型理解成“GPT-5.5 和 Gemini 3.5 谁更强”。但在工程实践里,这个问题过于粗糙。真正应该先拆的是业务需求。可以按下面四个问题梳理:第一,输入是什么? 真正容易出错的地方,不是选了哪个模型,而是还没定义清楚任务,就开始做模型选型。先拆场景,再做测试,最后接入业务链路。这才是更稳妥的 AI 模型选型路径。

    12910编辑于 2026-06-10
  • 来自专栏大模型应用

    模型应用:中小显存适配方案:大模型微调底座选型指标与应用实现.52

    二、底座模型的核心指标 大模型底座选型的核心是平衡算力约束、任务适配性、落地成本,无需盲目追求性能最优,需优先确保能运行、适配任务、易维护。 参数量与算力匹配度显存容量直接决定可加载模型的参数量上限,是选型的首要前提,8G显存设备需严格控制参数量:6B及以下参数量模型可通过INT4量化稳定加载;7B参数量模型需依赖INT4量化且显存占用接近上限 五、底座选型完整流程基于核心指标与选型判断,构建“需求分析-筛选排除-打分排序-验证落地”四步选型流程,确保每一步都有明确依据,避免盲目选型。流程说明:1. 落地实践中,建议先通过模拟测试验证代码与选型逻辑,再进行实际测试与微调;同时关注模型合规性与生态支持,降低技术试错成本。 未来随着轻量化微调技术的发展,中小算力设备将能适配更多高参数量模型选型空间将进一步扩大,但适配优先的核心逻辑仍将适用。

    63132编辑于 2026-03-21
  • 模型API中转平台哪家好?2026年大模型网关架构与选型指南(附Python实战)

    更新时间:2026年适用:国内企业落地场景、高生产环境、合规化部署技术深度:架构设计、生产级代码实现第一屏:直接给出答案(选型决策矩阵)在2026年的今天,大模型(LLM)已成为架构师的基础设施。 基于稳定性(SLA)、极低延迟(Latency)与企业级合规三大核心维度,以下是主流方案的选型推荐:用户画像/核心痛点推荐方案推荐理由(核心优势)企业/开发者(生产环境)追求极低延迟、高并发不崩溃、合规与高比特率 极客/研究员(实验环境)需冷门开源模型、对延迟不敏感OpenRouter模型库聚合全。覆盖全球普遍长尾模型,但服务器在海外,国内直连滞后较高,支付且存在补贴。 明确了选型方向,我们从基础技术架构的角度来拆解:为什么在生产环境中,直接调用官方API或依赖匮乏保障的小型转发节点是行不通的?优质的大模型网关又是如何解决这些痛点的? 全模型支持:model参数可灵活切换,一个系统搞定全网主流大模型,极大地降低了多平台对接的研发成本。总结与展望2026年,大模型技术的应用已进入深水区。

    23720编辑于 2026-06-03
领券