首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 沉没成本模型

    沉没成本模型 一、原理 沉没成本模型原理基于经济学中的沉没成本概念,它指的是已经发生且无法回收的成本,如过去的投资、决策或行为所消耗的资源(如时间、金钱、精力等)。 在决策过程中,理性的决策者应当排除沉没成本的干扰,仅基于当前和未来的信息进行决策。 二、出处 沉没成本模型的概念主要源于微观经济学和管理会计,是一个在经济学和商业决策中广泛使用的概念。 三、定义 沉没成本是指由于过去的决策已经发生了的,而不能由现在或将来的任何决策改变的成本。换句话说,它是已经投入且无法回收的成本。 缺点:在实践中,人们往往难以完全摆脱沉没成本的干扰,尤其是当沉没成本较大时,人们可能会因为害怕损失而继续坚持原本不合适的决策。 六、使用场景 投资决策:在评估一个项目的投资价值时,应当排除沉没成本的干扰,仅基于项目未来的收益和成本进行决策。

    36700编辑于 2025-04-05
  • 机会成本模型

    原理 机会成本模型原理基于一个核心概念:在面临多方案择一决策时,被舍弃的选项中的最高价值者是本次决策的机会成本。 出处 机会成本模型最初由奥地利经济学家弗里德里希·冯·维塞尔(Friedrich von Wieser)在其《自然价值》一书中提出。后来,这一概念被广泛应用于经济学和其他学科中。 引伸义 机会成本的引伸义在于提醒我们,在做决策时不仅要考虑当前选择的直接成本和收益,还要考虑因选择当前方案而放弃的其他可能方案的成本和收益。 优缺点 优点: 全面评估:机会成本模型考虑了所有可能的选择方案,从而能够更全面地评估决策的优劣。 理性决策:通过比较不同方案的机会成本,可以帮助决策者做出更理性的选择。 使用场景 机会成本模型适用于各种需要做出选择的场景,包括但不限于: 投资决策:在投资选择中,机会成本可以帮助投资者比较不同投资项目的预期收益和风险,从而选择最优的投资方案。

    46700编辑于 2025-04-05
  • 来自专栏云成本管理

    成本管理方法论(一)——云成本管理模型

    就目前想到的,作者计划按如下大纲来完成这一系列文章: 一、《云成本管理模型》 —— 建立云成本管理基本分析框架 二、《云成本管理之使用管理模型》 —— 具体化使用管理场景下的云成本管理模型 三、《云成本管理之优化管理模型 》 —— 具体化优化管理场景下的云成本管理模型 四、《云成本优化效果测量模型》 —— 分析云成本优化效果不同测量模型及其优缺点 五、《计算资源云成本管理分析》 —— 根据不同云平台下不同类型计算资源的共性及差异 云成本管理模型 对于云成本的管理,我们的基本思路是,要管理或控制某一因素,必须先制定出相应的规则来判定此因素是否符合期望,如果不符合期望,就需要对此因素实施既定的处理措施。 基于上面的思路,引入我们的云成本管理模型: 在此管理模型中,云成本管理活动由四个维度决定,它们分别是: 管理对象 管理时点 判定规则 管理措施 这样,可以将云成本管理定义为: 云成本管理是预先定义管理对象 这样才可以使云成本管理活动形成一个持续的正向反馈闭环。 云成本管理流程 在云成本管理模型中,我们定义了三个管理时点:事前、事中和事后。

    4.1K120发布于 2018-04-11
  • 来自专栏ClearSeve

    C++11内存模型

    最近看了极客时间——《现代C++实战三十讲》中的内存模型与Atomic一节,感觉对C++的内存模型理解还不是很清楚,看了后面的参考文献以及看了一些好的博客,算是基本了解了,根据参考文献整合一下。 Thread-1: Thread-2: x = 100; // A std::cout << x; // B C++11 C++11的内存模型共有6种,分四类。其中一致性的减弱会伴随着性能的增强。 参考链接 【1】C++11中的内存模型上篇 – 内存模型基础 【2】C++11中的内存模型下篇 – C++11支持的几种内存模型 【3】理解 C++ 的 Memory Order 【4】如何理解 C++ 11 的六种 memory order 【5】《现代C++实战三十讲》中的内存模型与Atomic

    1K30编辑于 2022-02-11
  • 精调模型削减文档AI成本90%

    停止为你不会用到的人工智能付费:精调模型的价值每日通过GPT或Claude处理10,000份文档,年成本为5万美元。精调模型:5千美元。相同准确率。更低延迟。数据永不离开你的控制。 为何通用模型可能变得不可靠当某机构于2025年11月推出Gemini 3时,该模型在推理和编码方面创下新纪录,但它移除了像素级图像分割(边界框掩码)。 混合架构: 将90-95%符合标准模式的文档路由到你基础设施上部署的精调模型。这些模型以低成本和高速处理已知模式。 将5-10%的异常文档(不寻常格式、缺失字段、模糊内容)路由到前沿模型API或人工审核。这既保持了成本效率,又维持了对边缘情况的覆盖。精调一个轻量级的270亿参数模型如今成本低于10美元。 在自有硬件上进行推理,其成本随处理量增加而增加的边际成本仅为电费。一个每日处理10,000份文档的系统,本地部署的年成本约为5千美元,而使用前沿模型推理则为5万美元。最后思考前沿模型将持续改进。

    5510编辑于 2026-04-09
  • 来自专栏张善友的专栏

    Semantic Kernel 通过 LocalAI 集成本模型

    本文是基于 LLama 2是由Meta 开源的大语言模型,通过LocalAI 来集成LLama2 来演示Semantic kernel(简称SK) 和 本地大模型的集成示例。 SK 可以支持各种大模型,在官方示例中多是OpenAI 和 Azure OpenAI service 的GPT 3.5+。今天我们就来看一看如何把SK 和 本地部署的开源大模型集成起来。 它允许你在消费级硬件上本地或者在自有服务器上运行 LLM(和其他模型),支持与 ggml 格式兼容的多种模型家族。不需要 GPU。LocalAI 使用 C++ 绑定来优化速度。 可参考官方 Getting Started 进行部署,通过LocalAI我们将本地部署的大模型转换为OpenAI的格式,通过SK 的OpenAI 的Connector 访问,这里需要做的是把openai 我们想使用Azure,OpenAI中使用Microsoft的AI模型,以及我们LocalAI 集成的本地大模型,我们可以将它们包含在我们的内核中。

    1.1K10编辑于 2024-01-26
  • 来自专栏iRF射频前端产业观察

    BOM 分析: iphone12 成本比 iphone 11 高 21%

    2021年1月5日 · iPhone 12 与128GB NAND 闪光灯的混合材料成本接近 415 美元,比 iphone 11 增加了 21% 。 根据计数器组件研究实践的最新材料清单(BOM)分析,生产128GBiPhone 12毫米波(毫米波)智能手机将使苹果花费高达431美元,比iPhone11高出26%。 尽管由于简化的射频设计,可节省超过 27 美元的成本,但海外市场仅 6GHz 以下型号的 BOM 成本仍增加了 18%。 鉴于 5nm 晶圆成本高得多(几乎是 7nm 的两倍),仅应用处理器估计成本就增加了 17 美元以上。 增加成本,实现 5G iPhone 12 配备了更多的射频组件,以支持5G相关频谱。我们的分析显示,RF 子系统的混合成本增加约为 19 美元。

    89720编辑于 2022-05-16
  • 来自专栏LINUX阅码场

    深入理解C11C++11内存模型

    个人认为,内存模型表达为“内存顺序模型”可能更加贴切一点。 2011年发布的C11/C++11 ISO Standard为我们带来了memory order的支持, 引用C++11里的一段描述: The memory model means that C++ code C11/C++11使用memory order来描述memory model, 而用来联系memory order的是atomic变量, atomic操作可以用load()和release()语义来描述 C11/C++11内存模型 C/C++11标准中提供了6种memory order,来描述内存模型[6]: enum memory_order { memory_order_relaxed, - Frank Birbacher [ACCU 2017] C++11中的内存模型下篇 - C++11支持的几种内存模型 memory ordering, Gavin's blog c++11 内存模型解读

    2.9K30发布于 2020-06-04
  • 来自专栏AI 大数据

    DeepSeek 模型成本效益深度解析:低成本、高性能的AI新选择

    摘要在人工智能领域,成本效益分析是开发者在选择模型时的重要考量因素。本文将从模型训练、部署、维护等全生命周期的角度,对DeepSeek模型成本效益进行详细分析,并与其他模型进行对比。 DeepSeek作为新兴的AI模型,以其高效的性能和低廉的成本引起了广泛关注。然而,开发者在选择使用DeepSeek模型时,需要全面了解其在训练、部署和维护等方面的成本效益,以及可能遇到的实际问题。 DeepSeek模型成本效益分析模型训练成本DeepSeek模型在训练过程中,通过以下创新实现了成本的显著降低:高效模型架构设计:DeepSeek采用了优化的模型架构,减少了计算资源的消耗。 相比传统模型,DeepSeek的单位token训练成本下降了78%,显著提升了成本效益。 与其他模型的对比与其他主流模型相比,DeepSeek在成本效益方面具有明显优势。例如,OpenAI的模型训练成本高达数百万美元,而DeepSeek通过优化,仅需不到600万美元即可完成训练。

    1.3K00编辑于 2025-03-19
  • 来自专栏AI分享

    GPU实战:低成本运行多模态大模型

    随着多模态大模型(如视觉-语言模型、文本-音频生成模型等)的快速发展,企业对高效、低成本的算力需求日益迫切。 无服务器 GPU 服务结合其弹性扩展和按需付费的特性,为开发者提供了部署多模态大模型的理想平台。本文将从实战角度,探讨如何基于 无服务器 GPU 基础设施,低成本运行多模态大模型。 平台还提供自动化的模型蒸馏服务,支持将千亿参数模型压缩至原体积的 1/10 并保持 98% 的精度,显著降低推理成本。 实际测试表明,该方案在训练1.6万亿参数的视觉-语言模型时,较传统架构减少63%的训练耗时,同时通过Spot虚拟机竞价策略降低61.8%的TCO(总拥有成本)。 无服务器 GPU 通过弹性资源、精细化成本控制和多模态工具链,为开发者提供了高效运行大模型的解决方案。

    4.5K11编辑于 2025-04-14
  • 来自专栏AI SPPECH

    模型进入“推理成本时代“

    通过OpenAI GPT-5级模型的推理开销分析,本文将指导读者构建个人成本估算模型,对齐一线云厂商招聘中的"成本意识"需求。 1. 技术深度拆解与实现分析 3.1 推理成本的核心构成 推理成本主要由以下几个部分构成: 成本构成 占比 主要影响因素 显存占用 90% 模型规模、上下文长度、Batch Size 计算资源 7% 模型复杂度 实际工程意义、潜在风险与局限性分析 5.1 实际工程意义 成本优化:通过vLLM的PagedAttention技术,云厂商可以将推理成本降低50%以上,对于大规模部署的模型服务,每年可节省数百万美元的成本 # 示例:GPT-5级模型(10T参数,模型大小约20GB)的推理成本估算 model_size_gb = 20 context_length = 1000000 requests_per_second vLLM 0.5+ CUDA 12.0+ 关键词: vLLM, 推理成本, PagedAttention, 大模型推理, 显存管理, Continuous Batching, 混合专家模型

    86810编辑于 2026-01-19
  • 任务分解与小模型如何降低AI成本

    任务分解与小型语言模型如何让AI更经济生成式AI应用的广泛使用增加了对准确、经济高效的大型语言模型需求。 LLM的成本因其规模差异显著,通常以参数数量衡量:切换到更小规模的模型通常可节省70%-90%成本成本与复杂度的思维模型决定是否使用任务分解的一个有用思维模型是考虑应用程序的估计总拥有成本。随着用户群的增长,基础设施成本变得主导,而任务分解等优化方法可以降低TCO,尽管存在前期工程和科学成本。 对于较小的应用程序,选择大型模型等更简单的方法可能更合适且更具成本效益。平衡创新与简化任务分解和使用小型LLM创建代理工作流可能以牺牲更强大模型通常展示的新颖性和创造性为代价。 使用多个、更小、精细调整的LLM进行任务分解为提高复杂AI应用的成本效率提供了一种有前景的方法,与使用单一大型前沿模型相比,可能提供显著的基础设施成本节约。

    21710编辑于 2025-10-17
  • 来自专栏云云众生s

    Kubernetes+大模型:Cast AI解决成本难题

    Cast AI 利用其在 Kubernetes 自动化方面的专业知识,使 DevOps 和 AIOps 团队能够找到性能和成本最佳的 AI 模型。 该供应商在四月推出了其 AI 优化器服务,该服务通过与任何与 OpenAI 兼容的 API 端点集成并识别 LLM(商业和开源)来自动降低部署大型语言模型 (LLM) 的成本,从而为最低的推理成本提供最佳性能 在一篇博文 中,该公司产品营销总监指出,OpenAI 的 LLM 模型的定价页面 有 10 页长,至少有 20 种不同的模型,用于不同的用例和定价模型。 仪表板和Playground AI Enabler包含一个用于监控成本的仪表板,并创建一个报告,比较使用默认LLM与利用其他模型的支出。 他写道:“LLM代理智能地选择最优的LLM模型来处理用户查询,确保组织以最低的成本获得最佳性能。”“这种方法通过选择和执行具有较低推理成本的优化LLM来实现最大限度的节省。”

    30710编辑于 2024-11-28
  • 来自专栏Oracle数据库技术

    Oracle优化器成本的估算(10053 Trace中基于CPU成本模型的内容解析)

    优化器成本的估算(基于CPU成本模型) 对于优化器成本的估算是一个复杂的过程,涉及到大量的的理论和内部操作。 Oracle对于成本的预估模型,也可以分为两种: CPU成本模型 :参考系统统计信息进行成本估算。 I/O成本模型 :仅通过I/O的次数进行成本估算。 成本模型的选择通过_optimizer_cost_model隐含参数控制。 - CHOOSE:默认值,这时候如果有系统统计信息的话会使用CPU成本模型 ,如果没有系统统计信息的话会使用I/O成本模型 。 - IO :使用基于I/O成本模型 。 - CPU :使用基于CPU成本模型 。 对于我们这个例子,是有系统统计信息的,并且使用的是没有负载的系统统计信息(NOWORKLOAD),所以使用的是基于CPU的成本模型计算访问表的成本

    87520编辑于 2022-08-22
  • 多租户模型推理成本追踪方案解析

    多租户模型推理成本追踪方案解析技术背景通过AI应用服务多租户的组织面临共同挑战:如何跨客户细分跟踪、分析和优化模型使用。 某机构的基础模型(FMs)通过Converse API提供强大能力,但真正的商业价值在于将模型交互与特定租户、用户和使用场景关联。 管道处理调用日志自动分类失败日志到专用存储桶使用爬虫程序更新数据目录分析层:基于Amazon QuickSight构建可视化仪表盘支持按租户/部门/时间等多维度分析实现token用量、延迟等关键指标监控权限控制:通过IAM实现细粒度数据访问管理确保租户数据隔离关键功能成本分配 :精确追踪每个租户的模型使用成本性能优化:识别不同租户的使用模式差异异常检测:监控异常使用行为和突发流量实施建议从核心租户标识开始实施元数据跟踪逐步扩展分析维度(部门/项目/地域)建立自动化预算告警机制定期优化数据转换逻辑架构优势无需修改核心应用逻辑即可实现细粒度追踪支持从数十到数百万租户的弹性扩展提供实时和历史数据分析能力该方案已在实际业务场景中验证 ,可帮助组织降低15-30%的AI运营成本,同时提升资源分配效率。

    21510编辑于 2025-08-10
  • 来自专栏腾讯数据中心

    Google对数据中心成本模型的分析——下

    (接上文《Google对数据中心成本模型的分析——上》) 三、案例分析 虽然变量繁多,但通过观察不同行业的小部分数据中心案例,仍有助于我们理解这些成本因素的影响大小。 四、实际数据中心成本分析 实际上,现实世界里的数据中心成本会都比前面模型中的成本更高,因为前面模型中的数据中心负荷都跑到了100%设计功率,服务器的CPU利用率也非常高,但实际情况是现实生活中这些条件很难同时发生 峰值功率为500W的服务器,实际正常运行的功率往往只有300W,这样服务器的运行功耗负载率只有60%左右,因此每台服务器每月的实际运行成本会比前面的模型中更高。 五、部分负载数据中心的成本模型 对于部分负载数据中心的TCO 建模,我们通过空置率来调整数据中心成本模型中各子项 的占比。 但是,这种节省是值得挑战的,因为减少这些服务器上运行的应用也很可能相应产生更少的应用价值,目前我们的TCO 模型还无法覆盖到这些方面。

    5.8K82发布于 2018-03-16
  • 来自专栏为了不折腾而去折腾的那些事

    中文版大模型 Token 成本计算器

    分享一个轻量的小工具,10MB 左右,能够帮助你直观的了解大模型 Token 的计算方法。希望能够帮助到想了解或者正在规划模型 API 使用成本的你。 /token-calc,默认情况下,程序会输出类似下面的日志:2023/12/28 11:22:15 The PORT environment variable is empty, using the default port: 80802023/12/28 11:22:15 github.com/soulteary/ai-token-calculator has started 当看到类似上面的日志输出时 environment variable is empty, using the default port: 8080ai-token-calculator-web-1 | 2023/12/28 11 ,Token 的计算方式了,某种程度上来看,也是我们的模型 API 使用成本的计算方式。

    2.3K00编辑于 2023-12-28
  • 来自专栏Rust语言学习交流

    【Rust日报】2020-02-11 Rust 零成本的抽象

    Rust 零成本的抽象 零成本抽象的概念对于某些编程语言非常重要,比如 Rust 和 C++,这些语言的目的是使用户能够用相对较少的努力编写具有出色性能的程序。 作者认为他写的这篇文章正确地反映什么是零成本抽象. 实际上,零成本抽象(即“零开销”)是很难理解的, 也很难与其他编译器优化分离开来,并且很容易被误解.

    1K10发布于 2020-02-20
  • 来自专栏云云众生s

    Vercel推出更具成本效益的基础设施模型

    [前端]托管提供商正在放弃边缘计算,转而采用一种名为 Fluid 的新型 Web 应用程序基础设施模型。 Fluid 是一种新的 Web 应用程序基础设施模型,旨在融合服务器和无服务器的最佳特性,同时提供高效的资源利用率,更重要的是,降低 Vercel 客户的成本。 因此,该模型最大限度地提高了资源效率,并且在早期采用者中,成本降低了高达 85%,他补充说。 Fluid 根据实际计算使用量计费,最大限度地减少了浪费,他强调说。 其他 Fluid 功能 Cicirio 解释说,Fluid 还降低了失控执行的风险,而失控执行会推高成本。等待后端响应的函数可以处理其他请求,而不是浪费计算资源。 Rauch 解释说,Vercel 决定不为所有人启用它,因为执行模型略有变化。 “它不需要任何代码更改。我们内置了……缓解措施。

    43610编辑于 2025-02-11
  • 来自专栏设计模式

    深入探索MySQL:成本模型解析与查询性能优化

    在MySQL中,查询优化器使用了一个称为“成本模型”的机制来评估不同执行计划的优劣,并选择其中成本最低的那个。本文将深入探讨MySQL的成本模型,以及如何利用这一知识来优化查询性能。 一、成本模型简介 成本模型是查询优化器用来估算查询执行成本的一组规则和算法。对于给定的查询,优化器会考虑多种可能的执行计划,并使用成本模型来预测每种计划的执行效率。 成本模型会评估使用索引带来的I/O减少与索引维护成本之间的权衡。 连接操作:对于涉及多个表的查询,成本模型会考虑不同连接策略(如嵌套循环连接、哈希连接等)的成本。 生成执行计划:考虑所有可能的执行路径,并使用成本模型评估每种路径的成本。 选择最优执行计划:根据成本模型的估算结果,选择成本最低的执行计划。 三、如何利用成本模型优化查询 了解MySQL的成本模型对于数据库管理员和开发来说是非常有价值的。

    96010编辑于 2024-04-09
领券