搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Juicedata
BentoML：如何使用 JuiceFS 加速大模型加载？
为了解决这一问题，BentoML引入了JuiceFS。 01 BentoML 简介以及 Bento 的架构在介绍模型部署环节的工作之前，首先需要对 BentoML 是什么以及它的架构做一个简要的介绍。 BentoML 还支持多种框架训练出来的模型，包括 PyTorch、TensorFlow 等常用 ML 框架。起初，BentoML 主要服务于传统 AI 模型，但随着大型语言模型的兴起，如 GPT 的应用，BentoML 也能够服务于大语言模型。挑战 3：数据安全性问题这是将 Bento 部署到云上的主要原因之一，也是 BentoML 提供给用户的核心价值之一。
62010编辑于 2024-02-22
来自专栏深度学习与python
BentoML：如何使用 JuiceFS 加速大模型加载？
为了解决这一问题，BentoML 引入了 JuiceFS。 1 BentoML 简介以及 Bento 的架构在介绍模型部署环节的工作之前，首先需要对 BentoML 是什么以及它的架构做一个简要的介绍。 BentoML 还支持多种框架训练出来的模型，包括 PyTorch、TensorFlow 等常用 ML 框架。起初，BentoML 主要服务于传统 AI 模型，但随着大型语言模型的兴起，如 GPT 的应用，BentoML 也能够服务于大语言模型。挑战 3：数据安全性问题这是将 Bento 部署到云上的主要原因之一，也是 BentoML 提供给用户的核心价值之一。
41610编辑于 2024-03-18
来自专栏网络安全技术点滴分享
BentoML会话Cookie漏洞（CVE-2025-54381）分析工具
BentoML会话Cookie漏洞（CVE-2025-54381）分析工具项目描述本工具用于分析和复现BentoML框架中的关键安全漏洞（CVE-2025-54381）。该漏洞存在于BentoML版本0.15.0及更早版本中，由于使用硬编码的会话cookie密钥（_bento_session），攻击者可以生成有效的会话令牌，从而绕过身份验证机制直接访问受保护的API端点：python exploit_bentoml.py使用说明基础使用示例以下是使用该工具检测BentoML漏洞的基本示例：# 导入必要的模块import requestsimport hashlibimport 会话Cookie生成器def generate_bentoml_session(): """ 生成BentoML的有效会话cookie 利用硬编码的密钥生成可以绕过认证的会话令牌立即升级到BentoML 0.15.1或更高版本") report.append(" 2.
14210编辑于 2026-01-21
来自专栏网络安全技术点滴分享
BentoML 关键SSRF漏洞 (CVE-2025-54381) 深度剖析与防护指南
安装与版本检查指南如果您正在使用BentoML，请立即检查您的版本。系统要求Python 环境BentoML 包检查BentoML版本您可以通过以下命令检查当前环境中BentoML的版本：pip show bentoml或在Python脚本中检查：import bentomlprint (bentoml. 解决方案升级BentoML: 立即将BentoML升级到已修复此漏洞的最新版本（例如，1.4.20 或更高版本）。 pip install --upgrade bentoml临时缓解措施: 如果无法立即升级，应考虑在网络层面（如防火墙、Web应用防火墙WAF）阻断从BentoML服务实例发起的、指向内部网络和云元数据端点的出站请求
9810编辑于 2026-02-15
来自专栏OpenMMLab
LLM推理后端性能大比拼，来自BentoML团队的深度评估！
本文翻译自 BentoML 工程团队原文链接：https://www.bentoml.com/blog/benchmarking-llm-inference-backends 选择适宜的推理后端来服务大型语言模型 BentoML 和 BentoCloud BentoML：一个统一的模型服务框架，允许开发者使用任何开源或自定义 AI 模型构建模型推理 API 和多模型服务系统。将 BentoML 与各种推理后端集成以自托管 LLM 非常简单。BentoML 社区在 GitHub 上提供了以下示例项目来协助您完成整个过程。： https://github.com/bentoml/BentoLMDeploy BentoTRTLLM： https://github.com/bentoml/BentoTRTLLM BentoTGI ： https://github.com/bentoml/BentoTGI 5.
4K20编辑于 2024-06-17
来自专栏数据科学和人工智能
原创翻译 | 机器学习模型服务工具对比：KServe,Seldon Core和BentoML
BentoML 使用BentoML可以归结为实现一个自定义Python类，该类继承自框架的类，这意味着可以使用任何Python框架。 BentoML 由于使用BentoML需要实现Python代码，因此可以使用它进行任何定制。 BentoML 由于BentoML是一个代码优先的框架，它不提供任何自动缩放功能，因为它们完全依赖于所选的运行时（BentoML可以部署到KServe、Seldon Core、SageMaker端点和许多其他云解决方案 BentoML 只支持HTTP（GRPC似乎处于过时状态）。同样，由于BentoML是代码优先的，所以处理任何类型的请求都是可能的。 BentoML BentoML依赖于所选的部署目标，因此在该领域不考虑它，因为它可能会在低到高的工作强度之间变化。
2.8K22编辑于 2022-06-27
来自专栏网络安全技术点滴分享
BentoML高危SSRF漏洞CVE-2025-54381分析：原理、影响与核心代码
项目标题与描述CVE-2025-54381 – BentoML高危SSRF漏洞分析CVE-2025-54381是一个存在于BentoML（一个用于打包、运送和部署机器学习模型的Python框架）中的严重服务器端请求伪造安装指南（受影响的软件版本）受影响的软件: BentoML受影响版本:所有从 1.4.0 到并包括 1.4.19 的版本。使用说明（漏洞利用方式）该漏洞的利用关键在于构造恶意请求，诱骗BentoML服务器访问内部或受限制的资源。基础利用示例攻击者可以向部署的BentoML服务API发送一个特制的请求，其中文件输入字段包含一个指向内部服务的URL。核心代码以下是模拟漏洞核心逻辑的简化代码，展示了BentoML在处理URL文件输入时未进行验证的关键步骤。
13110编辑于 2026-01-12
来自专栏云云众生s
开发基于云的RAG应用，使用开源 LLM
这些工具包括： BentoML: BentoML 是一个开源平台，简化了机器学习模型的部署到生产就绪的 API，确保可扩展性和易于管理。在 BentoML 上部署模型 ... 您的数据已准备就绪，下一步是在 BentoML 上部署模型并在您的 RAG 应用程序中使用它们。首先部署 LLM。将打开一个新页面，如下所示： BentoML 部署页面从下拉菜单中选择 bentoml/bentovllm-llama3-8b-instruct-service 模型，然后单击右下角的“提交”。如果您有付费版本的 BentoML 并且可以部署两个模型，则可以传递 BentoML 端点和 Bento API 令牌以使用部署的嵌入模型。连接到 BentoML LLM 建立与您在 BentoML 上托管的 LLM 的连接。llm_client 对象将用于与 LLM 交互，以根据检索到的文档生成响应。
59410编辑于 2024-07-07
来自专栏ShowMeAI研究中心
图解来啦！机器学习工业部署最佳实践！10分钟上手机器学习部署与大规模扩展 ⛵
BentoML 简介&核心思想BentoML 是用于模型服务和部署的端到端解决方案。模型版本化及存储可以通过pip install bentoml命令安装 bentoml安装后， bentoml命令已添加到您的 shell。 import numpy as np import bentoml from bentoml.io import NumpyNdarray iris_clf_runner = bentoml.sklearn.get 但是 BentoML 为批处理提供了一个很好的解决方案。图片参考资料 BentoML官方网站：https://www.bentoml.com/ runners官方讲解：https://docs.bentoml.org/en/latest/concepts/runner.html
2.5K62编辑于 2022-12-01
来自专栏GoCoding
开源好物 26/02
BentoML是一个灵活的AI应用服务框架，致力于简化从模型到生产级API服务的打包和部署过程。侧重易用性和应用构建，适合打包完整AI云端服务。 https://github.com/bentoml/BentoML1.4知识库PandaWikiPandaWiki是一款AI大模型驱动的开源知识库搭建系统。
9710编辑于 2026-03-12
来自专栏数据派THU
独家 | 6个Python数据科学库正在狂飙，你一定要学来提升文化素养
1、 BentoML 也许你之前听腻了这句话“机器学习模型不应该呆在Jupyter Notebooks里生锈”。去年我就发现了，模型部署中，最好的Python库是BentoML。BentoML可以一键安装，你可以用它维护、打包任何框架的模型，在任何一家云服务商部署，并将模型封装作为API提供服务。 $ bentoml containerize my_classifier:latest$ docker run -it --rm -p 3000:3000 my_classifier:6otbsmxzq6lwbgxi 数据和链接： Github链接（4.4k star）： https://github.com/bentoml/BentoML 文档： https://docs.bentoml.org/en/latest
1.2K50编辑于 2023-02-27
来自专栏DevOps
AIGC：大语言模型开放平台OpenLLM简介（提供简易的模型部署体验）
**自由构建：**对 LangChain 和 BentoML 的一流支持使您可以通过将大语言模型（LLM）与其他模型和服务组合来轻松创建自己的 AI 应用程序。项目链接 https://github.com/bentoml/OpenLLM
1.5K10编辑于 2024-03-29
来自专栏云云众生s
AI模型组合指南
使用 BentoML 组合多个模型不同的模型服务或模型部署框架可能会采用不同的模型组合方法。在这方面，BentoML 作为一个开源模型服务框架，提供了简单的服务 API 来帮助您封装模型、建立服务间通信并将组合模型公开为 REST API 端点。下面的代码示例演示了如何使用 BentoML 组合多个模型。在 BentoML 中，每个服务都被定义为一个 Python 类。您可以使用 @bentoml.service 装饰器将其标记为服务并为其分配 CPU 或 GPU 资源。在此 BentoML service.py 文件中，GPT2 和 DistilGPT2 被初始化为单独的 BentoML 服务以生成文本。
58310编辑于 2024-05-19
来自专栏开源服务指南
大语言模型生态系统：助你自由调教 AI 模型
bentoml/OpenLLM[5] Stars: 5.1k License: Apache-2.0 OpenLLM 是一个用于在生产环境中操作大型语言模型 (LLMs) 的开放平台。可以自由构建 AI 应用程序，与 LangChain、BentoML 和 Hugging Face 无缝集成。 qlora: https://github.com/artidoro/qlora [4] langgenius/dify: https://github.com/langgenius/dify [5] bentoml /OpenLLM: https://github.com/bentoml/OpenLLM [6] vllm-project/vllm: https://github.com/vllm-project/vllm
1.1K30编辑于 2023-08-10
来自专栏小鹏的专栏
[pytorch] PyTorch图像分类框架(支持多种主流分类模型)
| 1 | | 数据增强 | (旋转/镜像/对比度等、mixup/cutmix) | 2 | | 损失函数 | (交叉熵/focal_loss等) | 3| | 模型部署 | (flask/grpc/BentoML github.com/BADBADBADBOY/pytorchOCR （3）https://github.com/MachineLP/QDServing （4）https://github.com/bentoml /BentoML （5）mixup-cutmix:https://blog.csdn.net/u014365862/article/details/104216086 （7）focalloss:https
2.1K30发布于 2020-10-29
来自专栏开源服务指南
无损剪切音视频文件的跨平台工具：LosslessCut | 开源日报 0908
bentoml/OpenLLM[3] Stars: 5.1k License: Apache-2.0 OpenLLM 是一个用于在生产环境中操作大型语言模型 (LLMs) 的开放平台。可以自由构建 AI 应用程序，与 LangChain、BentoML 和 Hugging Face 无缝集成。
3K10编辑于 2023-09-14
来自专栏云鼎实验室的专栏
2025年4月企业必修安全漏洞清单
身份认证绕过漏洞（TVD-2025-14517）六、Ivanti多款产品远程代码执行漏洞（CVE-2025-22457）七、SAP NetWeaver 任意文件上传漏洞（CVE-2025-31324）八、BentoML 临时缓解方案： - 不影响正常业务的情况下关闭 Visual Composer 组件 - 限制对/developmentserver/metadatauploader 接口的访问八、 BentoML远程代码执行漏洞漏洞概述腾讯云安全近期监测到关于BentoML的风险公告，漏洞编号为TVD-2025-11492 (CVE编号：CVE-2025-32375，CNNVD编号：CNNVD-202504-1577)。 BentoML是一个开源的Python框架，专注于机器学习模型的工业化部署与管理，通过提供模型打包、版本控制、自动化API服务构建及多环境部署能力，帮助开发者将训练好的模型快速转化为可扩展的生产级服务。 https://github.com/bentoml/BentoML/releases 2.
24310编辑于 2026-04-09
来自专栏spring-ai 系列
大语言模型推理框架调研
BentoML 集成：可以与 BentoML 结合部署，将 vLLM 作为后端，打包成 OCI 兼容镜像并部署到 Kubernetes 等环境。 BentoML：未发现官方文档明确提供 TensorRT-LLM 与 BentoML 的直接深度集成方案。 KServe / BentoML：官方文档中未直接提及与 KServe 或 BentoML 的深度集成。若要在这些平台上使用，通常会通过其 Triton 后端进行部署。 BentoML 集成：存在一个名为 BentoLMDeploy 的示例项目，展示了如何结合 LMDeploy 和 BentoML 进行部署。可参考通用的 BentoML 文档进行部署。与服务平台 (BentoML, Triton Inference Server) 和模型中心 (Hugging Face) 的集成：BentoML：vLLM：与 BentoML 有良好的集成，可以将 vLLM
3.9K20编辑于 2025-06-03
来自专栏SaaS金羊毛
【SaaS播客】onboard8. MLOps：下一个基础软件百亿美金战场？
所以如果没有BentoML或者其他类似的产品，ML flow 等等，他们可能是完全没有办法把模型上线，所以更多是一个对他们来说是有或没有的一个问题。我们的目标是让BentoML 核心的开源框架变成这个领域一个公开的开源的标准。像我们最近开发的一个新的框架叫Yati，是一个BentoML 的后续产品，它就更多是做大规模模型的管理，和在Kubernetes上的高性能的部署。 Chaoyu：对于我们来说最大的挑战其实仍旧是两个方面，一方面是继续推进BentoML开源的adoption，让更多的公司使用它，让它真正建立起来一个行业的标准。第二个阶段就是从一些早期的BentoML 开源用户中去发掘好的潜在的商业用户。刚刚Monica也有问到这个问题，就是如何去选择早期的用户。这个对我们来说其实是一个相当大的挑战。
76300编辑于 2022-10-30
来自专栏AI SPPECH
56. vLLM 核心模块逐文件：api_server.py
4.3.4 易用性对比特性 vLLM API Server OpenAI API FastChat API Text Generation Inference Ray Serve BentoML API 4.3.5 扩展性对比特性 vLLM API Server OpenAI API FastChat API Text Generation Inference Ray Serve BentoML 水平扩展与Ray Serve和BentoML相比，vLLM API Server在多模型支持和自动伸缩方面还有一定提升空间。 4.3.8 成熟度对比特性 vLLM API Server OpenAI API FastChat API Text Generation Inference Ray Serve BentoML 稳定版本 Documentation：BentoML的官方文档附录（Appendix）：附录A：配置参数表参数名称类型默认值描述 host str “0.0.0.0” 服务器监听地址 port int
35010编辑于 2026-02-10

第 2 页第 3 页

点击加载更多

BentoML：如何使用 JuiceFS 加速大模型加载？

BentoML：如何使用 JuiceFS 加速大模型加载？

BentoML会话Cookie漏洞（CVE-2025-54381）分析工具

BentoML 关键SSRF漏洞 (CVE-2025-54381) 深度剖析与防护指南

LLM推理后端性能大比拼，来自BentoML团队的深度评估！

原创翻译 | 机器学习模型服务工具对比：KServe,Seldon Core和BentoML

BentoML高危SSRF漏洞CVE-2025-54381分析：原理、影响与核心代码

开发基于云的RAG应用，使用开源 LLM

图解来啦！机器学习工业部署最佳实践！10分钟上手机器学习部署与大规模扩展 ⛵

开源好物 26/02

独家 | 6个Python数据科学库正在狂飙，你一定要学来提升文化素养

AIGC：大语言模型开放平台OpenLLM简介（提供简易的模型部署体验）

AI模型组合指南

大语言模型生态系统：助你自由调教 AI 模型

[pytorch] PyTorch图像分类框架(支持多种主流分类模型)

无损剪切音视频文件的跨平台工具：LosslessCut | 开源日报 0908

2025年4月企业必修安全漏洞清单

大语言模型推理框架调研

【SaaS播客】onboard8. MLOps：下一个基础软件百亿美金战场？

56. vLLM 核心模块逐文件：api_server.py

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐