首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 爱立信联合Intel,布局6G网络AI-Native架构

    要理解这场合作的战略意义,首先需明确6G的核心变革:6G绝非5G的简单速率升级,正如4G到5G的突破不止于网速提升,6G的核心是“AI定义6G”,而非“6G+AI”的简单叠加的AI Native理念。 以自动驾驶场景为例,6G时代的自动驾驶汽车需毫秒级联动云端、边缘节点与路侧单元,实时处理路况、调整行驶策略,这就要求网络本身具备自主AI调度能力,这正是爱立信与英特尔合作想要定义的核心场景,也是6G AI 具体来看: 英特尔将为爱立信提供基于20A/18A先进制程的定制化芯片及至强处理器算力支撑,重点优化AI-RAN的实时调度能力; 爱立信则开放其RAN架构,推动算力与网络的深度融合,降低AI模型部署门槛 两人一唱一和,把双方联手抢占6G AI-Native赛道的战略意图,摆得明明白白。 架构、空天地一体化等领域展开激烈博弈;2027-2028年,全球6G产业联盟可能出现重组,部分中小厂商将被淘汰,头部企业与芯片厂商的协同将更加紧密,形成“寡头竞争”格局。

    17510编辑于 2026-04-09
  • 软件架构 6 个方面

    所谓 “架构”,就是将软件的结构打好,然后在结构内按部就班的施工就好了。软件架构 6 个方面软件架构涉及六个维度,分别是 “稳定性”、“高性能”、“一致性”、“扩展性”、“观察性” 和 “安全性”。 没有最好的架构,只有合适的架构。合适的架构就是在对这些维度的平衡与取舍,以最大程度的支撑当前业务的运行。每个方面包含的内容稳定性,异步、调度、容错、隔离、熔断、限流、降级、故障恢复。 这也印证了 “架构是演化出来的,不是一蹴而就的。”可以说这个是 “架构” 的 “架构” 吧,以后只需要完善这个结构,往这个结构中不断添加工具、方法、经验就好了。

    26710编辑于 2024-03-25
  • 来自专栏超级架构师

    Envoy架构概览(6):异常检测

    异常值检测和弹出是动态确定上游群集中的某些主机是否正在执行不同于其他主机的过程,并将其从正常负载平衡集中移除。 性能可能沿着不同的轴线,例如连续的故障,时间成功率,时间延迟等。异常检测是被动健康检查的一种形式。 特使还支持主动健康检查。 被动和主动健康检查可以一起使用或独立使用,形成整体上游健康检查解决方案的基础。 弹射算法 取决于异常值检测的类型,弹出或者以行内(例如在连续5xx的情况下)或以指定的间隔(例如在定期成功率的情况下)运行。 弹射算法的工作原理如下: 主机被确定为异常。 特使检查以确保弹出

    1.2K60发布于 2018-04-09
  • 来自专栏超级架构师

    【服务网格架构】Envoy架构概览(6):异常检测

    配置参考 集群管理器全局配置 每个群集配置 运行时设置 统计参考 微信公众号 关注微信公众号【首席架构师智库】 微信小号 希望加入的群:架构,云计算,大数据,数据科学,物联网,人工智能,安全,全栈开发 点击加入知识星球【首席架构师圈】 微信圈子 志趣相投的同好交流。 点击加入微信圈子【首席架构师圈】 喜马拉雅 路上或者车上了解最新黑科技资讯,架构心得。 点击,收听【智能时刻,架构君和你聊黑科技】 知识星球 认识更多朋友,职场和技术闲聊。 点击加入知识星球【知识和技术】

    59150发布于 2020-07-20
  • 来自专栏超级架构师

    【企业架构】投资企业架构工具的 6 个理由

    企业架构旨在为企业 IT 的广阔领域及其蓬勃发展的机器和软件集合带来秩序,这是几十年前无法想象的聚宝盆。台式机、平板电脑、手机——一目了然的屏幕。 以下是您的组织值得投资企业架构解决方案的六个原因——以及在依赖 EA 工具时需要牢记的一些问题。 企业架构工具远远超出列表。它们为世界增添了秩序,提供了大量关于通过您企业无穷无尽的硬件收集的大量比特的信息。 然而,重要的是要记住,工具不提供秩序。人们这样做。企业架构工具只是提供建立秩序的手段。 企业架构工具仍然是解决方案,但它们并不神奇。他们承诺维护数据。它们只是您的团队带来秩序的途径。他们不会自己带来秩序。 企业架构打破孤岛 随着差异的增加,组织可能会遭受孤立。 安装企业架构软件不会解决这些深刻的差异,但它会更容易发现这些差异。在企业架构工具中对企业资产进行编目的过程揭示了许多区别,这是建立某种统一性的第一步。中央数据库是变革的催化剂。

    50520编辑于 2022-07-29
  • 2026 企业级 AI 技术栈全景:6 款企业智能体架构解析

    我是一位企业级系统架构师。 2026,在当下这个时间节点,企业 AI 的战争已经结束了“模型参数之争”,全面转向了“场景落地之争”。 技术架构:DeepMiner-FA 三层架构解析DeepMiner 的核心壁垒在于其 DeepMiner-FA(Foundation Agent) 多智能体协作框架。 如图所示,DeepMiner 采用了严谨的三层架构:基础技术层 (FA):这是大脑。 技术突破:它能够在一个包含 250+ 公共维度 × 6 种私有维度 × 200+ 分析指标,总计超过 30 万个行动空间的复杂环境中,精准找到最优的分析路径。 核心技术优势:AWS Q 经过了亚马逊内部海量代码和架构文档的训练。它不仅能补全代码(继承自 CodeWhisperer),更精通 AWS 的复杂架构

    72710编辑于 2026-01-19
  • 来自专栏闲余说

    架构设计 6-高可用架构之高可用计算架构

    导读:《架构设计》系列为极客时间李运华老师《从0开始学架构》课程笔记。本文为第六部分,主要介绍高可用计算架构,介绍了高可用架构设计的要点以及不同架构方式的优缺点。 主备 主备架构是计算高可用最简单的架构,和存储高可用的主备复制架构类似,但是要更简单一些,因为计算高可用的主备架构无须数据复制 详细设计 主机执行所有计算任务 当主机故障(例如,主机宕机)时,任务分配器不会自动将计算任务发送给备机 缺点:主从架构需要将任务分类,任务分配器会复杂一些。 集群 计算高可用集群包含 2 台服务器的集群,这点和存储高可用集群不太一样。 存储高可用集群把双机架构和集群架构进行了区分;而在计算高可用集群架构中,2 台服务器的集群和多台服务器的集群,在设计上没有本质区别,因此不需要进行区分 对称集群 通俗的叫法是负载均衡集群。 个人思考 相对高可用存储架构,计算架构相对简单,不涉及数据同步和一致性。关键点在于如何将请求路由到合适的实例上。 reference 从 0 开始学架构

    70930编辑于 2022-08-19
  • 来自专栏AI系统

    AI系统】AI系统架构的组成

    AI 编译与计算架构AI 框架充分赋能深度学习领域,为 AI 算法的开发者提供了极大便利。 为了实现硬件的多样性,需要将神经网络模型计算映射到不同架构的硬件中执行。在通用硬件上,高度优化的线性代数库为神经网络模型计算提供了基础加速库。 DSA 芯片架构支持:AI 训练和推理对性能和时延都非常敏感,所以大量使用专用的 AI 加速芯片进行计算,而 AI 编译器其实是以 DSA 架构AI 加速芯片作为为中心的编译器,这也是区别于通用编译器的一个特征 AI 编译与计算架构负责 AI 模型在真正运行前的编译和系统运行时的动态调度与优化。 神经网络编译架构及优化:在编译期,通过静态分析与优化的方法,提供更优化的编译支持,提升模型的性能,正确性等。类似传统编译器,网络模型的计算图可以通过融合等手段优化,算子内可以应用大量循环优化。

    1.4K11编辑于 2024-11-26
  • 转载:【AI系统】AI系统架构的组成

    AI 编译与计算架构 AI 框架充分赋能深度学习领域,为 AI 算法的开发者提供了极大便利。 为了实现硬件的多样性,需要将神经网络模型计算映射到不同架构的硬件中执行。在通用硬件上,高度优化的线性代数库为神经网络模型计算提供了基础加速库。 DSA 芯片架构支持:AI 训练和推理对性能和时延都非常敏感,所以大量使用专用的 AI 加速芯片进行计算,而 AI 编译器其实是以 DSA 架构AI 加速芯片作为为中心的编译器,这也是区别于通用编译器的一个特征 AI 编译与计算架构负责 AI 模型在真正运行前的编译和系统运行时的动态调度与优化。 神经网络编译架构及优化:在编译期,通过静态分析与优化的方法,提供更优化的编译支持,提升模型的性能,正确性等。类似传统编译器,网络模型的计算图可以通过融合等手段优化,算子内可以应用大量循环优化。

    2.1K10编辑于 2024-12-11
  • JBoltAI:事件驱动 AI 架构,重构 Java AI

    企业级 AI 应用开发中,多模块耦合、高并发响应延迟、流程异常难以排查等问题,成为 Java 团队落地 AI 能力的核心阻碍。而事件驱动架构,正是解决这些痛点的关键思路。 JBoltAI 将事件驱动机制深度融入 AI 应用开发的全流程,打造了 “操作抽象为事件、统一调度为核心、全生命周期管控为保障” 的事件驱动 AI 架构,不仅让复杂 AI 工作流的编排更灵活,更从根本上提升了企业级 事件生命周期管理,是 JBoltAI 事件驱动 AI 架构保障企业级稳定性的核心抓手,让 AI 流程彻底摆脱 “黑箱” 状态。 作为 AIGS 范式的核心实践者,JBoltAI 的事件驱动 AI 架构,重新定义了企业级 Java AI 开发的模式。 从智能报销、智能问数到 AI Agent 复杂任务执行,从老系统 AI 改造到 AI 原生应用开发,JBoltAI 的事件驱动 AI 架构正在赋能千行百业的 Java 企业,让 AI 能力真正融入业务流程

    12310编辑于 2026-03-13
  • 来自专栏AI系统

    AI系统】推理系统架构

    推理系统架构AI 领域中的一个关键组成部分,它负责将训练好的模型应用于实际问题,从而实现智能决策和自动化。 在本文中,我们将主要以 NVIDIA Triton Inference Server 为基础深入探讨推理系统架构的各个方面。 多框架支持:兼容 TensorFlow、PyTorch、ONNX 等主流 AI 框架。模型优化:集成 TensorRT 等优化工具,进一步提升模型推理性能。 作为一个强大的推理框架,Triton 能够满足多样化的 AI 应用需求,帮助企业和开发者构建高效、可靠的推理服务。 资源高效利用:多后端架构使得 Triton 能够根据模型特性和硬件资源情况智能选择最合适的推理引擎。

    1.6K10编辑于 2024-12-02
  • 来自专栏AgenticAI

    6AI Agent模式详解

    在本文中,我们将探讨多种构建 AI 智能体结构的模式。这些模式有助于我们扩展功能、保持模块化,并更好地控制执行流程。 为什么使用多智能体模式? 一开始,通常会采用单智能体模型。 适用于按领域或部门划分逻辑的系统 每个监督者管理一组特定任务或智能体 优势: 高度可扩展且结构清晰 各层级具备模块化控制能力 挑战: 实现复杂度较高 层级之间需要明确定义接口 适用场景: 企业级系统、多领域编排任务 6. 随着基于大语言模型的系统不断扩展复杂度,使用清晰、可维护的智能体结构模式来组织系统架构,变得尤为关键。

    1.1K10编辑于 2025-07-27
  • 来自专栏韩曙亮的移动开发专栏

    AI 大模型】大模型应用架构 ( 业务架构 - AI Embedded、AI Copilot、AI Agent | 技术架构 - 提示词、代理 + 函数调用、RAG、Fine-tuning )

    ; 三、大模型应用 - 技术架构 1、提示词 技术架构 传统的 ChatGPT 和 文心一言 的用法 , 用户发一句 " 提示词 Prompt " , 大模型 回一句 " 输出结果 " ; 这是在 AI Agent + Function Calling 技术架构 的 主体是一个应用程序 , 就不再是春对话方式了 , 应用程序还必须提供对应的 函数 API , 以供 AI 大模型 回调该 API 功能 API 功能 , 可以是 应用程序提供的 ; 也可以是 AI 大模型内置的 ; 该技术架构的工作流程如下 : 首先 , 用户的 应用程序 中 输入 " 提示词 " ; 然后 , 进行函数调用 , AI AI 大模型 执行 就相当于 Agent + Function Calling 技术架构 的执行过程 ; 4、Fine-tuning 微调 技术架构 Fine-tuning 技术架构 , 是在一个已有的 输出要求 评估指标 最后 , 验证数据集评估模型性能 , 如果对结果不满意 , 持续进行 超参数调整 和 Fine-tuning 策略的优化 , 直到得到满意结果为止 ; 该技术架构AI 大模型最全面的技术架构

    1.6K21编辑于 2024-07-09
  • 来自专栏AI

    深入解析,AI 架构揭秘

    [AI Perplexica] AI驱动的开源搜索引擎上一篇文章,我们对 Perplexica 做了个基本介绍,包括特点,以及如何安装。今天,我们来深入看下 Perplexica 的架构。 Perplexica 的架构Perplexica 的架构由以下关键组件组成:用户界面: 一个基于网页的界面,允许用户与 Perplexica 互动以搜索图像、视频等内容。 gitlabAI 博客 - 从零开始学AI公众号 - 从零开始学AI

    84110编辑于 2024-07-03
  • 来自专栏AI系统

    AI系统】推理引擎架构

    在深入探讨推理引擎的架构之前,让我们先来概述一下推理引擎的基本概念。推理引擎作为 AI 系统中的关键组件,负责将训练好的模型部署到实际应用中,执行推理任务,从而实现智能决策和自动化处理。 其核心优势不仅仅局限于体积小和资源占用低,更在于如何在有限的资源约束下,最大化地发挥出 AI 模型的潜力。 零依赖 轻量级推理引擎从架构设计之初就追求极致的纯净与独立,确保主体功能无任何外部依赖。 MNN 在设计上特别聚焦于内部业务模型的优化,如针对人脸检测等任务进行了深度优化,能够在老旧的硬件上(如 iPhone 6)实现快速推理。 整体架构 推理引擎作为 AI 应用的核心组件,其架构设计直接关系到模型在实际部署环境中的效率、灵活性和资源利用率。 模型压缩 模型压缩作为 AI 领域的一项核心技术,也是推理引擎架构中不可缺少的一部分,它旨在通过一系列精巧的策略减少模型的大小,同时保持其预测性能尽可能不变,甚至在某些情况下加速训练和推理过程。

    1.6K21编辑于 2024-12-05
  • 来自专栏AI系统

    AI系统】Kernel 层架构

    其通常是硬件特定的,针对不同的 AI 加速芯片有不同的实现。Kernel 层实现时,会进行各种优化,包括算法优化、内存访问优化、向量化、并行化和硬件特定的汇编优化。 Kernel 层的优化主要体现在各种高性能算子和算子库的设计上,这些算子和算子库通常针对不同的 AI 加速芯片进行了优化,以提高计算速度和效率。 推理架构如图所示,下面分别从 CPU 和 GPU 的角度介绍一下几种人工实现的高性能算子和封装的高性能算子库:CPU 优化:NEON:NEON 是 ARM 架构上的 SIMD(单指令多数据)扩展,用于提高多媒体处理和浮点运算的性能 对于支持硬件加速的推理引擎,这一步可能还包括为特定 AI 加速芯片生成优化的执行代码。 这种布局是针对特定硬件(如某些 AI 加速器)优化的,其中 C 被分割为 C1 和 C0,C1 代表通道的分组数,C0 代表每个分组中的通道数。

    47410编辑于 2024-12-06
  • 云端 AI Agent 架构实战

    云端 AI Agent 架构实战:Google ADK 5 种 Skill 编排模式的工程化落地Agent 技术栈正在经历从原型验证到生产部署的跨越。 映射到云架构中,本质就是一条同步处理流水线。 分层模型调度# 路由判断用轻量模型——快且便宜router.set_model("gemini-2.5-flash")# 执行层用中端模型worker.set_model("claude-sonnet-4-6" )# 关键决策走最强模型supervisor.set_model("claude-opus-4-6")在多模型混用的 Agent 架构中,通过统一的 API 聚合平台管理模型调度能显著降低运维复杂度。 如果基础设施在 GCP 上,ADK 与 Vertex AI 的原生集成更丝滑。LangChain 生态更广泛但框架层抽象较厚,调试成本更高。

    24010编辑于 2026-03-26
  • 来自专栏深度学习与python

    6种事件驱动的架构模式

    架构还具有更高的可伸缩性和解耦性,因为状态管理完全从服务中移除,并且不需要对查询进行数据聚合和维护。 考虑一下这种情况,将所有 Wix 用户的联系方式导入 Wix 平台。 v=7O_UC_i1XY0 6事件聚合 当你想知道整个批次的事件已经被消费时 在上半部分,我描述了在 Wix 将联系人导入到 Wix CRM 平台的业务流程。后端包括两个服务。 KVAtomicStore(例如,请求 Id 为 YYY 的导入作业 3 已经完成): Atomic Store 将生成一条新消息到 job-completed-commands 主题,键为 YYY-6, 接下来,Atomic Store 的消费者 - 生产者对将消费此消息,并增加 KV Store 主题中键 YYY-6 的已完成作业计数。   ://medium.com/wix-engineering/6-event-driven-architecture-patterns-part-2-455cc73b22e1 本周好文推荐 Mozilla

    3.9K20编辑于 2023-04-01
  • 来自专栏一个会写诗的程序员的博客

    架构设计模式—6大设计原则

    架构设计原则 6大设计原则 Single Responsibility Principle  : 单一职责原则 Liskov Substitution Principle : 里氏替换原则 6 内容耦合: 这是最高程度的耦合,也是最差的耦合。当一个模块直接使用另一个模块的内部数据,或通过非正常入口而转入另一个模块内部。 内聚性又称块内联系。 6 功能内聚: 这是最强的内聚,指模块内所有元素共同完成一个功能,缺一不可。与其他模块的耦合是最弱的。

    2K60发布于 2019-07-04
  • 来自专栏编程进阶实战

    浅谈6种流行的API架构风格

    本篇文章将浅谈一下当前6种流行的API架构风格的优点、缺点以及适用场景。 6种流行的API架构风格图SOAP SOAP全拼:Simple Object Access Protocol 优点:SOAP 是一种基于 XML 的通信协议,具有良好的跨平台和跨语言支持。 RESTful RESTful全拼:Representational State Transfer 优点:RESTful 一种基于现有 Web标准和 HTTP协议的设计和构建网络应用程序的架构风格,旨在提供一种简洁 适用场景:gRPC 适用于构建分布式系统和微服务架构,特别是那些需要高性能和强类型约束的场景。WebSocket优点:WebSocket 提供了全双工通信的能力,允许服务器主动向客户端推送数据。 总结这些 API 架构风格都各有优点和适用场景,您可以根据具体需求选择适合的架构风格来构建和设计 API。

    84900编辑于 2024-01-12
领券