首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏IT创事记

    创新数据底座:智能制造的“圣杯”

    进行仿真计算需要处理大量的实时数据,对系统的计算和数据吞吐能力都有极高的要求。既有的数据基础设施很难满足以汽车研发为代表的新增需求,创新的数据底座成为智能制造时代被寄予厚望的“圣杯”。 仿真平台只是创新数据底座的冰山一角。 当前90%的制造业企业配有自动生产线,但仅有40%实现数字化管理,5%打通工厂数据,1%使用智能化技术。预计到2025年,数字化、网络化、智能化制造企业占比将分别达到70%、30%、10%。 华为构建的创新数据基础设施,将成为国内制造企业数字化转型坚实的数据底座,其示范效应影响深远。 存储产品的高歌猛进,为华为创新数据基础设施提供了充足的底气;与更多懂行业、懂业务、懂技术的合作伙伴携手同行,则是华为构建制造业等行业数据底座的生态保障。

    51620编辑于 2022-08-30
  • 来自专栏知识分享

    WIFI底座

    自己贴片的51+WIFI的开发板终于到了。。还是贴片的好看 美中不足的是需要改一个电阻的阻值。。还有就是由于自己的8266和51单片机一块断电上电,所以如果用的USB线的质量不好就会出现 下载不了程序

    1.2K40发布于 2018-06-01
  • HarmonyOS Next数据底座向量数据库介绍

    背景今年HDC在展厅遇见了HarmonyOS 数据底座的架构师,介绍了基于数据底座实现端侧能力的智能小助手,听着很吸引人,HarmonyOS将端侧AI做到了系统层,给开发者创造了无限可能。 向量数据库概述向量数据库是一种支持存储、管理和检索向量数据数据库系统,同时兼容传统的关系型数据处理能力。 从API version 18开始,向量数据库正式支持通过标准化接口实现数据持久化,为开发者提供了可靠的数据存储解决方案。 结果集采用惰性加载策略,只有在实际访问数据时才会从存储层加载,有效降低了内存消耗。向量数据表示floatvector是向量数据库的核心数据类型,用于表示高维向量数据。 ;参数配置:QUEUE_SIZE:[10,1000],默认20OUT_DEGREE:[1,1200],默认60索引管理示例// 创建L2距离索引await store.execute( "CREATE

    29710编辑于 2025-07-06
  • 来自专栏凯哥讲故事系列

    DataOps:数据中台的必备底座

    前言 数据中台的崛起代表了企业数字化转型从流程驱动走向数据驱动,从数字化走向智能化。而DataOps则是数据中台区别于传统企业数据架构的核心差异,是建设数据中台的必备底座能力。 ,细分成多种数据处理领域,比如: 数据分析 数据可视化 机器学习 云数据处理 流式数据处理 离线数据处理 统计和数据挖掘 每一个领域又有多元化的数据处理工具,框架,如下图所示: ? 从数据源直接实时获取数据,然后进入数据湖,通过流式数据处理,实时数据仓库,规模化的自动数据处理过程等工具构建分析数据管理闭环,最终输出多元化的数据服务。 上图是典型的数据价值链过程,而DataOps就是支撑着整个全生命周期的底座,成功的DataOps体系有四个特质:CAUTA。 全面/Universal 作为企业全域数据底座,DataOps要全面的支持所有的场景和数据,如下图所示例,列示出了常用的30种数据源和40种目标数据。 ? 可以分解的更加细致: ?

    8.8K37发布于 2020-07-09
  • 来自专栏量子位

    都在卷大模型底座,云计算一哥决定给底座底座

    它专门针对千亿参数的生成式大模型进行了优化: 与上一代相比,吞吐量提高了4倍,延迟降低了10倍,并可支持大规模分布式推理;与同类实例相比,每瓦性能比提高了50%。 为什么需要大模型底座? 由表及里,大概有两层原因驱动。 首先是直接原因,行业需求。 生成式AI将会形成一个新市场,如今已是行业公认的趋势。 更深层次的原因在于,给大模型加底座,能够更进一步降本增效,这本身就符合市场和行业的发展要求。 而除了大模型底座,在近期或许还会衍生出一大批“新兴物种”。比如当下软件应用在争先恐后接入Chatbot,就有企业推出相应服务帮软件应用接入大模型能力。 可见在当下这个时刻,怎么把握机遇非常关键。 其中,比如光数据这一环就分为数据提供商和数据服务商,光数据提供商就包括提供通用数据、垂直数据、特定业务下的标注数据、符合法规的审核数据等等。

    34910编辑于 2023-05-06
  • 数据平台数据底座能力构建技术指南

    摘要 本文旨在解析大数据平台的数据底座能力,探讨其核心价值、典型场景、关键挑战,并提供详细的操作指南。同时,对比分析通用方案与腾讯云方案的差异,并提供场景化案例以展示腾讯云产品的优势。 技术解析 核心价值与典型场景 大数据平台的数据底座能力,指的是构建企业级数据仓库和数据资产管理的能力。这一能力的核心价值在于: 性能提升:与传统数仓/大数据解决方案相比,性能提升10~100倍。 通用方案 vs 腾讯云方案对比 维度 通用方案 腾讯云方案 性能 10 结论 大数据平台的数据底座能力是企业数字化转型的关键。腾讯云提供的WeData、COS和BI工具等产品,能够帮助企业在性能、成本和数据治理方面取得显著优势。 通过上述操作指南和增强方案的对比,企业可以根据自身需求选择合适的技术方案,实现数据底座能力的构建和优化。

    55810编辑于 2025-07-28
  • 来自专栏数据猿

    AI存储进入PBEB时代,HDD为何成为数据底座

    “西部数据的策略:从11碟HDD出发,重塑AI存储底座。 大数据产业创新服务媒体 ——聚焦数据 · 改变商业 让我们来试想这样一个场景:凌晨3点,某大模型云服务平台的日志系统依然在高速写入。 西部数据在2024年10月推出的Ultrastar™ DC HC690数据中心硬盘是一项适合的选择。 1.数据底座:更优TCO+长期信赖 在AI驱动的数据中心架构中,HDD是不可替代的底座。因为它能带来规模化成本效益。 封装于标准3.5英寸结构中; ·协同技术加持:包括ePMR(能量辅助垂直磁记录)、UltraSMR、HelioSeal™、OptiNAND™; ·功耗表现优秀:即使磁碟数量增加,单位容量能效依旧维持在与10 这是对客户的长期关系战略——构建“存储信赖路径”,帮助客户把其数据底座变成护城河。

    18210编辑于 2026-01-27
  • 来自专栏数据是生产力

    别扯数据化转型了,先夯实数据底座

    2019-2021 人人都提数据中台,张口就说业务数据化、数据业务化,数据驱动业务,甚至数据重塑业务;如今大家又与时俱进开始侃侃而谈数据化转型。 在我们讨论数据化转型、数据中台、数据云时候都离不开一个稳定可持续迭代的数据底座。这里数据底座包括离线数仓、实时数仓、数据湖。数仓(包括离线数仓、实时数仓、数据湖)就是这个数据底座。 主数据管理:通过主数据打通各业务链条,统一数据语言,统一数据标准,实现数据共享。 评估数据价值:数据的价值在数据交易领域非常重要,数据血缘关系,可以从数据受众、数据更新量级、数据更新频次几方面来给数据价值的评估提供依据。 最后 在夯实企业数据底座过程,需要从道角度出发,这是决定我们做事情思考高度与宽度;也需要从术上明确落地实施路径。也就是,道以生术,术为道生。

    3.4K30编辑于 2022-10-28
  • 谈谈openGauss的底座

    DB- Database,数据库。做IT的人,应该不会不知道什么是数据吧?至少也应该会听过MySQL,Oralce这两个名字。其实还有很多其他的数据库名字,在此不一一列举了,因为其实我知道的也不多哈。 但其实看完《中国数据库的前世今生》之后,你可能会发现,原来中国自研的数据库产品也在悄然升起。 这里引用一张官网上面的图片,简单介绍一下openGauss正文谈到openGauss,就不得不说一下它的底座操作系统:openEuler。 这里引用一张openGauss官网上面的图:从上面的图中可以看到,openGauss支持2种架构:- AArch64- x86_64** AArch64就是arm架构的芯片openGauss支持3种操作系统底座 我们可以安装一套openEuler的操作系统,在此底座基础上面安装体验openGauss。后记本文起到一个抛砖引玉的作用。

    31510编辑于 2024-11-21
  • 企业落地 ChatBI,如何构建可信可靠的数据底座

    在企业 ChatBI 落地过程中,数据底座的技术路线选择直接决定了数据可信度、维护成本和业务响应速度。 传统宽表架构在数据口径一致性、维护成本和灵活性上已难以支撑企业级 ChatBI 的规模化应用,而基于 NoETL 明细语义层的方案正成为新一代数据底座的主流选择。 数据工程师疲于应付宽表开发,难以沉淀数据资产:工程师长期陷入“接需求—建宽表—改宽表”的循环,无法将精力投入到数据资产治理和业务价值挖掘中。 NoETL 明细语义层——ChatBI 数据底座的核心基于明细层数据模型进行语义抽象,覆盖完整分析场景:明细语义层直接对接企业数仓 DWD 层的明细模型,沉淀所有明细级语义,支持从宏观汇总到明细下钻的全场景问数需求 最后,为确保数据安全与合规,NoETL 明细语义层可支持行级和列级的数据权限,确保用户仅能访问其权限范围内的数据,如客户经理仅能看到所负责客户的销售数据

    18110编辑于 2026-01-06
  • 构建可信数据底座,驱动数据要素安全高效流通与价值释放

    数字时代的数据流通困境与战略瓶颈 在数字化进程中,各类组织普遍面临数据孤岛严重、流通壁垒高、安全与合规风险突出等核心挑战。 腾讯与亚信联合推出可信数据空间解决方案 该方案以“多模式数据流通”为核心,构建覆盖多行业、多层级、多形态的一体化可信数据基础设施。 其核心能力包括: 跨域流通互联管控:基于区块链实现分布式身份认证、数据标识与多密级自动识别; 轻量化多场景交付:支持API、数据集、数据报告等多安全级别交付模式; 多平台能力适配:兼容异构算力加速卡与多种区块链底层引擎 “通过可信数据空间,我们实现了汽车产业链多方数据的安全共享与联合分析,显著提升了消费画像精准度和市场预测能力。” —— 肖东君,亚信科技(未注明职位,保留姓名与公司) 腾讯的核心能力与生态优势 腾讯凭借其全球覆盖的云网基础设施、自主研发的区块链平台(TBaaS)及隐私计算技术栈,为客户提供高可用、高可信的数据流通底座

    5500编辑于 2026-04-17
  • 来自专栏数栈技术分享

    袋鼠云数据湖平台「DataLake」,存储全量数据,打造数字底座

    一、什么是数据湖?在探讨数据湖技术或如何构建数据湖之前,我们需要先明确,什么是数据湖?数据湖的起源,应该追溯到 2010 年 10 月。 数据湖概念一经提出,便受到了广泛关注,人们发现此概念代表了一种新的数据存储理念,海量异构数据统一存储可以很好地解决企业数据孤岛问题,方便企业数据管理与应用。 同时也可对已有表 hive 结构进行快速扫描,一键生成湖表信息,节省 10x 倍数据的传输时间和 50% 磁盘空间。 定时拉取和 PUSH 主动上报的两种方式采集元数据,保证元数据的实时同步・元数据存储:根据不同元数据数据结构和用途,形成以 Hive Metastore 为主,关系型数据库为辅的存储架构・元数据应用 对比数据同步入湖,可以节省 10x 倍数据的传输时间。数据文件治理创建数据文件治理任务模板,支持小文件合并、快照清理、孤儿文件清理等数据文件治理任务,支持立即支持、预约治理、周期治理多种数据治理方式。

    1.8K21编辑于 2022-11-25
  • 基于 NoETL 语义编织技术构建 AI-Ready 数据底座

    摘要:本文面向数据架构师与技术决策者,探讨在AI时代大型企业数据平台选型的核心范式转移。 文章提出,构建基于NoETL语义编织技术的统一语义层是筑牢技术壁垒的关键,并详细拆解了从业务对齐、性能成本平衡到生态AI适配的三步评估法,旨在帮助企业构建一个高效、可信、低成本的AI-Ready数据底座 在AI成为核心数据消费者的时代,大型企业数据平台选型的核心矛盾已从比拼工具功能,转向对下一代架构范式的战略抉择。 3.安全与审计:先安检,后执行为AI提供数据服务,安全是红线。平台需具备“先安检,后执行”的AI访问控制层,确保每一次AI数据请求都经过鉴权、脱敏规则检查,实现全程可控、可审计。 价值可量化:成功的选型应带来效率10倍提升、成本降低30%-50%、AI问数准确率超过92%等回报。平滑落地路径:通过“存量挂载、增量原生、存量替旧”策略,可渐进式构建AI-Ready数据底座

    5410编辑于 2026-04-16
  • 智慧城市数据底座:构建未来城市的智慧核心

    在智慧城市的建设过程中,数据底座无疑是核心和基石。数据底座通过高效地整合、处理和分析城市中各个领域的数据,为城市管理者提供决策支持,为城市居民提供更加便捷、高效的服务。 本文将对智慧城市数据底座的重要性、主要数据库类型及其应用进行详细的探讨。 一、智慧城市数据底座的重要性智慧城市数据底座是智慧城市建设的基础和核心,它犹如城市的“大脑”,负责处理和分析海量的城市数据。 二、智慧城市数据底座的主要数据库类型智慧城市数据底座需要处理各种类型的数据,包括结构化数据、非结构化数据、时间序列数据等。为了满足这些需求,智慧城市数据底座通常采用多种类型的数据库技术。 通过整合和分析城市各个领域的数据,智慧城市数据底座为城市的规划、管理和服务提供了有力的支持。随着技术的不断发展和创新,未来智慧城市数据底座将呈现出以下几个发展趋势:1. 总之,智慧城市数据底座是智慧城市建设的重要基石。通过不断发展和完善数据底座技术,我们可以更好地应对城市发展中的挑战和问题,推动城市的可持续发展,为居民创造更加美好的生活环境。

    1.6K10编辑于 2024-08-16
  • 基于腾讯云 CVM + TickDB 构建全球资产配置数据底座

    更别提还要自己换算汇率、调整时区,光是把这些数据凑齐,就要耗费大量精力。有没有一套方案,能让我们用统一的方式获取全球主要资产数据,并在此基础上构建自己的配置模型? 今天,我就结合腾讯云CVM(云服务器)和开源数据工具TickDB,手把手搭建一个全球资产数据底座,让你的配置模型不再被数据源卡住。一、为什么需要统一的数据底座? 在构建全球配置模型时,我们通常面临三个痛点:痛点具体表现数据碎片化美股、港股、黄金、外汇各有各的数据源,格式不统一,接入成本高实时性不足免费接口普遍有延迟,影响监控和交易决策开发门槛高大部分数据平台没有开放的 API,爬虫不稳定且易被封而一个好的数据底座,应该做到:一套接口覆盖全球、毫秒级实时、开发者友好。 三、扩展:让数据自动流转到腾讯云生态有了基础数据后,我们可以进一步结合腾讯云生态,实现自动化配置管理:定时采集:配合腾讯云函数SCF,每天定时执行脚本,将数据存入云数据库,构建历史数据集。

    19620编辑于 2026-03-30
  • TiDB 助力北京电信夯实电信账务系统的数据底座

    鉴于电信行业对稳定性和数据安全的高要求,核心数据库系统必须具备极高的稳定性、可靠性、安全性和性能,同时拥有全面的容灾能力,确保数据零丢失。 TiDB 投产后业务平均处理性能实现 30% 以上的提升,数据存储空间由原先三副本 40TB 的存储空间缩减至三副本 10TB,节省了 300% 的存储成本。 TiDB 的数据分片自动透明分布,不需要分区键,避免侵入应用和代码的相关改造,同时解决了数据倾斜的问题。在数据库迁移过程中,北京电信采用了数据迁移工具 DM,实现了全量和增量数据的迁移。 首先,通过提前割接资料库数据和历史数据,成功减少了当晚数据割接的时间和风险。其次,通过优化流程,当晚需要割接的数据量大幅缩减至原来的 20%,大幅缩短了割接时间。 • 数据零丢失,秒级复原:高效数据备份和恢复机制保障数据在两地三中心间实时同步,一旦突发故障,系统能在极短时间内迅速切换并恢复服务,确保数据万无一失、用户体验不受丝毫影响。

    1.1K10编辑于 2024-11-27
  • 制造行业数据湖平台选型攻略:如何构建高效、智能的数据底座

    摘要 在制造业数字化转型加速的背景下,数据湖平台成为企业打通研发、生产、供应链等环节的核心基础设施。然而,面对复杂的数据需求和技术路线,如何选择适配自身业务的数据湖平台? 传统数据仓库难以应对非结构化数据存储与复杂分析需求,而数据湖虽能解决海量数据存储问题,但若缺乏高效计算引擎与智能化能力,仍会导致资源浪费与效率低下。 本文将结合制造业实际场景,为数据湖平台选型提供决策参考。 1. 成本控制:按需付费 vs. 预置资源 制造业数据波动性大(如产线调试期数据爆发式增长),需选择弹性伸缩、按使用付费的架构。 生态兼容:数据孤岛 vs. 统一视图 制造业涉及ERP、MES、IoT等多系统数据,需构建统一数据视图。 安全合规:数据泄露 vs. 全链路防护 制造业数据涉及工艺参数、客户隐私等敏感信息,需强化安全能力。

    27410编辑于 2025-11-03
  • 来自专栏智能相对论

    决胜数据中心,“东数西算”的基础底座

    今年2月“东数西算”战略正式启动,将在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,而贵安数据中心集群正是国家部署的8大算力枢纽节点之一 布局“数据中心” 成“东数西算”战略制高点 讨论东数西算的真正意义,一般都认为主要在于“全国一体化大数据中心”对于大数据的应用所带来的非凡价值,主要体现于它将进一步实现数据流通,从而打通数据孤岛,在提高算力的同时 (按照数据被使用的频繁程度,数据可以被分为热数据、温数据和冷数据,所谓冷数据是指访问频率低的数据,热数据反之)冷服务主要建在低成本地方,温服务可以贴近沿海的低成本地方,热服务主要布局在贴近客户需求的地方 因“冷温热”数据及时延问题的存在,造就了华为云数据中心的差异化布局,形成了贵安、乌兰察布一南一北两大云数据中心,还在京津冀、长三角、粤港澳地区布局了三大核心数据中心。 数据中心成为新基建数字化转型的基础底座,为更多的大数据、人工智能等信息技术应用创新提供高标准平台,通过数据汇聚、数据治理、数据挖掘,形成规模化的数字资产,产生更广泛的数据价值。

    65220编辑于 2022-04-02
  • 来自专栏科技云报道

    ChatGPT应用爆火,安全的大数据底座何处寻?

    AI应用要打好安全底座 ChatGPT作为大语言模型,其核心逻辑事实上是海量数据的收集、加工、处理和运算结果的输出。 总的来说,这几个环节可能会在技术要素、组织管理、数字内容三个方面伴生相关风险。 特别是涉及国家核心数据、地方和行业重要数据以及个人隐私数据的抓取、处理以及合成使用等过程,需平衡数据安全保护与流动共享。 奇安信威胁情报中心监测数据显示,2022年1月份-10月份,超过950亿条的中国境内机构数据在海外被非法交易,其中有570多亿条是个人信息。 例如,可根据数据主体、数据处理程度、数据权利属性等方面对训练数据集中的数据进行分类管理,根据数据对于数据权利主体的价值,以及数据一旦遭到篡改、破坏等对数据主体的危害程度进行分级。 因此,在AI应用前,需要构筑更加稳固的“数据底座”,正所谓,行稳方能致远。 【科技云报道原创】 转载请注明“科技云报道”并附本文链接

    44250编辑于 2023-08-03
  • 来自专栏Apache Doris

    Apache Doris + MCP:Agent 时代的实时数据分析底座

    Doris 的向量化执行引擎充分利用现代 CPU 的 SIMD 指令集,处理 Agent 生成的大量聚合查询和过滤操作时,性能提升可达 5-10 倍。 传统数据分析场景中,数据通常预先整理建模,存储在特定数据仓库中。但 Agent 需要访问的数据往往来源广泛,包括实时业务数据、历史数据数据、外部 API 数据等。 这些 Agent 不仅要处理结构化业务数据,还要处理非结构化文本、图像、音频等数据的向量表示。传统方案是在数据库之外部署专门向量数据库,但存在数据一致性、查询复杂性、运维成本等多重问题。 整个过程通常只需要 10 分钟左右,这种简洁性让开发者能够快速上手,专注于业务逻辑的实现而不是复杂的环境配置。在典型应用场景中,我们可以清晰地看到 Doris MCP 在不同业务场景下的强大能力。 在执行过程中,系统会自动选择最优的数据源(可能包括实时订单数据、商品主数据、库存数据等),制定高效的执行计划,并在毫秒级时间内返回准确的分析结果。

    66110编辑于 2025-07-27
领券