首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏亨利笔记

    联邦模型:打造安全合规的数据生态

    模型是具有数十亿甚至上百亿参数的深度神经网络模型,是“大数据+算力+强算法”结合的产物,是凝聚了大数据内在精华的“知识库”。 龙卷风中心:数据安全与隐私保护不可忽视 在模型的龙卷风席卷全球之时,这场风暴的中心也有一些冷静的声音:基于海量数据模型更应该在安全合规与伦理等方面保持谨慎。 联邦学习与模型结合:构建安全合规的数据生态大陆 联邦学习作为一种分布式机器学习新范式,其“数据不动模型动,数据可用不可见”的特点使得各参与方可以在保护各自数据安全与用户隐私的前提下,进行AI协作,打破数据孤岛 在合法合规的前提下,让散落于各行业、各机构的不同规模的模型得以交流与融合,共同构建覆盖各行业各领域的数据与模型生态,打破垄断,进一步提升模型的规模、质量和通用性。 希望更多行业专家与机构能够共同参与,合力打造下一代更加通用强大和负责任的AI,构建安全合规的数据生态大陆。

    1.3K10编辑于 2023-04-12
  • 来自专栏快乐阿超

    Java生态AI模型框架langchat

    LangChat: Java LLMs/AI Project, Supports Multi AI Providers( OpenAI / Gemini / Ollama / Azure / 智谱 / 阿里通义模型 / 百度千帆模型), Java生态下AI模型产品解决方案,快速构建企业级AI知识库、AI机器人应用 官方文档: https://langchat.cn/ 介绍: LangChat是Java生态下企业级 AIGC项目解决方案,在RBAC权限体系的基础上,集成AIGC模型能力,帮助企业快速定制AI知识库、企业AI机器人。 接入 OpenAI / Gemini / Ollama / Azure / Claude / 智谱AI / 阿里通义模型 / 百度千帆模型 等模型。 这里顺带说一下咱们dromara的easyai也是Java生态的AI模型框架,采用Apache-2.0开源协议,可以免费商用~

    41710编辑于 2024-09-13
  • 来自专栏AntDB数据库

    “超越融合 异筑信创”,AntDB数据库携手超云等生态伙伴共建信创生态

    图片与会代表一致认为,信创的本质是发展国家信息技术产业,构建中国IT产业完整的产业链、产业生态和核心竞争力,信创生态体系建设是信创发展的强需求,也是信创成功的关键。 AntDB数据库、超云等我国信创产业的创新代表,有责任和义务强化上下游生态合作伙伴关系,不断推动信创产业生态圈的建设、发展。 作为我国信息化产业生态基础软件中的一员,AntDB数据库积极与上下游软硬件进行兼容适配测试,目前已完全适配飞腾、鲲鹏等 CPU架构,支持统信 UOS、华为 openEuler 等操作系统,能够为企业级客户提供稳定完善的数据库支撑 未来,AntDB数据库将以客户需求带动生态建设,用更加开放的姿态与更多生态伙伴一起共识、共建、共成长,构建信创产业的良性循环,助推千行百业行稳致远! 亚信科技AntDB数据库团队成立于21世纪初,拥有将近二十年的数据库研发、服务经验,是我国最早的国产数据库团队之一,在通信技术从2G到5G的演进过程中,团队基于新的应用场景和数据库前沿技术,不断推动AntDB

    41100编辑于 2022-10-14
  • 来自专栏CDA数据分析师

    最后一次机会,回到2016数据生态纵览峰会现场

    1月8日,2016数据生态纵览峰会在北京圆满落幕。30多名嘉宾参与分享,20多家企业共同参与,30多家媒体参与报道,1000多名与会者见证了这场盛会。如果你错过了,确实有点遗憾。 所谓大数据,只是一个手段和载体,传统经济最后一切的产业链条未来都要进入大数据生态。 所以未来所有互联网公司其实都会成为一个大数据公司,它都会成为一个载体。 第三趋势,数据分析能力应该成为企业员工必备。 第四趋势,自助式工具会大规模使用,而且像大数据的技术还有数据分析师的鸿沟在渐渐被填平。 第五个趋势是数据分析平台的云端化。 1、数据和模型越来越多,未来一个企业要形成全企业所有数据得打通,数据要求范围更广而且要求内容更全。 2、模型越来越多,要快速满足业务部门的需求。 数据可以归纳为两大类价值,一是社会价值,二是企业价值。社会价值是触目惊心的;企业价值在于,数据需要组合在一起,它能够发挥价值,就是1+12。 更多嘉宾的精彩演讲,将会陆续上传至网,敬请期待!

    1.2K90发布于 2018-02-24
  • 来自专栏CDA数据分析师

    工具,透析Python数据生态圈最新趋势!

    我们前一阵子参加了在旧金山举办的Dato数据科学峰会。来自业界和学界的千余名数据科学研究人员在大会上对数据科学、机器学习和预测应用方面的最新发展进行了交流和探讨。 它显示了Dato对支持开源Python数据生态圈的诚意。在此之前有一种认识就是Dato提供的免费版本只是将数据科学家捆绑在自家的平台最终还是得收费,因为Dato确实有自己的商业产品。 它可以处理非常数据集而且速度很快也能嵌入在网页当中。想要快速方便地创建互动图表和数据应用的话这个库非常有用。 Bokeh对处理大型数据集时的性能问题着墨颇多。 现在Python生态圈中有很多库看起来功能都差不多比如说Blaze、Dask和Numba,但其实应该用在数据处理的不同层面上,做一个类比的话Blaze就相当于数据库中的查询优化器,而Dask则相当于执行查询的引擎 它试图解决的就是数据集规模的问题,但对用户提供的确是单机上Python的体验,而且能够与现有的Python数据生态圈(Pandas、Scikit-learn、Numpy)进行集成。

    1.5K100发布于 2018-02-05
  • 来自专栏浅聊区块链

    2023年以太坊生态5预测

    而实现模块化将会有相当的技术障碍和延迟。链上数据的急剧增加也将推动状态到期以减轻状态膨胀的需求,甚至可能导致以太坊的点对点结构发生变化。 因此,部署一个完全模块化的区块链基础设施堆栈,包括一个通用的 L2 以及可定制的 L3,将标志着单体应用链生态系统时代的结束,以及去中心化应用开发新时代的开始。 几乎每个相关的 EVM L2 都计划在其 L2 之上开发可定制的 L3。此外,使用 Celestia 的共享数据可用性基础层构建更多模块化区块链的机会将会出现。 像 Cosmos 这样的应用链生态系统将在 2023 年继续获得牵引力。然而,随着 L3 最终在 2023 年部署,我们将看到应用链叙事从单体链生态系统转变为模块化生态系统。​ 币圈波动,投资需理性。欢迎关注笔者,在留言区分享您的观点!

    71030编辑于 2023-02-13
  • 来自专栏腾讯云TVP

    运维数据生态数据思维

    数据化运维能力中,运维数据已初步形成初步数据生态标准,具备构建运维数据中台和数据可视化,同时也能对数据的进行血缘能力和影响能力的初步分析。 项目上线前的预期收益和项目上线后的阶段性实际收益相对比,相关数据可以决定了软硬件的投入是否形成收益,也能将此类数据作为业务继续迭代优化和下线止损的参考。 (2) 运维人员的数据观 无数据,不工作。 因此运维人员在落地数据思维中的第一步是形成初步的运维数据生态,具备数据的输出场景能力。 (1) 具备运维数据生态 通俗点说,运维数据生态是集中了公司展业的所有数据,并让适配场景的数据进行流动。 另外还有一些文档数据,如需求文档,接口文档,知识库。 如下图所列,具备运维数据生态基础需要将上述源数据进行采集、存储、加工、分析,最终达到应用的效果。 123123.png (2) 提供数据使用场景 运维的日常场景很多,看似复杂,终究离不开对稳定、安全、高效、低成本四项基本价值的更高追求。

    2.9K2519发布于 2020-06-29
  • 来自专栏大数据动态

    腾讯云大数据发布数据生态战略,构建开源开放数仓生态

    其次在产品生态开源开放方面,将臻选商业化公司的数据产品提供到与原厂产品同等的市场地位,让客户享受到更丰富和优秀的数据产品和服务。 2.png 最后他总结,“我们也希望基于这样更开源开放的生态,用户可以享受更为透明和精细化的产品和服务的能力,带来更大的生产红利。” 同时开放云生态的技术能力也将有足够能力保障好企业未来数据技术演进中的技术安全性问题。 开放云生态中的客户技术实践、解决方案合作伙伴的商业化服务都将能把数据价值创新的技术、经验、商业模式,通过腾讯云培训及技术沙龙平台,传导到生态中的每一位参与者,云端企业可以以此作为数据价值创新过程中的催化剂 第二个是我们产品生态上的开放。我们将会为新创公司和商业化公司的臻选数据产品和服务提供到与自研产品同等的市场地位。让我们的客户享受到更为丰富和优秀的数据产品和服务。 第三个是我们服务生态的开放。

    2K20发布于 2021-01-05
  • 来自专栏机器学习/数据可视化

    Spark笔记2-生态系统

    应用常景 场景 复杂的批处理:MapReduce 交互式查询 基于实时数据流的流处理:storm 缺陷 数据无法无缝共享,数据格式需要进行转换 维护成本高 资源利用率低下:每个资源框架都有自己的调度管家 Spark生态 一个软件栈满足不同的应用场景,通过YRAN作为公共的资源调度管家。

    27110发布于 2021-03-02
  • 来自专栏数据处理与分析

    数据分享】中国生态功能区数据

    数据介绍 数据概况 在数据的官方网站上,这样介绍道:在中国生态环境问题、生态系统敏感性、生态系统服务功能重要性的基础上,将一系列相同比例尺的评价图,采用空间叠置法、相关分析法、专家集成等方法,按生态功能区划的等级体系 在数据下载的过程中,我们发现了网站上的数据存在三种问题:1、无数据访问权限;2、无下载链接;3、点击下载链接下载下来的数据是个图片。 无访问权限 五个生态功能区没有访问权限 1、东部季风生态大区->燕山-太行山山地落叶阔叶林生态区->永定河上游间山盆地林农草生态亚区->广灵山间盆地农牧业生态功能区 2、东部季风生态大区->黄土高原农业与草原生态区 、营养物质保持与城市生态保护生态功能区 2、东部季风生态大区->华北平原农业生态区->鲁北平原农业生态亚区->乐陵庆云盐渍化防治与农业-经济林生态区 3、东部季风生态大区->海南环岛热带农业生态区->海南海岸带生态亚区 ->腾格里沙漠草原化荒漠生态亚区->民勤绿洲农业及沙漠化控制生态功能区 others 本次数据整理,断断续续,耗时2个月之久。

    2.5K40编辑于 2022-01-26
  • 来自专栏腾讯云大数据

    腾讯云大数据发布数据生态战略,构建开源开放数仓生态

    此次数据生态战略包含数据技术、数据产品、数据服务市场三个层面的内容。 首先在技术上的开源开放方面,腾讯云协同开源社区提供开放的技术体系,并通过开源的方式将自己的技术反哺给社区。 其次在产品生态开源开放方面,将臻选商业化公司的数据产品提供到与原厂产品同等的市场地位,让客户享受到更丰富和优秀的数据产品和服务。 同时开放云生态的技术能力也将有足够能力保障好企业未来数据技术演进中的技术安全性问题。 开放云生态中的客户技术实践、解决方案合作伙伴的商业化服务都将能把数据价值创新的技术、经验、商业模式,通过腾讯云培训及技术沙龙平台,传导到生态中的每一位参与者,云端企业可以以此作为数据价值创新过程中的催化剂 第二个是我们产品生态上的开放。我们将会为新创公司和商业化公司的臻选数据产品和服务提供到与自研产品同等的市场地位。让我们的客户享受到更为丰富和优秀的数据产品和服务。 第三个是我们服务生态的开放。

    1.2K70发布于 2020-12-23
  • 来自专栏存储公众号:王知鱼

    Samsung:IU落地的应用生态(LBS实践)

    本文将带您抽丝剥茧,解析LBA、IU及LBS之间的复杂关系,揭示NVMe和OCP等标准在其中的作用,并展望LBS如何为主机软件生态系统带来“免费”的性能提升,最终实现QLC SSD在数据库等工作负载下的卓越表现 元数据(如 L2P 表的更新)也能保持一致性。 写入操作通常不仅仅涉及用户数据的写入,还包括内部元数据的更新。原子掉电保护也确保这些元数据的更新要么和数据一起完成,要么完全不发生。 Fig-17:LBS如何增益IUs 图片解释了如何在主机操作系统层面通过一种称为“大块大小(LBS)”的方法来更好地支持使用 IU 的 SSD。 VFS 下方是基于块的文件系统 (Block based filesystems),例如 ext4、f2fs、gfs2 和 btrfs。 归根结底可以追溯到LBA--L2P--IU的IO读写映射关系,块存储作为存储设备原生数据组织方式,从硬件设计上做了更深层次优化,从而具备更高寻址效率,而对象和文件存储都是在块的组织基础上,另做了语义(元数据

    53810编辑于 2025-04-21
  • 来自专栏我是攻城师

    Hadoop生态系统在壮大:十炫酷大数据项目

    在开发人员开发Hadoop以克服大数据带来的挑战之后的10年间,这些技术的生态系统在不断发展壮大。Apache软件基金会下面有众多的开源大数据技术项目。本文介绍一些重要项目,并顺便了解几个新兴项目。 如今,另外许多技术也是大数据和Hadoop生态系统的一员,它们大多数都归属Apache软件基金会。 Hadoop周围出现了这个生态系统,备受关注的项目围绕它壮大起来。” 而发展并未止步。新的项目一直被Apache软件基金会纳入到大数据生态系统。最近,Apache Arrow就成了一个顶级项目。 如今有来自商用公司的三发行版:Cloudera、Hortonworks和MapR。Hadoop的开发者之一Doug Cutting最近接受了《信息周刊》杂志的采访,畅谈了Hadoop的发展。 Apache软件基金会的更多大数据项目 这些是Apache软件基金会里面Hadoop生态系统中一些备受关注的大数据项目。另外许多是捐献而来的。

    1.4K70发布于 2018-05-14
  • 来自专栏数据结构与算法

    1675 质数 2

    1675 质数 2 时间限制: 1 s 空间限制: 1000 KB 题目等级 : 钻石 Diamond 题目描述 Description 小明因为没做作业而被数学老师罚站,之后数学老师要他回家把第 167 173 179 181 191 193 197 199 211 223 227 229          //(不含n=233) 数据范围及提示 =0) 15 { 16 if(b%2! =0) 31 { 32 if(b%2! 45 if(n<2&&(n%2==0)) 46 { 47 return 0; 48 } 49 for(ll i=0;i<11;i++) 50 {

    60560发布于 2018-04-13
  • 来自专栏机器人课程与技术

    ROS 2 Humble Hawksbill 丰富和成熟生态扩展

    ROS1从kinetic之后,生态非常成熟,但是由于ROS1内核设计比较早,不能高效稳定地适应分布并行和实时等应用,存在缺陷,从melodic和noetic之后,一直是ROS1和ROS2并存地状态。 2022年5月,ROS 2 Humble Hawksbill 已经具备了丰富和成熟生态,也结束了并存状态,现在官方主力只更新和完善ROS2了。ROS1只处于维护状态。 ---- 原文参考: discourse.ros.org/t/ros-2-humble-hawksbill-released/25729 ---- 机器翻译如下: ---- 仿真: 三主流软件均支持, 对于 Visual SLAM,在多核云计算机上运行 ORB-SLAM 2 节点,得到了 2 倍的加速。 还有很多 eProsima 能够在 Humble 版本的 Fast DDS 中包含更多特性…… 内容过滤主题功能 1 (CFT) 为主题提供过滤功能,使用户在订阅主题时能够在特定条件下对他们感兴趣的数据子集进行分段

    2.4K20编辑于 2022-05-31
  • 来自专栏深度学习与python

    Lakehouse 如何重塑企业数据生态

    企业能从这一趋势中获益的主要方面是,通过元数据的标准化,可以打破企业内部各个数据源之间的数据孤岛,从而使数据能够发挥更多的价值。 另外一个方面是,整体的背景和企业面临的问题,尤其是降本增效的需求。 2 Lakehouse 架构的挑战与技术创新 伍翀:在 Data + AI 深度融合的当下,数据规模与复杂度剧增,这给 Lakehouse 架构在数据存储、实时处理及 AI 模型适配等方面带来了哪些具体且关键的挑战 随着 AI 与 Lakehouse 架构的紧密结合,Python 作为 AI 生态中最通用的编程语言,其接口在整个 AI 生态中起到了至关重要的作用。 其次,AI 更加倾向于使用嵌入或向量化的格式,而目前的 Lakehouse 架构更多侧重于分析场景,AI 模型的需求与当前架构的计算范式并不完全对齐, 传统的数据分析架构很难完全匹配 AI 场景下的需求 首先是存储格式的选择,我会将它分为两部分:分钟级别延迟的数据和秒级延迟的数据。 对于分钟级别的数据,主要选择四湖格式:Iceberg、Paimon、Hudi 和 Delta。

    54610编辑于 2025-03-21
  • 腾讯混元模型:重塑AIGC应用新生态

    腾讯混元模型:重塑AIGC应用新生态在科技日新月异的今天,人工智能(AI)已经深入到我们生活的方方面面,成为推动社会进步的重要力量。 一、腾讯混元模型:技术底蕴与创新力量腾讯混元模型,是腾讯云智能基于深厚的AI技术积累和创新精神,精心打造的一款通用语言模型。 二、产品体验:轻松解锁AI生成新模式为了让更多用户能够体验到腾讯混元模型的强大功能,腾讯云推出了多款基于该模型的产品方案,包括混元生文、混元生图以及模型图像创作引擎和模型视频创作引擎等。 模型图像创作引擎和模型视频创作引擎则更加注重用户的个性化需求。 我们相信,在未来的日子里,腾讯混元模型将继续发挥其在技术、产品和应用方面的优势,为更多用户创造更加美好的智能生活。腾讯混元模型作为腾讯云智能的核心产品之一,其技术实力不容小觑。

    51820编辑于 2024-09-30
  • Llama 2技术突破与生态应用全景解析

    Llama 2技术特性更新某机构近日发布了其开源语言模型Llama的第二代版本。 这一新版模型基于更多训练数据2万亿标记),支持更长的上下文长度(4096标记),且采用比第一代更宽松的许可协议,允许商业用途。 技术生态发展概览以下是Llama 2发布后24小时内的关键技术进展:模型部署与应用Llama2聊天机器人:由某机构基础设施团队构建的开源演示应用,基于Streamlit、Replicate和Fly.io 2 70B:700亿参数版本,虽然运行速度较慢,但具备更强的能力表现开发工具与平台llm-replicate:Replicate的llm插件,提供命令行工具和Python库,用于与语言模型交互sdk.vercel.ai 2的适配关注技术社区动态,持续获取模型生态系统的最新发展。

    18310编辑于 2025-11-04
  • 来自专栏AI掘金志

    AIGC、模型、生态...这次的宇视不低调

    这是乌镇的景,也是乌镇的生态。 当AIoT的风吹到乌镇,一幅关于AIoT的生态图正在被构建。 解决方案供应商、工程商、分销商…他们是这幅生态图的重要组成部分,同样是这幅图的创作者。 5月9日,宇视举办了AIoT合作伙伴峰会,核心主题便是“生态为先 · 繁荣共生”。 在宇视眼里,服务生态伙伴已经成为基本的业务基调。 那么为何宇视如此强调“生态”? 模型、SAM模型则大大缩小了AI公司和工程商们的差距。 原来以“小模型+大样本”的算法生产模式,变成了以“模型+小样本”。新模式并不需要庞大的数据量,数据标注成本、算法训练成本大幅降低。 随着多模态模型的出现,这些数据本身可用于生成更多的图像内容,当碎片化数据通过AI技术生成结构化数据时,那么新的价值点也一并衍生出来了。 其次是新的生产关系。 模型在解决长尾需求时,所需的场景标注数据量更小、开发周期更短,做细分行业算法和业务软件的成本更低。 这样一来,工程商通过大模型也可以拥有贴近场景的核心算法,一定程度上摆脱了对算法供应商的依赖。

    41430编辑于 2023-08-26
  • 来自专栏Rust 编程

    Rust生态安全漏洞总结系列 | Part 2

    相关:Rust生态安全漏洞总结系列 | Part 1 本系列主要是分析`RustSecurity` 安全数据库库[1]中记录的Rust生态社区中发现的安全问题,从中总结一些教训,学习Rust安全编程的经验 并且堆绑定为2GiB或更小。则该 Bug 无法用于从另一个 WebAssembly 模块堆访问内存。 如果使用此 Bug 可访问的范围中没有映射内存,例如,如果 WebAssembly 模块堆之前有 2 GiB 保护区域,则可以减轻此漏洞的影响。 示例: let x = &[1, 2, 4]; unsafe { assert_eq!(x.get_unchecked(1), &2); assert_eq! 参考资料 [1] RustSecurity 安全数据库库: https://rustsec.org/advisories/ [2] https://github.com/bytecodealliance

    1.1K70发布于 2021-06-10
领券