首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏小小挖掘机

    技术干货】聊聊在大厂推荐场景中embedding都是怎么做的

    总结 本文解读了三篇干货满满的Embedding应用实践的论文,总结他们在不同业务场景下一些优秀的Embedding应用实践经验,论文很多地方都充满了工程化实践的亮点。 知乎(https://zhuanlan.zhihu.com/p/61827629) [^4]: Airbnb技术团队. Airbnb爱彼迎房源排序中的嵌入(Embedding)技术.

    6.3K53发布于 2020-08-21
  • 来自专栏大数据解决方案

    干货 | 大厂与小厂的数仓建设区别

    存储选型 将数据落地到哪里是首先要考虑的问题,笔者考虑的因素主要有这么几点:一是数据量大小和增长速度,二是要能实现SQL或者类SQL操作,有多表联合、聚合分析功能,三是团队技术栈。 可选的技术方案有MySQL、Oracle和Hive,最终选择了基于MYISAM存储引擎的MySQL,部分原因如下: 要不要Hadoop? 而且团队主要技术栈是Python,使用Python操作Hadoop本身就会有性能损耗 为什么是MySQL? 于是,我们开始考虑引入一个任务流管理系统,基本想法是:第一,要能解决上述的问题;第二,最好能与Python友好的兼容,毕竟团队的主要技术栈是Python。

    1.1K10发布于 2021-11-15
  • 来自专栏HACK学习

    干货 | HOOK技术实战

    2.PE头 PE头分为三个部分,分别是PE标识(IMAGE_NT_SIGNATRUE)、文件头(/images/hook技术/image_FILE_HEADER)、可选头(IMAHE_OPTION_HEADER

    2.7K10发布于 2021-10-19
  • 来自专栏API安全

    技术干货】Attacking SOAP API

    SOAP(Simple Object Access Protocol)简单对象访问协议是交换数据的一种协议规范,是一种轻量的、简单的、基于XML(标准通用标记语言下的一个子集)的协议,它被设计成在WEB上交换结构化的和固化的信息。

    1.3K20编辑于 2023-10-07
  • 来自专栏加米谷大数据

    技术干货 | Hive模式设计

    分桶是将数据集分解成更容易管理的若干部分的另一个技术

    93850发布于 2018-04-02
  • 来自专栏MongoDB中文社区

    技术干货| MongoDB事务原理

    mp.weixin.qq.com/s/lWFvBkZ74smSjR7k7IN7wg 社区招募为了让社区组委会成员和志愿者朋友们灵活参与,同时我们为想要深度参与社区建设的伙伴们开设了“招募通道”,如果您想要在社区里面结交志同道合的技术伙伴 ,想要通过在社区沉淀有价值的干货内容,想要一个展示自己的舞台,提升自身的技术影响力,即刻加入社区贡献队伍~ 点击链接提交申请:http://mongoingmongoing.mikecrm.com/CPDCj1B 获取更多精彩内容点击社区网站www.mongoing.com 添加小芒果微信(ID:mongoingcom)进入中文用户组技术交流群 长按二维码加入我们

    2.1K10编辑于 2022-05-27
  • 来自专栏加米谷大数据

    技术干货 | hbase配置详解

    为了能够让namespace支持使用配置属性,如:namespace下表个数(hbase.namespace.quota.maxtables)或者region个数(hbase.namespace.quota.maxregions) 需要设置hbase.quota.enabled为true或者设置 <property> <name>hbase.coprocessor.region.classes</name> <value>org.apache.hadoop.hbase.namespace.Namespace

    2K50发布于 2018-04-02
  • 来自专栏加米谷大数据

    技术干货 | hive安装部署

    解压hive压缩包 apache-hive-2.1.0-bin.tar.gz(官网下载) 配置HADOOP_HOME环境变量 配置HIVE_HOME环境变量 在$HIVE_HOME/conf下创建hi

    84980发布于 2018-04-02
  • 来自专栏JavaEdge

    解密大厂技术团队如何实战OKR!

    先针对KR1,技术团队能做的包括“降低App包大小”、“SEO优化”、“开发某某新业务”和“开发小程序”等 再针对KR2,技术团队能做的不多,除非运营明确说“某大渠道ROI偏低,主要原因包太大影响转化” 3 实战技术团队OKR产生 某技术团队负责租车交易软件: 业务负责人确定2021上半年业务目标,其中之一是用户量增长(具体是增长到行业第二) 业务负责人分解KR,如针对用户量增长这个目标,业务负责人分解出 TL拿到业务规划的OKR后,进行对齐 KR1是“用户量增长4000万”,乍看和技术团队无关,但这就是技术团队需基于业务思考技术的典型KR。 TL于是,就从 3.1 技术角度分析业务目标 哪些技术指标和用户增长量有关? 和啥技术有关? 团队现在具备这些技术? 还有优化空间? 作者简介:魔都架构师,多家大厂后端一线研发经验,在分布式系统设计、数据平台架构和AI应用开发等领域都有丰富实践经验。 各大技术社区头部专家博主。

    63800编辑于 2025-06-01
  • 来自专栏加米谷大数据

    技术干货 | MapReduce作业调度

    可以通过设置mapred.job.priority属性或JobClient的setJobPriority()方法来设置优先级(在这两种方法中,可以选VERY_HIGH,HIGH,NORMAL,LOW,VERY_LOW中的任何值作为优先级)。在作业调度器选择要运行的下一个作业时,选择的是优先级最高的作业。然而,在FIFO调度算法中,优先级并不支持抢占,所以高优先级的作业任然受阻于此前已经开始的,长时间运行的低优先级的作业。MR1的默认调度器是最初基于队列的FIFO调度器,还有两个多用户调度器,分别为公平调度器

    1.4K60发布于 2018-04-02
  • 来自专栏黄新涛

    我的大厂面试经历(附100+面试题干货

    三次握手:引起SYN flood    不断发送同步报文段会因为传输控制模块TCB【处于半连接状态】从而消耗服务器资源    (1)【处理连接和半连接】定时释放监控系中无效的连接    (2)Syn ***技术 【处理半连接状态】,接受到的SYN先不创建TCB,而是用一个hash表来表示,当前连接,如果接收到ACK然后再创建TCB    (3)Syn cookie技术【处理连接】通过一个cookie值来确定当前连接是否合法

    1.6K20发布于 2020-02-17
  • 来自专栏腾讯云TI平台

    技术干货 | 理解 Go 内存分配

    如果你也是个 Go 开发者,你是否关心过内存的分配和回收呢?创建的对象究竟需要由 GC 进行回收,还是随着调用栈被弹出,就消失了呢 GC 导致的 Stop The World 是否导致了你程序的性能抖动呢?

    6.9K40发布于 2021-08-13
  • 来自专栏vivo互联网技术

    干货】容器Web Console技术实现

    容器Web Console技术实现 1 Web Console背景 现如今,随着容器技术的普及,越来越多的公司都开始尝试将其与自身的业务相结合,以提高生产和运维效率。 2 Web Console技术原理 Web Console技术通过websocket实现。 目前专注于CaaS技术栈的开发工作。 本文章未经授权,禁止转载,授权请联系小助手微信: Labs2020

    3.3K10发布于 2019-03-19
  • 来自专栏机器学习算法与Python学习

    大数据HDFS技术干货分享

    关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 1 HDFS前言 设计思想 分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析; 在大数据系统中作用: 为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务 重点概念: 文件切块,副本存放,元数据 重要特性如下: ⑴ HDFS中的文件在物理上是分块存储(block),块的大小可以通过配置参数( d

    1.3K80发布于 2018-04-08
  • 来自专栏加米谷大数据

    技术干货 | Hbase的数据坐标

    Hbase在表里存储数据使用的是四维坐标系统。分别是:行健、列族、列限定符和时间版本。 如: 列族A 行健 列限定符(name) 列限定符(email) 列限定符C(password) aaa 单元(value1) 单元(value4) 单元(value7) bbb 单元(value2) 单元(value5) 单元(value8) ccc 单元(value3) 单元(value6) 时间版本1:单元(value9),时间版本2:单元(value10) 行健按照字典排

    1.3K40发布于 2018-04-02
  • 来自专栏JavaEdge

    05-大厂咋解决技术债的?

    这项工作本质上和管理技术债是一回事。因此,把小组叫技术债管理小组挺合适。 可行方案 理想国中,这样的小组会有一名技术产品经理,他既精通技术,又精通产品和利益相关者的管理工作。担任该职的人也可以是小组技术负责人,他为小组提供指导。 他须有足够时间工作,并与其他特性团队联络,还须牺牲自己时间来专注技术工作。这是个艰难角色,因为他在完成其他任务同时还不能让自己技术退步! 从特性团队中吸取的教训可以帮助组织过滤掉不适合的技术。那些表现很出色的技术可以推荐给核心团队,后者可以考虑让其他团队也采用它。 当然,出现相互矛盾的技术时,核心团队是仲裁者并决定哪个应该优先采用。 作者简介:魔都国企技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主,编程严选网创始人。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。

    20700编辑于 2024-05-26
  • 来自专栏携程技术

    干货 | 前端常用的通信技术

    作者简介 陈为平,携程市场部前端工程师,目前主要负责“携程运动”项目的大前端相关工作。 前段时间在忙开发携程运动项目和相应的微信小程序,其中和后端通信犹为频繁。get、post请求方法是很多前端童鞋使用最频繁的;websocket在11年盛行后方便了客户端和服务器之间传输,……and so on ,除了这些,还有很多我们不常使用的其他方式,但是在实际的业务场景中却真实需要。 本文总结了目前前端使用到的数据交换方式,阐述了业务场景中如何选择适合的方式进行数据交换( form ,xhr, fetch, SSE

    2.5K60发布于 2018-03-16
  • 来自专栏携程技术

    干货 | 携程技术演进之路

    作者简介 李小林,携程技术副总裁,平台研发中心负责人。从事IT互联网技术研发工作二十多年,目前负责携程基础设施平台。本文来自李小林在“2018携程技术峰会”上的分享。 二、携程技术演进路线 携程技术演进路线,可以大致分成三个阶段: 呼叫中心时代,主要是以线下业务驱动为主; 互联网+移动互联网时代,产品技术驱动为主; 数字化+AI时代,大数据驱动为主。 2.1.2 技术体系 这个时期的技术体系,具备初创企业典型特点。 首先是架构比较单一,主要的商业逻辑写在数据库层面。 2.2.2 技术体系 这个阶段的技术体系,跟大型互联网公司类似,以支持大流量并发访问和稳定性,扩展性为主,各个应用都是分层的。 2.3.2 技术体系 携程在这个阶段,技术体系主要是“ABC战略”。

    2.4K51发布于 2019-04-22
  • 来自专栏MongoDB中文社区

    技术干货| MongoDB时间序列集合

    社区招募为了让社区组委会成员和志愿者朋友们灵活参与,同时我们为想要深度参与社区建设的伙伴们开设了“招募通道”,如果您想要在社区里面结交志同道合的技术伙伴,想要通过在社区沉淀有价值的干货内容,想要一个展示自己的舞台 ,提升自身的技术影响力,即刻加入社区贡献队伍~ 点击链接提交申请:http://mongoingmongoing.mikecrm.com/CPDCj1B 获取更多精彩内容点击社区网站www.mongoing.com 添加小芒果微信(ID:mongoingcom)进入中文用户组技术交流群 长按二维码加入我们

    2.3K10编辑于 2022-05-12
  • 来自专栏沃趣科技

    技术干货 | 漫游Linux块IO

    在计算机的世界里,我们可以将业务进行抽象简化为两种场景——计算密集型和IO密集型。这两种场景下的表现,决定这一个计算机系统的能力。数据库作为一个典型的基础软件,它的所有业务逻辑同样可以抽象为这两种场景的混合。因此,一个数据库系统性能的强悍与否,往往跟操作系统和硬件提供的计算能力、IO能力紧密相关。

    2.1K30编辑于 2022-12-31
领券