首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习与python

    Yelp 故障转移策略的实现

    作者 | Yelp 工程团队 译者 | 王强 策划 | Tina 讲述 Yelp 工程师如何协调其流量故障转移流程,并在可靠性、性能和成本效率之间实现微妙平衡的故事。 在 Yelp 的早年间,我们经常会将超量流量太快发送到一个健康区域,结果把这个区域“融化”掉。 找到最优设置 随着时间的推移,Yelp 的某些核心组件(例如搜索基础架构)已针对性能做好了优化工作。 但是,Yelp 的大多数团队都不具备所有这些知识。 Dorothy Jung 是 Yelp 的工程经理。她在 LISA 和 SREcon 上介绍了很多可靠性最佳实践。Qui Nguyen 是 Yelp 的高级工程师兼技术主管。

    69220编辑于 2023-04-01
  • 来自专栏我爱计算机视觉

    GAN 优化 Yelp 形象图片广告

    简单介绍一下论文中提及到的Yelp网站如下图所示,它是美国著名商户点评网站,囊括各地餐馆、购物中心、酒店、旅游等领域的商户,用户可以在Yelp网站中给商户打分,提交评论,交流购物体验等,感觉跟中国的大众点评差不多 在Yelp上餐厅可以能够上传的它们的食品的广告图片宣传自己餐厅的特色。 企业主其实不清楚一个吸引顾客的“好”形象是什么样子的。 [在该论文种作者使用Yelp的图像数据集和基于星级的评估系统来衡量图像在促进餐饮业务发展方面的有效性]。 作者使用迁移学习来训练一个接受Yelp图像并预测星级的分类器。 3.3 GAN 如下所示:该论文中作者基于Yelp数据集训练了一个GAN模型。 4.2预处理 为了减小特征空间的大小,作者从Yelp数据集中选择感兴趣多个特定字段。并只保留商业id、 照片id、标签和星级。

    2.2K20发布于 2020-11-23
  • 来自专栏大数据-BigData

    Yelp 的 Spark 数据血缘建设实践!

    在这篇博文中,我们介绍了 Spark-Lineage,这是一种内部产品,用于跟踪和可视化 Yelp 的数据是如何在我们的服务之间处理、存储和传输的。 Spark 和 Spark-ETL:在 Yelp,Spark被认为是一等公民,处理各个角落的批量工作,从处理评论到识别同一地区的相似餐厅,到执行有关优化本地业务搜索的报告分析。 Spark-ETL 在 Yelp 被广泛使用,帮助节省了我们的工程师编写、调试和维护 Spark 作业所需的时间。 想象一下你自己是一名软件工程师,负责发布由几个关键 Yelp 服务使用的数据的微服务;您即将对批处理作业进行结构更改,并想知道您的服务的下游对象和内容将受到影响。 这篇文章介绍了 Yelp Spark-Lineage,并展示了它如何帮助跟踪和可视化我们服务之间的数据生命周期,以及 Spark-Lineage 在 Yelp 不同领域的应用。

    1.9K20编辑于 2022-09-16
  • 来自专栏深度学习与python

    Yelp 的 Apache Cassandra 集群重建解决方案

    作者 | Rafal Gancarz 译者 | 明知山 策划 | 丁晓昀 Yelp 构建了一个解决方案,利用其数据流架构来清理来自已损坏的 Apache Cassandra 集群的数据。 Yelp 将 Apache Cassandra 作为其平台许多组件的数据存储系统,他们根据数据、流量和业务需求为特定的场景提供了许多较小的 Cassandra 集群。 Yelp 软件工程师 Muhammad Junaid Muzammil 解释了选择重建损坏的 Cassandra 集群的原因: 由于数据损坏的情况很普遍,删除 SSTable 并进行修复并不是一种好的选择 读取请求的数据验证(来源:https://engineeringblog.yelp.com/2023/01/rebuilding-a-cassandra-cluster-using-yelps-data-pipeline.html ) 原文链接: https://www.infoq.com/news/2023/07/yelp-corrupted-cassandra-rebuild/ 声明:本文由 InfoQ 翻译,未经许可禁止转载

    40410编辑于 2023-09-08
  • 来自专栏大数据文摘

    Yelp,如何使用深度学习对商业照片进行分类

    一开始,为了帮助简化Yelp的问题,Yelp只专注于将照片分类为几个预定义的类。之后,Yelp又只专注于关于饭店的照片类别。 根据Yelp的描述,虽然这些数字绝对可以再提高,但Yelp发现对于下面描述的应用它们已经足够了。 照片分类服务 Yelp使用面向服务的架构(SOA),Yelp做了一个RESTful照片分类服务,用来支持现有的和即将推出的Yelp的应用程序。 多样化大大增加了Yelp用户与照片之间的互动。 ? 应用:标签式浏览照片 因为任何人浏览Yelp照片都是在有了解之前,大部分来自于饭店的Yelp照片都是食物。 Yelp表示,如果你想帮助提高Yelp照片分类的质量,请随意标注你看到的任何未分类的照片。

    1.2K30发布于 2018-05-23
  • 来自专栏CRM日记本

    Salesforce连接器在Yelp中的应用案例

    Yelp是美国著名商户点评网站,创立于2004年,囊括各地餐馆、购物中心、酒店、旅游等领域的商户,用户可以在Yelp网站中给商户打分,提交评论,交流购物体验等。 更好理解的解释是Yelp就是中国版的大众点评,巧合的是大众点评也在用Salesforce来管理商户。 Yelp的销售团队主要做什么呢?他们卖广告包!他们卖给谁呢?Yelp上的商家!那我们如何从Yelp的数据库中获取这些商家信息并提供给Salesforce呢?读过下文你就明白了。 处理器,叫这个名字是因为它与Storm很相似,并且是用Yelp PaaSTA部署的。 选它是因为它是我们Yelp整体业务中规模比较小的表之一,但对于我们的销售团队的运作又是非常重要的。在之前要把数据变更操作从Yelp同步到Salesforce需要16小时。

    1.5K20发布于 2019-04-16
  • 来自专栏Flink实战应用指南

    Flink Forward 2019--实战相关(9)--Yelp公司分享CEP应用

    Creating millions of user sessions using Complex Event Processing -- Prem Santosh & Udaya Shankar(Yelp ) Every day, Yelp connects millions of consumers with great local businesses through the website and 每天,Yelp都通过网站和移动应用程序将数百万消费者与当地的大企业联系起来。我们通过不断地运行大量基于用户活动的实验,努力为用户提供不断发展、卓越的体验。 In this talk we will not only discuss why Yelp moved from creating user sessions using batch jobs to 在本次讨论中,我们不仅将讨论Yelp为什么从使用批处理作业创建用户会话转移到使用Flink近实时生成用户会话,还将重点讨论我们在不关闭会话窗口的连续bot通信中遇到的问题,为长时间运行的会话添加自定义触发器

    71400发布于 2019-07-11
  • 来自专栏深度学习与python

    Yelp 使用 Apache Beam 和 Apache Flink 彻底改造其流式架构

    译者 | 王强 策划 | 丁晓昀 Yelp 公司 采用 Apache Beam 和 Apache Flink 重新设计了原来的数据流架构。 Yelp 在两套不同的在线系统中管理业务实体(其平台中的主要数据实体之一)的属性。 Yelp 团队决定解决原有方案的这些问题,方法是将在线系统的内部实施细节抽象出来,并为使用分析数据存储的客户提供一致的体验。 业务属性的新流式架构(来源:Yelp 工程博客) 彻底改造流式架构的总体收益是让数据分析团队能够通过单一模式访问业务属性数据,这有助于数据发现,让数据消费更简单。 /news/2024/04/yelp-streaming-apache-beam-flink/)

    55010编辑于 2024-05-06
  • 来自专栏云原生技术社区

    案例分享 | Yelp 如何在 Kubernetes 上运行 Kafka(第 2 部分 - 迁移)

    本文译自 Kafka on PaaSTA: Running Kafka on Kubernetes at Yelp (Part 2 - Migration)[1]作者:Lennart Rudolph 我们不需要寻找 ELB 的替代品,因为 PaaSTA 通过 Yelp 的服务网格提供了原生的负载平衡能力,这使得在组成集群的 Kubernetes 容器上发布 Kafka 变得简单。 下表提供了跨部署方法的不同组件的概述: 零件 EC2 PaaSTA 集群入口点 电子负载均衡器 Yelp 的服务网格 集群平衡 kafka-utils 中的再平衡算法 巡航控制 主题自动分区 cron 为了了解更多情况,在 Yelp,我们使用一组kafka_discovery文件(由 Puppet 生成),其中包含每个集群的引导服务器、ZooKeeper[3] chroot 和其他元数据的信息。 /schematizer [5] Monk: https://engineeringblog.yelp.com/2020/01/streams-and-monk-how-yelp-approaches-kafka-in

    1.4K40编辑于 2022-08-12
  • 来自专栏爱生活爱编程

    neo4j APOC插件安装以及Yelp示例数据导入

    .* 4、$NEO4J_HOME/bin/neo4j restart 5、通过以下命令验证安装是否成功 ​RETURN apoc.version(); Yelp示例数据导入 定义图模式(约束/索引) CALL apoc.schema.assert( {Category:['name']}, {Business:['id'],User:['id'],Review:['id']}); 下载business.json数据https://www.yelp.com /dataset/download 或者 https://www.kaggle.com/yelp-dataset/yelp-dataset/version/9#yelp_academic_dataset_business.json :以下加载数据命令需要yelp第10轮的数据才可以正常运行 下载business.json到$NEO4J_HOME/import(neo4j数据导入位置) 配置conf,添加 apoc.import.file.enabled

    1.9K20发布于 2021-01-14
  • 来自专栏Flink实战应用指南

    Flink Forward 2019--实战相关(16)--Yelp分享实时访问规模预测

    Realtime Store Visit Predictions at Scale -- Luca Giovagnoli(Yelp) This talk aims to inspire attendees It availed itself as a clearly superior alternative, whose performance netted Yelp great cost savings 它显然是一个优秀的替代方案,它的性能使Yelp节省了大量的成本,并使我们摆脱了难以扩展的Python替代方案。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

    52930发布于 2019-08-20
  • 来自专栏云原生技术社区

    案例分享 | Yelp 如何在 Kubernetes 上运行 Kafka(第 1 部分 - 架构)

    本文译自 Kafka on PaaSTA: Running Kafka on Kubernetes at Yelp (Part 1 - Architecture)[1]。 作者:Lennart Rudolph 在 Yelp,Kafka 每天接收数百亿条消息来推进数据驱动并为关键业务管道和服务提供支持。 我们最近通过在 PaaSTA (Yelp 自己的平台即服务)上运行集群,对 Kafka 部署架构进行一些改进。 Yelp 之前开发了在 Kubernetes 上运行有状态应用程序的实践(例如,Cassandra on PaaSTA and Flink on PaaSTA),因此 PaaSTA 是这个用例的自然选择 引用链接 [1] 原文链接: https://engineeringblog.yelp.com/2021/12/kafka-on-paasta-part-one.html

    83820编辑于 2022-08-12
  • 来自专栏Flink实战应用指南

    Flink Forward 2019--实战相关(17)--Yelp分享实时访问规模预测

    Using Flink to inspect live data as it flows through a data pipeline -- Matthew Dailey(Splunk)

    84530发布于 2019-08-23
  • 来自专栏数据科学与人工智能

    【深度学习】Yelp是如何使用深度学习对商业照片进行分类的

    一开始,为了帮助简化Yelp的问题,Yelp只专注于将照片分类为几个预定义的类。之后,Yelp又只专注于关于饭店的照片类别。 根据Yelp的描述,虽然这些数字绝对可以再提高,但Yelp发现对于下面描述的应用它们已经足够了。 照片分类服务 Yelp使用面向服务的架构(SOA),Yelp做了一个RESTful照片分类服务,用来支持现有的和即将推出的Yelp的应用程序。 多样化大大增加了Yelp用户与照片之间的互动。 ? 应用:标签式浏览照片 因为任何人浏览Yelp照片都是在有了解之前,大部分来自于饭店的Yelp照片都是食物。 Yelp表示,如果你想帮助提高Yelp照片分类的质量,请随意标注你看到的任何未分类的照片。

    1.8K50发布于 2018-02-27
  • 来自专栏Rainbond开源「容器云平台」

    【微服务干货系列】Yelp公司总结的微服务架构的实践经验

    技术无关性 大多数情况下,Yelp使用的是Python,有一些后台服务是Java的。如果你的服务希望 Python and Java都能调用,那么做成服务能够帮你避免重复写两个库。 测试 应该能够对任何接口变更进行自动化测试 Yelp没有单独的QA工程师。相反我们靠计算机来进行校验工作。你的服务由你来负责维护测试工具。测试应该在开发和测试环境中都能够快速可靠的完成。

    70120发布于 2018-05-31
  • 来自专栏AI科技评论

    开发 | 美国最大点评网站Yelp公开内部数据集,面向学生发起多样挑战赛

    AI 科技评论消息:日前,美国最大的点评网站Yelp公开其内部数据集。据官网介绍,这是一个通用数据集,开放这个数据集的主要目的是帮助学习。 这个数据集是Yelp涵盖的商户、点评和用户数据的一个子集,可以用于个人、教育和学术。 在GitHub上还有更多的例子: https://github.com/Yelp/dataset-examples SQL 与大多数关系数据库兼容 填充表具有引用完整性 只有一个文件,容易导入 表格之间的联系和结构如下图所示 关于数据集的挑战赛 yelp希望更多的学生利用这些数据,在研究中想出创新性方法,他们也提供了目前感兴趣的一些主题。 via:https://www.yelp.com/dataset

    1.3K40发布于 2018-03-13
  • 来自专栏爬虫资料

    GraphQL接口采集:自动化发现和提取隐藏数据字段

    接口采集 展开,重点介绍如何自动化发现和提取隐藏数据字段,使用 requests + Session 来构造 GraphQL 请求,配合爬虫代理、Cookie 和 User-Agent 设置,实现对 Yelp 错误示例盲目解析页面 HTML很多用户在不了解 GraphQL 机制时,仍然用传统的 BeautifulSoup 解析 Yelp HTML 页面,然后通过正则或 CSS Selector 抽取数据。 这种方式弊端明显:无法获取隐藏字段:Yelp 许多数据(如商家详细属性、内部 ID)仅在 GraphQL 响应中存在,HTML 中压根不包含。 陷阱提示API 限速:Yelp GraphQL 按数据点(points)限流,每 24h 限额 25000 点,超额后请求会被拒绝。 Auth/Header 校验:Yelp 可能校验 Authorization 或自定义头部,抓包时需完整复制所有请求头。

    36110编辑于 2025-04-22
  • 来自专栏机器学习AI算法工程

    对美食评语进行情感分析

    Yelp是美国著名商户点评网站,创立于2004年,囊括各地餐馆、购物中心、酒店、旅游等领域的商户,用户可以在Yelp网站中给商户打分,提交评论,交流购物体验等。 Yelp Reviews Yelp Reviews是Yelp为了学习目的而发布的一个开源数据集。它包含了由数百万用户评论,商业属性和来自多个大都市地区的超过20万张照片。 数据集下载地址为: https://www.yelp.com/dataset/download Yelp Reviews格式分为JSON和SQL两种,以JSON格式为例,其中最重要的review.json 专门有个开源项目用于解析该JSON文件: https://github.com/Yelp/dataset-examples 该项目可以将Yelp Reviews的Yelp Reviews转换成CSV格式 当我们把Yelp数据集转换成词袋序列后,就可以尝试使用LSTM来进行处理。

    2.4K20发布于 2019-10-29
  • 来自专栏HTML5学堂

    原型继承面试题精讲

    题目要求 有一条可爱的小狗(名字叫“小狗狗”),它的叫声很好听(wow),每次看到主人的时候就会乖乖叫(yelp)。 另一只小狗精力很旺盛(名字叫做“精力旺盛的狗狗”),每隔5秒叫唤(yelp)一声(wow)。 使用面向对象的混合模式实现小狗的创建 function Dog() { this.name = '小狗狗'; this.wow = 'wow'; } Dog.prototype.yelp //www.h5course.com */ function Dog() { this.name = '小狗狗'; this.wow = 'wow'; } Dog.prototype.yelp '; } for (var i in Dog.prototype) { MadDog.prototype[i] = Dog.prototype[i]; }; MadDog.prototype.yelp

    76740发布于 2018-03-12
  • 来自专栏拓端tecdat

    适用于NLP自然语言处理的Python:使用Facebook FastText库

    最后,更新后的数据帧以的形式写入yelp_reviews_updated.txt。 Drive/Colab Datasets/yelp_reviews_test.txt" yelp_reviews_train.txt便会生成包含训练数据的文件。 /fasttext supervised -input "/content/drive/My Drive/Colab Datasets/yelp_reviews_train.txt" -output model_yelp_reviews /fasttext test model_yelp_reviews.bin "/content/drive/My Drive/Colab Datasets/yelp_reviews_test.txt" /fasttext test model_yelp_reviews.bin "/content/drive/My Drive/Colab Datasets/yelp_reviews_test_clean.txt

    1.3K11发布于 2020-09-25
领券