首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Spark学习技巧

    数据调研

    概述 本文转自:http://tang.love/2018/08/31/graph_database_research/ 这里记录一下图数据相关的调研结论。 图数据库的主要优点: 更好,更快速的查询和分析; 更简单和更自然的数据建模; 同时支持实时更新和查询; 数据结构的灵活性。 图数据库是所有数据管理系统中成长最快的分类,下面分别从图检索语言和图数据库两个方面来介绍图数据市场的发展。 Microsoft Azure Cosmos DB Cosmos DB是微软2010年立项,经过7年研发,于2017年5月正式发布的云数据库服务,该数据库服务支持图数据、列存储、键值存储和文档数据库等多种数据模型 AWS提供了多种不同类型的云数据库产品供用户选择,比如:关系型数据库(Aurora / RDS),数据仓库(Redshift),内存数据库(ElastiCache),图形数据库(Neptune)和NoSQL

    8.4K30发布于 2020-09-27
  • 来自专栏前端笔记薄

    校验数据结构调研

    校验数据结构 如何校验数据结构,一般情况下,我们应该考虑现成的轮子。 它的 API 设计非常直观,可以轻松地定义和校验复杂的数据结构。 z-schema:是一个快速的库,支持 JSON Schema Draft 4。 用法 ajv主要用于验证JSON数据的结构,但也支持异步验证、关联和关键字验证等高级功能。 相比之下,joi更适合于验证JavaScript对象、字符串和数字等数据类型,但它的API设计非常直观,可以轻松地定义和验证复杂的数据结构。 如果主要需要验证JSON数据的结构且考虑性能,那么ajv可能是更好的选择。如果需要验证JavaScript对象、字符串和数字等更多的数据类型,那么joi可能是更好的选择。

    1.4K20编辑于 2023-04-22
  • 来自专栏数据订阅

    数据调研

    数据调研.pptx 图数据库: 更好,更快速的查询和分析:图数据库为查询相关数据(无论大小)提供了卓越的性能。 图模型提供了固有的索引数据结构,因此它不需要为给定条件的查询加载或接触不相关的数据。 这使得它成为更好、更快的实时大数据分析查询的绝佳解决方案。 。 更简单和更自然的数据建模:使用关系型数据库建模的人都需要了解数据库的规范化和参照完整性的严格规则。 一些NoSQL数据库则走向了另一个极端,将所有类型的数据放在一个大型表中。 另一方面,在图数据库中,可以定义任意类型的顶点类型来表示对象,并定义边类型来表示特定的关系。 同时支持实时更新和查询:图数据库支持对大图形数据的实时更新,同时支持查询。 数据结构的灵活性:图数据库具有灵活的schema修改。 用户可以不断添加或删除新的顶点、边和属性,扩展或缩小数据模型。 这对管理不断变化的对象类型特别方便。

    2.6K200发布于 2018-06-28
  • 来自专栏机器学习AI算法工程

    怎样分析样本调研数据(译)

    根据数据收集的算法、调研问题的类型和调研的目标,分析样本调研数据的方法各不相同。这篇文章会简洁明了的分析调研数据过程中的各种问题,同时会说明在一个完整的调研数据分析报告中应该包含什么。 调研数据分析的过程应该包括以下步骤: 1、数据验证和探索性分析 2、确认性分析 3、数据解释 4、数据分析报告存档(用于将来的分析) 1数据验证和探索性分析 数据验证主要负责确认调查问卷被正确的完成,并且调研数据具有一致性和逻辑性 3、维度转换:根据可比性或兼容性的目标,调研数据会使用不同的长度和种类。 2确认性分析 探索性分析可以描述发生了什么,但是这只是试探性的。 3数据解释 当你完成数据分析,是时候考虑一下调研的结果对于手头上的问题有什么意义。以下是你在数据解释的过程中应该注意的方面: 1、清楚的阐述调研结果有什么实质性的发现。 3、运用调研中的定量数据对于目标群体进行定量预测。 4、解释你现在的数据分析结果对于调研目标的意义,而且如果需要的话,对下一步调研的步骤给予建议。

    1.6K40发布于 2018-03-09
  • 来自专栏PPV课数据科学社区

    【学习】怎样分析样本调研数据

    根据数据收集的算法、调研问题的类型和调研的目标,分析样本调研数据的方法各不相同。这篇文章会简洁明了的分析调研数据过程中的各种问题,同时会说明在一个完整的调研数据分析报告中应该包含什么。 调研数据分析的过程应该包括以下步骤: 1、数据验证和探索性分析 2、确认性分析 3、数据解释 4、数据分析报告存档(用于将来的分析) 数据验证和探索性分析 数据验证主要负责确认调查问卷被正确的完成,并且调研数据具有一致性和逻辑性 3、维度转换:根据可比性或兼容性的目标,调研数据会使用不同的长度和种类。 确认性分析 探索性分析可以描述发生了什么,但是这只是试探性的。 数据解释 当你完成数据分析,是时候考虑一下调研的结果对于手头上的问题有什么意义。以下是你在数据解释的过程中应该注意的方面: 1、清楚的阐述调研结果有什么实质性的发现。 3、运用调研中的定量数据对于目标群体进行定量预测。 4、解释你现在的数据分析结果对于调研目标的意义,而且如果需要的话,对下一步调研的步骤给予建议。

    1.4K70发布于 2018-04-23
  • 来自专栏计算机视觉life

    SLAM相关领域数据调研

    and Methodolgy、Evaluation: Introduction:列一下相关的开源数据集;说明自己做这个数据集的原因(现有数据集都过分简单,严格限制路况从而没有包含现实路上的实际情况等) ;介绍自己数据集的采集方式、包含的内容等; Challenges and Methodolgy:主要写了数据采集会遇到的问题以及要做的所有事情。 对牛津的一部分连续的道路进行了上百次数据采集,收集到了多种天气行人和交通情况下的数据,也有建筑和道路施工时的数据,总的数据长度达1000小时以上。 W. Maddern, G. 是真实世界数据集,主要针对语义分割。 遗憾的是数据集还没有开放下载。

    2.1K00发布于 2019-07-11
  • 数据安全-分类分级 调研分析报告

    一、数据分类分级概述 大数据时代,数据呈现多源异构的特点,价值各不相同,企业应根据数据的重要性、价值指数等方面予以区分,便于采取不同的数据保护措施,防止数据泄露。 IT部门/数据管理部门视角– 关注的不是业务分工,而是数据自身在IT系统里如何承载、管理、呈现,所以有IT/数据管理部门将数据分类为结构化、非结构化数据,主数据、交易数据、元数据等。 行业领域维度:将数据分为工业数据、电信数据、金融数据、交通数据、自然资源数据、卫生健康数据、教育数据、科技数据等。 组织经营维度:将数据分为用户数据、业务数据、经营管理数据、系统运行和安全数据。 3.分级标准 从国家数据安全角度出发,数据分级基本框架分为一般数据、重要数据、核心数据三个级别。 2.3数据资产地图 利用数据处理程序对采集的数据进行清洗、解析、处理,通过数据识别和分类分级引擎,结合数据识别策略、分类分级策略、数据识别和分类模型对处理后的数据进行匹配识别,准确定位数据中包含的敏感数据或重要数据

    78500编辑于 2025-04-07
  • 嵌入式数据调研

    最近需要使用嵌入式数据库进行存储应用本地信息,本文章主要进行记录当前比较流行的嵌入式数据库相关的链接,嵌入式数据库往往是以lib的形式存在,常用于持久化存储软件的信息,嵌入式数据库往往和应用软件紧密集成 常用的嵌入式数据库:(主要索引几个我比较感兴趣的数据库) SQLite 嵌入式关系数据库:https://www.sqlite.org/index.html (关系数据库) Apache Derby:  ) 数据目录表:https://dbdb.io/ (包含很多数据库的介绍,很好的网站,可以理清众多数据库之间的关系) LevelDB:https://github.com/google/leveldb( 嵌入式K-V数据库) RocksDB :https://github.com/facebook/rocksdb/ (嵌入式K-V数据库,基于leveldb)  https://rocksdb.org/  ) Tokyo Cabinet:https://dbdb.io/db/tokyo-cabinet (嵌入式K-V数据库) https://db-engines.com/en/ranking (数据库引擎排行榜

    1.9K20发布于 2020-12-30
  • 来自专栏程序员备忘录

    Python获取股票机构调研数据

    而这种所谓串通一气的方式就叫做“机构调研”,也就是说机构管理者会在持股前与上市公司进行沟通,表达机构想要持有该上市公司的股票的想法。 当然也不能说这么明白的话,机构调研除了投资的成分还有现场观摩等,相当于机构了解了该公司运作,当然具体的调研结果也是会通过报表的方式向外进行暴露。 一个潜在的现象是调研后的股票会有一定的异动,所以这也是一般投资者应该关注的地方。 所以这块作者就通过天天基金网站来拉取股票的机构调研信息。 def __init__(self): self.connection = Connection() #解析数据 def printJgdyInfo(self connect.commit() # tianjl = JgdyQuery() # tianjl.printJgdyInfo("300232",1) 如下图所示为作者拉取部分上市公司的机构调研数据的结果

    63320编辑于 2022-08-11
  • 来自专栏代码工具

    ONNX调研

    它使得不同的人工智能框架(如Pytorch、MXNet)可以采用相同格式存储模型数据并交互。 调研目的: 提高当前在线推断模型的性能, 最大限度地降低工程的机器成本。二. ONNX Runtime(ORT) 使用1. 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour , iris-virginica)中的哪一品种iris = load_iris()X, y = iris.data, iris.target# 测试集和训练集打散拆分,这里一定要打散,因为原始数据是相对有序的 LinearClassifier" attribute { 此处内容过多已省略... }第四步: Direct Predict使用ONNX Runtime Python API预测该ONNX模型,当前仅使用了测试数据集中的第一条数据

    1.6K51编辑于 2022-06-30
  • 来自专栏靠谱PM

    调研现场

    上两篇文章中写到为什么要做用户调研以及用户调研的流程,今天来说下调研现场应该怎么做。 调研工具 俗话说:“工欲善其事,必先利其器。” 那么调研现场的工具肯定是必不可少的,这里也顺便说下,用户调研的现场和可用性测试(关于可用性测试如果以后有机会单独写一篇文)的现场处理的方式都是大同小异的。 ,否则用户习惯不同的设备就崩溃了,更不用说调研了。 三、统计工具 这个上篇文章中已经说过了,调研的目标用户要通过这些工具去抓取的,工具如(GA 、诸葛io等),这个就没法普及了,这些抓取的数据都是属于公司的机密,可以去官网上去看下工具的介绍。 调研前的暖场 这个还是有必要说一下的,用户来到调研现场不要上来就直接进入调研,这其实和我们到一个陌生环境里一样心理都会有一些防范,所以理想的做法就是先从家常聊起,比如今天天气好热啊,您怎么过来的?

    77460发布于 2018-09-10
  • 来自专栏万能的小草

    Redash调研

    透过上文可以清晰的知道Redash可以帮助我们进行数据赋能。整个工作流为:连接数据> 数据查询> 数据可视化,轻松实现数据的团队共享。 目标用户:总部业务分析人员。 三、快速入手 1.添加数据源 您要做的第一件事是连接数据源(请参阅支持的数据源)。您可以通过单击“设置”图标来打开“数据源”管理页面: ? 如果您使用Hosted Redash服务,并且您的数据源位于防火墙后面,则需要允许从52.71.84.157数据库防火墙/安全组中的IP地址进行访问。 如果可能, 我们建议使用具有只读权限的用户。 3.添加可视化 默认情况下,您的查询结果(数据)将显示在简单表中。可视化会更好地帮助您消化复杂的信息,因此让我们可视化您的数据。Redash支持多种类型的可视化,因此您应该找到一种适合您的需求。 四、总结 总而言之,Redash 是一款很不错的数据查询+ 可视化+ 用户体验超级nice的工具,尤其是数据查询页面库表检索、表名自动补全、定时执行功能简直完美。

    3.2K21发布于 2020-02-19
  • 来自专栏采云轩

    数据技术调研以及业务实践

    什么是图数据库以及应用范围? 图数据库是 NoSQL 的一种,一种将关联数据的实体作为顶点,关系作为边来存储的特殊类型数据库,能够高效地对这些点边结构进行存储、检索和查询。 这里说到数据模型,主要是为了说明不同的数据关系是我们选择不同的数据库的原因,因为不同的数据模型对应了更适合哪种数据关系。 虽然关系型数据库与文档类型的数据库,都可以用来描述图结构的数据模型,但是,图(数据库)不仅可以描述图结构与存储数据本身,更着眼于处理数据之间的关联(拓扑)关系。 ratel:提供用户界面来执行数据查询,数据修改及元数据管理。 alpha:用于管理数据(谓词和索引),外部用户主要都是和 alpha 进行数据交互。 设计框架图 Dgrpah数据生产 目标 不管是现有的数据还是以后实时产生的数据,原来的业务数据都是存储在各个业务方的关系数据库,我们都需要将历史数据和实时增量数据导入到 Dgraph 数据库。

    92510编辑于 2023-09-01
  • 来自专栏音视频技术

    有奖调研

    随着疫情的反复,我们也深刻认识到,只有随时随地接入的线上产品才能全天候的服务用户,因此本调研应运而生。接下来的3分钟,您将回答一系列问题,从而帮助LiveVideoStack更好的筹备新产品。

    57330编辑于 2022-06-09
  • 来自专栏数据派THU

    国内高校大数据教研机构调研报告

    2015年9月,国务院印发《促进大数据发展行动纲要》,开始部署大数据相关工作,推进大数据产业的平稳发展。“十三五”规划中也明确提出实施国家大数据战略,实现数据资源共享。 例如清华大学虽然没有开设大数据本科专业,但是成立了清华大学大数据研究中心,设立了大数据硕士项目和大数据能力提升项目。 ,结合对国内外学界在大数据领域成果进展的数据调研,对比分析各高校大数据教研机构在学术研究领域的影响力;社会影响力关注各高校大数据教研机构的媒体指数,从高校大数据教研机构的传播内容、传播渠道、传播效果等维度进行数据调研对比 因半结构化数据和非结构化数据在大数据中占比较大,不少研究人员针对此类数据进行研究。 可以看到,所选择的高校大数据教研机构微信平台传播影响力大小依次为:数据派THU(清华大学大数据研究中心)、中国人民大学统计与大数据研究院、北京大数据研究院、复旦大数据学院、北大健康医疗大数据国家研究院、

    88340发布于 2021-07-16
  • 来自专栏音视频咖

    有奖调研 | 公众号内容偏好问卷调研

    有奖调研,先填先得! 有效填写问卷且关注公众号超过24小时的前120名用户 每人都送30QB~ 赶紧扫描下方二维码 抽出几分钟,将您的真实感受和建议告诉我们吧! ?

    84820发布于 2021-05-21
  • 来自专栏钱塘大数据

    【图说】中国大数据应用前沿调研报告

    来源:第一财经研究院

    95440发布于 2018-03-01
  • 来自专栏大数据文摘

    数据堂:大数据产业调研及分析报告(145页)

    回复“分析报告”下载《大数据产业调研及分析报告》全文145页,如果您的公司未被收录,请点击文末“阅读原文”填表,《大数据企业名录》将逐步完善。 大数据的概念已渗透到各行各业,全球大数据市场规模年增长率达40%,预计在2017年将达530亿美元。各行业的大数据运用分析到底如何? 本期大数据文摘跟您分享数据堂的《大数据产业调研及分析报告》,报告大数据产业链划分(彭博)为框架,对国内外大数据产业链条进行了全面梳理,收录了近300余家国内大数据企业和应用。 报告目录如下: ? 图.我国大数据产业链布局 (二)我国大数据源尚待激活 大数据的开放和流通是政府、企业和学术界面临的首要挑战,只有多源头、跨领域的关联分析才有可能实现数据价值的深度挖掘,能否从多源、异构的海量数据中快速获得有价值信息 (四)以数据开放和应用创新作为培育大数据产业链的主要手段 以大数据供需两端(数据源和应用环节)为抓手实现重点突破,大力推动全社会的数据开放,尤其是政府数据的开放,力争在短期内降低全社会的数据获取成本并起到显著的社会示范效应

    1.5K70发布于 2018-05-21
  • 来自专栏PM吃瓜(公众号)

    需求调研报告

    1调研流程 需求分析是需求工程的核心, 分为4个阶段 识别需求 解决目标系统做什么,做到什么程度 功能,性能,环境,可靠性,安全性,保密性,用户界面,资源使用,成本,进度。 分析需求-》 将需求计算机化 从数据流和数据结构出发,逐渐找到所有的软件功能, 找出各元素之间联系,接口特性,设计上的限制, 分析是否满足功能要求, 剔除不合理部分, 综合成解决方案, 给出目标系统的详细逻辑模型 建模方法:数据流图,数据字典, ER图,时序图,UML, 基本需求 关键需求 编制需求分析文档 需求规格说明书 评审需求 评审需求规格说明书, 确保与用户达成共识 2 调研和分析方法 工具推荐 功能模块分解 用visio 业务流程图用visio中的flowchart 系统逻辑模型 用visio中的UML 界面用 数据模型用power design 3.相关要求 关键活动 ?

    2.9K42发布于 2020-08-12
  • 来自专栏全栈程序员必看

    动作识别调研

    (4)缺乏标注良好的大的数据集 有那些解决方法? 最好的传统的方法? iDT 当前的深度学习的方法? 数据集  The HMDB-51 dataset(2011) Brown university 大学发布的 HMDB51, 视频多数来源于电影,还有一部分来自公共数据库以及YouTube等网络视频库 .数据库包含有6849段样本,分为51类,每类至少包含有101段样本。 数据集更具有普适性 R(2+1)D S3D? MIT最近公布了新的数据集 Moments in time,Moments in Time,在这个数据集里,action成为关键。

    1.4K30编辑于 2022-09-20
领券