首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏BestSDK

    10款最好用的,开源大数据分析工具

    考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的大数据收集与分析工具。然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作。 考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的大数据收集与分析工具。然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作。 下面我们将整理出一份包含十款工具的清单,从而有效压缩选择范畴。 1. OpenRefine 这是一款高人气数据分析工具,适用于各类与分析相关的任务。 这款工具常由新一代数据科学家使用,因为其属于一款业务开发平台且能够快速完成大规模数据的理解与分析。 5. 10. Neo4j 其官方网站将这款工具称为图形数据库技术的下一场革命。这种说法在一定程度上并不夸张,因为此套数据库使用数据间的关系以操作并强化性能表现。

    4.8K60发布于 2018-03-01
  • 来自专栏人芳觅

    Win10下Python数据分析工具配置入门

    “本文介绍windows10下python环境的搭建与使用入门,通过Anaconda+jupyter notebook实现python程序的完整执行。可直接跳到文末领取需要的资源。” 安装数据集 pip install tensorflow-datasets pip install tensorflow-hub 4. 继续输入jupyternotebook,打开例子验证 ? jupyter kernelspec remove tensorflowenv 09 — 资源分享 后台回复“conda”,可获得资源: Anaconda最新win10版本(20210327) TensorFlow

    87450发布于 2021-04-12
  • 来自专栏灯塔大数据

    干货 | 10款超好用的开源大数据分析工具

    考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的大数据收集与分析工具。然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作。 考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的大数据收集与分析工具。然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作。 1. OpenRefine 这是一款高人气数据分析工具,适用于各类与分析相关的任务。这意味着即使大家拥有多川不同数据类型及名称,这款工具亦能够利用其强大的聚类算法完成条目分组。在聚类完成后,分析即可开始。 这款工具常由新一代数据科学家使用,因为其属于一款业务开发平台且能够快速完成大规模数据的理解与分析。 5. 10. Neo4j 其官方网站将这款工具称为图形数据库技术的下一场革命。这种说法在一定程度上并不夸张,因为此套数据库使用数据间的关系以操作并强化性能表现。

    2.4K50发布于 2018-04-04
  • 来自专栏CDA数据分析师

    推荐 | 10款超好用的网站数据实时分析工具

    网络分析工具可以帮助你收集、预估和分析网站的访问记录,对于网站优化、市场研究来说,是个非常实用的工具。 每一个网站开发者和所有者,想知道他的网站的完整的状态和访问信息,目前互联网中有很多分析工具,本文选取了10款最好的分析工具,可以为你提供实时访问数据。 1. Google Analytics ? 与Google Analytics这种庞大的分析系统相比,Clicky相对比较简易,它在控制面板上描供了一系列统计数据,包括最近三天的访问量、最高的20个链接来源及最高20个关键字,虽说数据种类不多,但可直观的反映出当前站点的访问情况 该工具可以让你查看访客数据,并分析趋势,以及比较几天内的变化情况。 7. Reinvigorate ? 它提供了所有常用的实时分析功能,可以让你直观地了解访客点击了哪些地方。 10. FoxMetrics ? 该工具提供了实时分析功能,基于事件和特征的概念,你还可以设置自定义事件。它可以收集与事件和特征匹配的数据,然后为你提供报告,这将有助于改善你的网站。

    3K70发布于 2018-02-23
  • 来自专栏灯塔大数据

    干货|非常实用的10款网站数据实时分析工具

    网络分析工具可以帮助你收集、预估和分析网站的访问记录,对于网站优化、市场研究来说,是个非常实用的工具。每一个网站开发者和所有者,想知道他的网站的完整的状态和访问信息,目前互联网中有很多分析工具。 Clicky 与Google Analytics这种庞大的分析系统相比,Clicky相对比较简易,它在控制面板上描供了一系列统计数据,包括最近三天的访问量、最高的20个链接来源及最高20个关键字,虽说数据种类不多 GoSquared 它提供了所有常用的分析功能,并且还可以让你查看特定访客的数据。它集成了olark,可以让你与访客进行聊天。 6. Mixpanel 该工具可以让你查看访客数据,并分析趋势,以及比较几天内的变化情况。 7. Reinvigorate 它提供了所有常用的实时分析功能,可以让你直观地了解访客点击了哪些地方。 10. FoxMetrics 该工具提供了实时分析功能,基于事件和特征的概念,你还可以设置自定义事件。它可以收集与事件和特征匹配的数据,然后为你提供报告,这将有助于改善你的网站。

    1.2K70发布于 2018-04-09
  • 来自专栏架构驿站

    【性能分析】大数据分析工具

    数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。 在大数据和大数据分析,他们对企业的影响有一个兴趣高涨。大数据分析是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策。 、新算法设计、软件分支与工具、计算计算及高性能计算研究中心等; 3、国家科研与教育网格(NREN),内容有中接站及10亿位级传输的研究与开发; 4、基本研究与人类资源(BRHR),内容有基础研究、培训、 该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。 多层次的数据视图,确保有效和透明的数据 7. 图形用户界面的互动原型 8. 命令行(批处理模式)自动大规模应用 9. Java API(应用编程接口) 10. 简单的插件和推广机制 11.

    1.7K50编辑于 2022-03-25
  • 来自专栏钱塘大数据

    干货丨10款非常实用的网站数据实时分析工具

    Google Analytics 这是一个使用最广泛的访问统计分析工具,几周前,Google Analytics 推出了一项新功能,可以提供实时报告。 Chartbeat 这是针对新闻出版和其他类型网站的实时分析工具。针对电子商务网站的专业分析功能即将推出。它可以让你查看访问者如何与你的网站进行互动,这可以帮助你改善你的网站。 5. Mixpanel 该工具可以让你查看访客数据,并分析趋势,以及比较几天内的变化情况。 7. Reinvigorate 它提供了所有常用的实时分析功能,可以让你直观地了解访客点击了哪些地方。 Piwik 这是一个开源的实时分析工具,你可以轻松下载并安装在自己的服务器上。 9. ShinyStat 该网站提供了四种产品,其中包括一个有限制的免费分析产品,可用于个人和非营利网站。 10. FoxMetrics 该工具提供了实时分析功能,基于事件和特征的概念,你还可以设置自定义事件。它可以收集与事件和特征匹配的数据,然后为你提供报告,这将有助于改善你的网站。 来源:太平洋电脑网

    1.3K70发布于 2018-03-01
  • 来自专栏FreeBuf

    Python工具分析风险数据

    小安前言 随着网络安全信息数据大规模的增长,应用数据分析技术进行网络安全分析成为业界研究热点,小安在这次小讲堂中带大家用Python工具对风险数据作简单分析,主要是分析蜜罐日志数据,来看看一般大家都使用代理 数据分析工具介绍 工欲善其事,必先利其器,在此小安向大家介绍一些Python数据分析的“神兵利器“。 Python中著名的数据分析库Panda Pandas库是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建,也是围绕着 Series 和 DataFrame 两个核心数据结构展开的,其中Series 我们有了这些“神兵利器“在手,下面小安将带大家用Python这些工具对蜜罐代理数据作一个走马观花式的分析介绍。 1 引入工具–加载数据分析包 启动IPython notebook,加载运行环境: ? 移除所有行字段中有值属性小于10的行 5 统计分析 再对数据中的一些信息有了初步了解过后,原始数据有22个变量。从分析目的出发,我将从原始数据中挑选出局部变量进行分析

    2.2K90发布于 2018-02-24
  • 来自专栏商业智能方案

    10年老分析师最终抛弃Excel,它不是最好的数据分析工具

    作为一个接触excel已经有10余年的老数据分析师,曾经靠着我精湛的Excel技能在职场打下一片天,Excel 成就了我早期的数据分析生涯,但却也给我带来很多痛苦: 一旦超过10万的数据量、或者函数、逻辑复杂一些 ,Excel就会事倍功半 其实对于数据分析来说,从来都没有最好用和最难用的工具,只有最适合自己和最适合业务场景的软件 Excel的五宗罪 1、数据效率差 其实Excel本身并不适合作为数据分析工具,但是很多人都会利用 ,转而投向了专业的BI软件 当我前前后后解除了十几种数据分析工具后,不得不说术业有专攻,数据分析这种活真不适合Excel来做,根本没有那个金刚钻,再高超的Excel技巧也比不过一个好的专业工具! 对商业智能BI有过耳闻的同学估计都听过FineBI的名字,与Tableau、PowerBI一样都是国内目前最为流行和应用广泛的自助式BI工具数据分析软件和可视化神器。 首先FineBI不光是作为个人数据分析工具,它真正的角色是企业级的BI应用平台,不仅可以连接各种主流数据库,还可以统一不同业务部门的数据口径,实现数据的标准化。

    52630发布于 2020-12-16
  • 来自专栏网罗开发

    数据分析工具篇——数据读写

    数据分析的本质是为了解决问题,以逻辑梳理为主,分析人员会将大部分精力集中在问题拆解、思路透视上面,技术上的消耗总希望越少越好,而且分析的过程往往存在比较频繁的沟通交互,几乎没有时间百度技术细节。 因此,熟练常用技术是良好分析的保障和基础。 笔者认为熟练记忆数据分析各个环节的一到两个技术点,不仅能提高分析效率,而且将精力从技术中释放出来,更快捷高效的完成逻辑与沟通部分。 本文基于数据分析的基本流程,整理了SQL、pandas、pyspark、EXCEL(本文暂不涉及数据建模、分类模拟等算法思路)在分析流程中的组合应用,希望对大家有所助益。 , chunk_size=10*10): file_object = open(filePath) time.sleep(2) while True: chunk_data 如上即为数据的导入导出方法,笔者在分析过程中,将常用的一些方法整理出来,可能不是最全的,但却是高频使用的,如果有新的方法思路,欢迎大家沟通。

    4K30发布于 2021-04-07
  • 来自专栏ShowMeAI研究中心

    图解数据分析 | 数据分析工具地图

    ,各界也出现了许多好用的功能种类丰富的数据分析工具。 下方是数据分析常用R库: 方向 R库 数据处理 lubridata,dplyr,ply,reshape2,string,formatR,mcmc 统计 方差分析 aov anova 密度分析 density www.bilibili.com/video/BV1uL411s7bt B站视频教程:https://www.bilibili.com/video/BV1Jg411F7cS Microsoft Excel是数据分析中使用最广泛的工具之一 六、Apache Spark 官网:https://spark.apache.org/ 最大的大型数据处理引擎之一,该工具在Hadoop集群中执行应用程序的内存速度快100倍,磁盘速度快10倍,该工具数据管道和机器学习模型开发中也很流行 七、SAS 官网:https://www.sas.com/zh_cn/home.html SAS是用于数据处理和分析的编程语言和环境,该工具易于访问,并且可以分析来自不同来源的数据

    1.4K51编辑于 2022-02-25
  • 2025 年盘点 10数据分析工具,总有一款适合你

    说白了,就是数据有一大堆,但不知道怎么用,无法高效从海量数据中提取有价值的信息来指导决策。 当前数据分析工具市场也是一片繁荣景象,各类工具层出不穷,让人眼花缭乱。有国外的老牌工具,也有国内崛起的新秀。 不同的工具各有特点和优势,但也让企业在选择时犯了难。 那么到底该选哪一款才能满足自己的需求呢?接下来,我就为大家盘点 10 款热门的数据分析工具,希望能给大家一些参考。 一、FineBI 1. 2.功能特点 生态无缝协同:Excel公式一键转DAX模型,Teams频道实时推送预警 低代码开发:NLQ自然语言查询,业务人员独立完成80%分析任务 个人版免费:企业版订阅价10-40美元/月/用户 这几款工具都能让业务人员在无需专业技术知识的情况下,实现对数据的有效分析和利用。 Q:市面上有这么多数据分析工具,该如何选择适合自己企业的工具呢? 看预算:不同的数据分析工具价格差异较大,企业需要根据自身的预算来选择合适的工具。一些开源工具是免费的,而一些商业工具则需要支付较高的费用。 Q:在 2025 年,企业进行数据分析为什么如此重要?

    6.8K10编辑于 2025-07-01
  • 来自专栏WhITECat安全团队

    推荐 | 10个好用的Web日志安全分析工具

    一款简单好用的Web日志分析工具,可以大大提升效率,目前业内日志分析工具比较多,今天推荐十个比较好用的Web日志安全分析工具。 5、Logstalgia 一款非常炫酷且可视化日志分析工具,可以直观的展示CC攻击和网站的日志分析,并以可视化的3D效果展示出来。 7、web-log-parser 一款开源的分析web日志工具,采用python语言开发,具有灵活的日志格式配置。 10、IBM QRadar Qradar有一个免费的社区版本,功能上和商用版本差别不大,适合小规模日志和流量分析使用。 团队成员目前由起源实验室核心成员、一线安全厂商攻防实验室、某研究院、漏洞盒子TOP10白帽子等人员组成。团队内有不定期的技术交流,(不可描述)工具分享等活动,致力于实现“开放分享”的hack精神。

    2.3K10发布于 2020-09-17
  • 来自专栏Bypass

    推荐 | 10个好用的Web日志安全分析工具

    一款简单好用的Web日志分析工具,可以大大提升效率,目前业内日志分析工具比较多,今天推荐十个比较好用的Web日志安全分析工具。 ---- 1、360星图 一款非常好用的网站访问日志分析工具,可以有效识别Web漏洞攻击、CC攻击、恶意爬虫扫描、异常访问等行为。 5、Logstalgia 一款非常炫酷且可视化日志分析工具,可以直观的展示CC攻击和网站的日志分析,并以可视化的3D效果展示出来。 7、web-log-parser 一款开源的分析web日志工具,采用python语言开发,具有灵活的日志格式配置。 10、IBM QRadar Qradar有一个免费的社区版本,功能上和商用版本差别不大,适合小规模日志和流量分析使用。

    3.5K12发布于 2020-07-02
  • 来自专栏ShowMeAI研究中心

    Python数据分析 | 数据分析工具库Pandas介绍

    Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。 Pandas是Python中最常用到的数据操作和分析工具包,它构建在Numpy之上,具备简洁的使用接口和高效的处理效率。 数据科学、机器学习AI应用过程,涉及数据清洗和分析的操作也频繁使用到Pandas。 当我们提到python数据分析的时候,大部分情况下都会使用Pandas进行操作。 成熟的 IO 工具:读取文本文件(CSV 等支持分隔符的文件)、Excel 文件、数据库等来源的数据,利用超快的 HDF5 格式保存 / 加载数据; 时间序列:支持日期范围生成、频率转换、移动窗口统计

    2.2K51编辑于 2022-02-25
  • 来自专栏叕鰦座

    SAP 数据分析工具-1

    数据收集(目前只支持json格式) ? ? 2种方式: API方式:GET/POST获取基础数据 url为服务地址,在服务地址下依次从PLATFORM(平台)/PLATTYPE(分类)/DO_TYPE(活动数据)获取所需的基础数据 RFC方式: 根据约定的sessionid 对应 PLATFORM(平台)/PLATTYPE(分类)/DO_TYPE(活动数据)获取所需的基础数据 ? 存储方式:由一张表实现所有数据类型的加密存储(任意JSON转为内表后存储) ? 程序架构: SAP部分: ? 展示结果: ?

    80330发布于 2021-03-11
  • 来自专栏BI工具

    如何选择数据分析工具

    一个得心应手的数据分析工具,是每一位从业人员做数据分析的利器。 面对浩如烟海的数据,如何选择合适的数据分析工具,成为运营、产品、市场等职能部门人员的一个难题,运用用数据分析工具,企业可以整合多种渠道的数据,快速完成和完善数据分析。那么如何选择数据分析工具呢? 所以,在选择数据分析工具时,最好选择一种详尽、全面的工具分析指标,使结果更具深度,这样才能满足用户的要求,才能借助数据分析工具挖掘出所有数据背后的真正意义。 (4)跨部门合作 对大型企业来说,数据分析工具必须支持跨部门合作才行。数据分析工具在不同的部门有不同的需求和用途。 (5)性价比和维护成本 大多数工具(特别是企业级数据分析工具)在使用之前都需要花费一些费用。所以在选择数据分析工具时,我们需要考虑购买初期的费用和后期的维护费用。

    1.4K1614发布于 2020-10-12
  • 来自专栏数据科学与人工智能

    【大数据分析】大数据分析方法 及 相关工具

    数据分析的五个基本方面 PredictiveAnalyticCapabilities (预测性分析能力) 数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析数据挖掘的结果做出一些预测性的判断 通过标准化的流程和工具数据进行处理可以保证一个预先定义好的高质量的分析结果。 AnalyticVisualizations ( 可视化 分析) 不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。 SemanticEngines (语义引擎) 我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,提取,分析数据。 比较典型算法有用于聚类的 K-Means 、用于统计学习的 SVM和用于分类的 Naive Bayes ,主要使用的工具有 Hadoop 的 Mahout 等。

    4.8K80发布于 2018-02-27
  • 来自专栏R语言___生物信息

    rSeq工具:RNA-Seq数据分析工具

    rSeq: RNA-Seq Analyzer rSeq是一组RNA-Seq数据分析工具。它可以处理RNA-Seq数据分析的许多方面,如参考序列生成序列映射,基因和同种型表达式(RPKMs)计算等。

    1.1K40发布于 2018-06-19
  • 来自专栏数据挖掘与AI算法

    数据可视化分析工具:Matplotlib

    绘图是数据分析工作中的重要一环,是进行探索过程的一部分。 Matplotlib是当前用于数据可视化的最流行的Python工具包之一,它是一个跨平台库,用于根据数组中的数据制作2D图,主要用于绘制一些统计图形,例如散点图、条形图、折线图、饼图、直方图、箱型图等。 1.散点图 散点图通常用在回归分析中,描述数据点在直角坐标系平面上的分布图。散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。下面是绘制散点图的例子。 例如下面一个例子,假设现在我们拿到了2017年内地电影票房前10的电影和电影票房数据,现在我们想直观比较各电影票房数据大小,那么条形图显然是最合适的呈现方式,代码如下。 ---- 以上内容来自《Python广告数据挖掘与分析实战》

    2.5K10发布于 2021-06-24
领券