搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

大数据挖掘企业服务平台典型合作案例都有哪些
大数据挖掘企业服务平台典型合作案例1. 中国电科院：电力大数据分析平台电力大数据平台拥有数据采集、数据存储、数据加工处理、数据分析挖掘、数据管控、平台管控、安装部署等功能，但是平台在组件融合、权限控制、对外接口封装等方面还存在不足，不能够满足企业未来不同类型的大数据应用运用大数据挖掘算法完善数据分析挖掘模块，实现对 Mahout、Rhadoop 等分析挖掘工具中的算法封装，通过企业数据挖掘应用流程化的模式，使得数据应用开发速度更快，成本更低，让企业大数据挖掘应用更简单公路院：道路运输安全大数据分析平台面向道路运输行业和运输企业多层面应用的道路运输安全管理大数据平台，汇聚车辆运行动态监控数据、新车技术参数、运输企业安全生产管理信息、运政管理信息、气象信息等多源数据泰迪大数据挖掘企业服务平台是一款通用的、企业级、智能化的数据分析模型构建与数据应用场景设计工具，能够一体化地完成数据集成、模型构建、模型发布，为数据分析、探索、服务流程提供支撑，提供完整的数据探索、多数据源接入
71010编辑于 2024-06-26
企业为什么需要数据挖掘平台？哪个比较好用呢？
数据挖掘平台功能：助力企业数据挖掘 1、数据抓取挖掘平台是企业挖掘数据的重要工具。 4、机器学习数据挖掘平台还具备机器学习，可以自动识别和分析数据，发现其中的规律和模式，提供预测模型，帮助企业做出更准确的商业决策。 5、数据挖掘平台可以应用于多个应用场景数据挖掘平台广泛应用于企业的各个领域，如市场营销、风险管理、人力资源管理、医疗健康等，可实现精准营销、风险分析、员工管理、疾病诊断等。数据挖掘平台不仅适用于大企业也适用于普通人企业：分布式云计算，线性扩展，保证性能，与BI平台无缝整合，一键发布挖掘模型，模型库提高知识复用，减少重复投入，支持跨库查询，统一控制数据访问权限，训练自动化泰迪智能科技企业数据挖掘平台由泰迪智能科技自主研发，面向企业级用户的大数据挖掘建模平台。
94310编辑于 2024-06-20
来自专栏数据科学与人工智能
【数据挖掘】详细解释数据挖掘中的 10 大算法（下）
举个 AdaBoost 算法的例子：我们开始有3个弱学习器，我们将在一个包含病人数据的数据训练集上对他们做10轮训练。数据集里包含了病人的医疗记录各个细节。在10轮结束的时候，我们剩下了一个带着不同权重的已经训练过的联合学习分类器，之后重复训练之前回合中被误分类的数据。这是个监督还是非监督算法？对于离散数据，解决方法是可以把离散数据转化为连续数据。给出两个例子： 1 使用汉明距离（Hamming distance ）作为两个字符串紧密程度的测度。 10.CART 分类算法算法是做什么的？ CART 代表分类和回归树(classification and regression trees)。它是个决策树学习方法，同时输出分类和回归树。原文来源：http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english/
1.6K60发布于 2018-02-27
来自专栏数据科学与人工智能
【数据挖掘】详细解释数据挖掘中的 10 大算法（上）
在一份调查问卷中，三个独立专家小组投票选出的十大最有影响力的数据挖掘算法，今天我打算用简单的语言来解释一下。为了做到这一点，需要给定 C4.5 表达内容已分类的数据集合。等下，什么是分类器呢？分类器是进行数据挖掘的一个工具，它处理大量需要进行分类的数据，并尝试预测新数据所属的类别。关联规则学习是学习数据库中不同变量中的相互关系的一种数据挖掘技术。在数据挖掘领域，最大期望算法（Expectation-Maximization,EM）一般作为聚类算法（类似 kmeans 算法）用来知识挖掘。算法的优势是：对于数据挖掘和聚类，观察到遗失的数据的这类数据点对我们来说很重要。我们不知道具体的类，因此这样处理丢失数据对使用 EM 算法做聚类的任务来说是很关键的。
1.6K51发布于 2018-02-27
来自专栏数据STUDIO
一个企业级数据挖掘实战项目｜教育数据挖掘
自从分享了一篇能够写在简历里的企业级数据挖掘实战项目，深受读者朋友们青睐，许多读者私信云朵君，希望多一些类似的数据挖掘实际案例。这就来了。本项目旨在探讨影响学生学业表现的人口统计学和家庭特征。数据重采样这里主要介绍下数据预处理层面的数据重采样方法。数据重采样主要分为上采样和下采样。 SMOTETomek() # 以SMOTEENN采样方法为例 sm_en = SMOTEENN() X_resampled, Y_resampled = sm_en.fit_resample(X, Y) # 分别使用10 折交叉验证的方法得到平均得分 scores_dTree = cross_val_score(dTree, X_resampled, Y_resampled, cv = 10, scoring='roc_auc 本文后续工作可以是通过正文中得到的结果，选择几个合适的模型，通过适当的模型调参方法选择恰当的参数，以确定本次数据挖掘的最终模型。
2.3K31发布于 2021-09-26
来自专栏个人分享
数据挖掘10大算法详细介绍
想初步了解下怎样数据挖掘，看到一篇不错的文章转载过来啦~ 转自:http://blog.jobbole.com/89037/ 在一份调查问卷中，三个独立专家小组投票选出的十大最有影响力的数据挖掘算法关联规则学习是学习数据库中不同变量中的相互关系的一种数据挖掘技术。在数据挖掘领域，最大期望算法（Expectation-Maximization,EM）一般作为聚类算法（类似 kmeans 算法）用来知识挖掘。举个 AdaBoost 算法的例子：我们开始有3个弱学习器，我们将在一个包含病人数据的数据训练集上对他们做10轮训练。数据集里包含了病人的医疗记录各个细节。在10轮结束的时候，我们剩下了一个带着不同权重的已经训练过的联合学习分类器，之后重复训练之前回合中被误分类的数据。这是个监督还是非监督算法？
2.3K40发布于 2018-09-06
来自专栏大数据
10大数据挖掘算法及其简介
AiTechYun 编辑：xiangxiaoshan 我希望你能把这篇文章作为一个跳板，学习更多关于数据挖掘的知识。算法如下: 1. C4.5 2. k-means 3. 支持向量机 4. Naive Bayes 10. CART 1.C4.5 C4.5以决策树的形式构造了一个分类器。为了做到这一点，C4.5给出了一组已经分类的数据。分类器是数据挖掘中的一个工具，它取一堆数据来表示我们想要分类的东西，并试图预测新数据属于哪个类。例如，假设在患者数据集中。 4.Apriori Apriori算法学习关联规则，并应用于包含大量事务的数据库。关联规则学习是一种数据挖掘技术，用于学习数据库中变量之间的相互关系和关系。例如，假设我们有一个超市交易数据库。你可以将数据库看作是一个巨大的电子表格，其中每一行代表一个客户交易，每一列都代表着一种不同的食品。 5.EM 在数据挖掘中，期望最大化(EM)通常被用作知识发掘的聚类算法(比如k – means)。
1.2K70发布于 2018-01-19
来自专栏CDA数据分析师
成为“大数据企业”，献给不懂数据挖掘的你！
在这种策略下，大规模多源异构数据的采集、清洗和整合方法，将成为大数据管理的核心支撑。如何挖掘企业大数据的价值企业大数据的价值开发高度依赖于深度数据分析能力。对于这一平台所积累的大量数据的价值开发，首先体现在对其信息内容的提炼上。通过对这些关系结构的深度分析和挖掘，G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。例如，在G公司的博客平台上，一种“代表性博文提取”技术能够在每天所出现的数以千计的博文中自动选择出10篇。这10篇博文在很大程度上全面代表了当天所出现的数千篇文章，既充分反映热点，也不能忽略冷门信号，从而使得管理者能够通过阅读这些文章来了解全局。
1.1K60发布于 2018-02-11
来自专栏PPV课数据科学社区
【观点】数据挖掘入门必看10个问题
数据分析趋势为从大型数据库抓取所需数据并使用专属计算机分析软件，Data Mining的工具更符合企业需求； 3. 从数据仓库挖掘出对决策有用的信息与知识，是建立数据仓库与使用Data Mining的最大目的，两者的本质与过程是两回事。找出假设并提出解释； 10. 持续应用于企业流程中。企业透过Data Mining可以分别针对策略、目标定位、操作效能与测量评估等四个切面之相关问题，有效率地从市场与顾客所搜集累积之大量数据中挖掘出对消费者而言最关键、最重要的答案，并赖以建立真正由客户需求点出发的客户关系管理 NO.10 目前业界有哪些常用的Data Mining分析工具？工具市场大致可分为三类： 1.
74170发布于 2018-04-19
来自专栏ATYUN订阅号
10大数据挖掘算法及其简介
我希望你能把这篇文章作为一个跳板，学习更多关于数据挖掘的知识。算法如下: 1. C4.5 2. k-means 3. 支持向量机 4. Apriori 5. EM 6. PageRank 7. Naive Bayes 10. CART 1.C4.5 C4.5以决策树的形式构造了一个分类器。为了做到这一点，C4.5给出了一组已经分类的数据。分类器是数据挖掘中的一个工具，它取一堆数据来表示我们想要分类的东西，并试图预测新数据属于哪个类。例如，假设在患者数据集中。 4.Apriori Apriori算法学习关联规则，并应用于包含大量事务的数据库。关联规则学习是一种数据挖掘技术，用于学习数据库中变量之间的相互关系和关系。例如，假设我们有一个超市交易数据库。你可以将数据库看作是一个巨大的电子表格，其中每一行代表一个客户交易，每一列都代表着一种不同的食品。 5.EM 在数据挖掘中，期望最大化(EM)通常被用作知识发掘的聚类算法(比如k – means)。
1.2K130发布于 2018-03-06
来自专栏灯塔大数据
干货 | 数据挖掘入门必看10个问题
，Data Mining的工具更符合企业需求； 3. 从数据仓库挖掘出对决策有用的信息与知识，是建立数据仓库与使用Data Mining的最大目的，两者的本质与过程是两回事。找出假设并提出解释； 10. 持续应用于企业流程中。企业透过Data Mining可以分别针对策略、目标定位、操作效能与测量评估等四个切面之相关问题，有效率地从市场与顾客所搜集累积之大量数据中挖掘出对消费者而言最关键、最重要的答案，并赖以建立真正由客户需求点出发的客户关系管理 NO.10 目前业界有哪些常用的Data Mining分析工具？工具市场大致可分为三类： 1.
95340发布于 2018-04-08
来自专栏灯塔大数据
成为“大数据企业”，献给不懂数据挖掘的你
在这种策略下，大规模多源异构数据的采集、清洗和整合方法，将成为大数据管理的核心支撑。如何挖掘企业大数据的价值企业大数据的价值开发高度依赖于深度数据分析能力。对于这一平台所积累的大量数据的价值开发，首先体现在对其信息内容的提炼上。通过对这些关系结构的深度分析和挖掘，G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。例如，在G公司的博客平台上，一种“代表性博文提取”技术能够在每天所出现的数以千计的博文中自动选择出10篇。这10篇博文在很大程度上全面代表了当天所出现的数千篇文章，既充分反映热点，也不能忽略冷门信号，从而使得管理者能够通过阅读这些文章来了解全局。
75170发布于 2018-04-04
来自专栏搜狗测试
软件品质评测系统- 数据挖掘处理平台
软件品质评测体系建立之后，在进行评测之前首先要确定评测使用的数据，这就需要数据挖掘平台发挥作用了，本文将以输入法评测语料制作为例介绍我们的评测数据挖掘处理平台。 1 数据挖掘处理原则全面性使用场景依照不同用户需要的打字环境的差别，结合当前使用频率较高的几种应用，尽可能全面地覆盖用户使用的打字场景，主要分为以下两个类别：聊天场景：用户聊天的打字内容，例如对于这些需求，我们将上述使用场景下获取的数据分为：汽车，运动，教育，游戏，影视等10余个类别，以覆盖特定用户的特定打字需求。因此我们在挖掘用户打字行为时，除了满足普通打字需求的同时也设计了多种用户可能的行为，包括联想、组词、纠错、退格等。 expect_cand": ""} //表示退格 {"pinyin": "#", "expect_cand": ""} //表示换行 ], "键盘类型":26 } 4结语评测数据挖掘不是一成不变的
93020发布于 2020-07-16
来自专栏韩曙亮的移动开发专栏
【数据挖掘】数据挖掘总结 ( 数据挖掘相关概念 ) ★★
用于挖掘的数数据源必须真实 : ① 存在的真实数据 : 数据挖掘处理的数据一般是存在的真实数据 , 不是专门收集的数据 ; ② 数据收集 : 该工作不属于数据挖掘范畴 , 属于统计任务 ; 2 . 数据必须海量 : ① 少量数据处理 : 少量数据使用统计方法分析 , 不必使用数据挖掘 ; ② 海量数据 : 处理海量数据时 , 才使用数据挖掘 , 涉及到有效存储 , 快速访问 , 合理表示等方面的问题未知结果 : ① 挖掘结果 : 数据挖掘挖掘出的知识是未知的 , 目的是为了发掘潜在的知识 , 模式 ; 这些知识只能在特定环境下可以接收 , 可以理解 , 可以运用 ; ② 知识使用 : 数据挖掘出的知识只能在特定领域使用 , 如金融领域数据挖掘结果 , 只能在金融领域及相关领域使用 ; 参考博客 : 【数据挖掘】数据挖掘简介 ( 数据挖掘引入 | KDD 流程 | 数据源要求 | 技术特点 ) 二、数据挖掘组件化思想数据挖掘任务分类 : 根据数据挖掘的目标 , 可以将数据挖掘任务分为以下几类 : ① 模式挖掘 , ② 描述建模 , ③ 预测建模 ; 描述建模和预测建模又称为模型挖掘 ; ① 模式挖掘 : 如
5.3K00编辑于 2023-03-28
来自专栏CDA数据分析师
测试：你是否具备企业的数据挖掘能力？
1.某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？ A. 关联规则发现 B. 聚类 C. 分类 D. 数据挖掘与知识发现 B. 领域知识发现 C. 文档知识发现 D. 动态知识发现 6.使用交互式的和可视化的技术，对数据进行探索属于数据挖掘的哪一类任务？ A. 探索性数据分析 B. 建模描述 C. 寻找模式和规则 7.为数据的总体分布建模；把多维空间划分成组等问题属于数据挖掘的哪一类任务？ A. 探索性数据分析 B. 建模描述 C. 预测建模 D. 寻找模式和规则 10.下面哪种不属于数据预处理的方法？关于基本数据的元数据是指: A.基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息; B.基本元数据包括与企业相关的管理方面的数据和信息; C.基本元数据包括日志文件和简历执行处理的时序调度信息
1.2K60发布于 2018-02-11
来自专栏数据科学与人工智能
【数据挖掘】图数据挖掘
那么图数据挖掘是干什么的呢？难道是开着挖掘机来进行挖掘？还是扛着锄头？下面讲讲什么是图数据挖掘。一、什么是图数据挖掘这个话题感觉比较沉重，以至于我敲打每个字都要犹豫半天，这里我说说我对图数据挖掘的理解。数据是一个不可数名字，那么说明数据是一个没有边界的东西。那么不难理解，数据挖掘就是挖掘数据里面的“宝贝”，图数据挖掘，就是以图的结构来存储、展示、思考数据，以达到挖掘出其中的“宝贝”。那这个“宝贝”是什么？那么对这个图进行关系挖掘，那么会产生很多有用的数据，比如可以推荐你可能认识的人，那就是朋友的朋友，甚至更深，这就形成了某空间好友推荐的功能。比如某宝的你可能喜欢的宝贝，可以通过图数据挖掘来实现。这就是我认为的图数据挖掘。从学术上讲，图数据挖掘分为数据图，模式图两种。至于这两个类型的区别，由于很久没有关注这块，所以只能给出一个字面意义上的区别。
3.3K81发布于 2018-02-27
来自专栏PPV课数据科学社区
☞【观点】成为“大数据企业”，献给不懂数据挖掘的你
在这种策略下，大规模多源异构数据的采集、清洗和整合方法，将成为大数据管理的核心支撑。如何挖掘企业大数据的价值企业大数据的价值开发高度依赖于深度数据分析能力。对于这一平台所积累的大量数据的价值开发，首先体现在对其信息内容的提炼上。例如，在G公司的博客平台上，一种“代表性博文提取”技术能够在每天所出现的数以千计的博文中自动选择出10篇。这10篇博文在很大程度上全面代表了当天所出现的数千篇文章，既充分反映热点，也不能忽略冷门信号，从而使得管理者能够通过阅读这些文章来了解全局。知识无极限 6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布 7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载 8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募 9、
73970发布于 2018-04-20
来自专栏华章科技
如何成为大数据企业?献给不懂数据挖掘的你
在这种策略下，大规模多源异构数据的采集、清洗和整合方法，将成为大数据管理的核心支撑。如何挖掘企业大数据的价值企业大数据的价值开发高度依赖于深度数据分析能力。对于这一平台所积累的大量数据的价值开发，首先体现在对其信息内容的提炼上。通过对这些关系结构的深度分析和挖掘，G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。例如，在G公司的博客平台上，一种“代表性博文提取”技术能够在每天所出现的数以千计的博文中自动选择出10篇。这10篇博文在很大程度上全面代表了当天所出现的数千篇文章，既充分反映热点，也不能忽略冷门信号，从而使得管理者能够通过阅读这些文章来了解全局。
38820发布于 2018-08-14
来自专栏CDA数据分析师
【干货】数据挖掘的10大分析方法
其缺点是：在构造树的过程中，需要对数据集进行多次的顺序扫描和排序，因而导致算法的低效。 4.TheApriorialgorithm Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。将修改过权值的新数据集送给下层分类器进行训练，最后将每次训练得到的分类器最后融合起来，作为最后的决策分类器。 10.CART:分类与回归树 CART,ClassificationandRegressionTrees。在分类树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法；第二个想法是用验证数据进行剪枝。
2K80发布于 2018-02-11
来自专栏测试开发干货
数据工厂平台10：首页底部
不过这里我们要思考一个设计上的问题：很多第一次做平台的同学，会盲目崇拜首页的各种统计图，觉得这样很高大上。但是实际上，你去访问公司很多内部平台时候，首页的统计图你根本不会去看，也不会在意。尤其是统计数据是全局的整体的时候，作为单个用户更加不会关心了。当然大部分如此的设计，主要是为了美感，再就是给领导一目了然的掌控心里设计，然后就是秀肌肉，给同事看看自己的平台流量很大。最后就是为了开发者自己的后面晋升答辩、简历美化提供数据量化支持。鉴于我捅破了这层窗户纸，所以我们的设计是，同样是统计数据，但是底部留白我们要统计的一定得是登陆者的个人信息，而非全平台的总体数据。我们为了能更好的融入进我们的平台首页，所以还要继续给它扒皮。
66040编辑于 2022-05-19

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大数据挖掘企业服务平台典型合作案例都有哪些

企业为什么需要数据挖掘平台？哪个比较好用呢？

【数据挖掘】详细解释数据挖掘中的 10 大算法（下）

【数据挖掘】详细解释数据挖掘中的 10 大算法（上）

一个企业级数据挖掘实战项目｜教育数据挖掘

数据挖掘10大算法详细介绍

10大数据挖掘算法及其简介

成为“大数据企业”，献给不懂数据挖掘的你！

【观点】数据挖掘入门必看10个问题

10大数据挖掘算法及其简介

干货 | 数据挖掘入门必看10个问题

成为“大数据企业”，献给不懂数据挖掘的你

软件品质评测系统- 数据挖掘处理平台

【数据挖掘】数据挖掘总结 ( 数据挖掘相关概念 ) ★★

测试：你是否具备企业的数据挖掘能力？

【数据挖掘】图数据挖掘

☞【观点】成为“大数据企业”，献给不懂数据挖掘的你

如何成为大数据企业?献给不懂数据挖掘的你

【干货】数据挖掘的10大分析方法

数据工厂平台10：首页底部

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

大数据挖掘企业服务平台典型合作案例都有哪些

企业为什么需要数据挖掘平台？哪个比较好用呢？

【数据挖掘】详细解释数据挖掘中的 10 大算法（下）

【数据挖掘】详细解释数据挖掘中的 10 大算法（上）

一个企业级数据挖掘实战项目｜教育数据挖掘

数据挖掘10大算法详细介绍

10大数据挖掘算法及其简介

成为“大数据企业”，献给不懂数据挖掘的你！

【观点】数据挖掘入门必看10个问题

10大数据挖掘算法及其简介

干货 | 数据挖掘入门必看10个问题

成为“大数据企业”，献给不懂数据挖掘的你

软件品质评测系统- 数据挖掘处理平台

【数据挖掘】数据挖掘总结 ( 数据挖掘相关概念 ) ★★

测试：你是否具备企业的数据挖掘能力？

【数据挖掘】图数据挖掘

☞【观点】成为“大数据企业”，献给不懂数据挖掘的你

如何成为大数据企业?献给不懂数据挖掘的你

【干货】数据挖掘的10大分析方法

数据工厂平台10： 首页底部

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

数据工厂平台10：首页底部