首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 数据挖掘企业服务平台典型合作案例都有哪些

    数据挖掘企业服务平台典型合作案例1. 中国电科院:电力大数据分析平台电力大数据平台拥有数据采集、数据存储、数据加工处理、数据分析挖掘数据管控、平台管控、安装部署等功能,但是平台在组件融合、权限控制、对外接口封装等方面还存在不足, 不能够满足企业未来不同类型的大数据应用 运用大数据挖掘算法完善数据分析挖掘模块,实现对 Mahout、Rhadoop 等分析挖掘工具中的算法封装,通过企业数据挖掘应用流程化的模式,使得数据应用开发速度更快,成本更低, 让企业数据挖掘应用更简单 3. 珠江数码:大数据营销推荐应用平台构建有线电视用户标签库 3000 多个,对不同的有户实现多维度画像,通过分类、聚类挖掘等模型,从不同角度实现用户细分。 泰迪大数据挖掘企业服务平台是一款通用的、企业级、智能化的数据分析模型构建与数据应用场景设计工具,能够一体化地完成数据集成、模型构建、模型发布,为数据分析、探索、服务流程提供支撑,提供完整的数据探索、多数据源接入

    71010编辑于 2024-06-26
  • 来自专栏火星娃统计

    GEO数据挖掘3

    数据挖掘3 sunqi 2020/7/11 概述 对下载好的基因初步分析,进行PCA分析和热图绘制 PCA 绘制 rm(list = ls()) options(stringsAsFactors = F file = 'step1-output.Rdata') table(group_list) ## group_list ## Control Vemurafenib ## 3 3 # 查看数据 dat[1:4,1:4] ## GSM1052615 GSM1052616 GSM1052617 GSM1052618 ## ZZZ3 11.26970 11.12560 ) # install.packages(c("FactoMineR", "factoextra")) library("FactoMineR") library("factoextra") # 数据处理 # 对数据进行归一化 # 因为是按照基因归一化,所以先进行转置,然后再转置回去 n=t(scale(t(dat[cg,]))) # 对绝对值大于2的数取绝对值2 # 使得最后的数据范围控制在2以内 n[

    1.2K31发布于 2020-09-15
  • 来自专栏R语言 / Linux

    GEO数据挖掘3

    GEO数据挖掘3 富集分析 (一)GO富集分析(用差异基因做富集) 输入数据 #(1)输入数据 gene_up = deg$ENTREZID[deg$change == 'up'] gene_down save(ego,ego_BP,file = f) } #(3)可视化 #条带图 barplot(ego) barplot(ego, split = "ONTOLOGY", font.size = 10 , #layout = "star", color.params = list(foldChange = gl), showCategory = 3) organism = 'hsa') save(kk.diff,kk.down,kk.up,file = f2) } load(f2) #(3) 复杂数据及其分析 1.多分组数据:示例GSE474 2.多数据联系分析:例如GSE83521_ and_ GSE89143 批次效应

    53800编辑于 2023-03-20
  • 企业为什么需要数据挖掘平台?哪个比较好用呢?

    数据挖掘平台功能:助力企业数据挖掘 1、数据抓取 挖掘平台企业挖掘数据的重要工具。 3数据分析 数据挖掘平台提供多种数据分析工具,包括统计分析、文本挖掘、网络分析等,可以对数据进行多角度的分析,挖掘出其潜在的商业价值。 5、数据挖掘平台可以应用于多个应用场景 数据挖掘平台广泛应用于企业的各个领域,如市场营销、风险管理、人力资源管理、医疗健康等,可实现精准营销、风险分析、员工管理、疾病诊断等。 数据挖掘平台不仅适用于大企业也适用于普通人 企业:分布式云计算,线性扩展,保证性能,与BI平台无缝整合,一键发布挖掘模型,模型库提高知识复用,减少重复投入,支持跨库查询,统一控制数据访问权限,训练自动化 泰迪智能科技企业数据挖掘平台由泰迪智能科技自主研发,面向企业级用户的大数据挖掘建模平台

    94310编辑于 2024-06-20
  • 来自专栏数据STUDIO

    一个企业数据挖掘实战项目|教育数据挖掘

    自从分享了一篇能够写在简历里的企业数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了。 本项目旨在探讨影响学生学业表现的人口统计学和家庭特征。 其基本情况:一共13个字段,其中RESULT为结果标签; 语言字段是经过独热编码后的四个字段,分别为Lang1, Lang2, Lang3, Lang4; 另外性别、学校、是否残疾、宗教信仰四个字段为二分类离散字段 IntSchoolBrothers 在校兄弟数量 IntSchoolSisters 在校姐妹数量 ClassSchoolStatus 学校 Disability01 是否残疾 Lang1 语言1 Lang2 语言2 Lang3 语言3 Lang4 语言4 Religion 宗教信仰 RESULT 结果标签 数据样例 探索性数据分析 探索性数据分析有多种方法,这里直接通过绘制柱状图查看每个字段的分布状况。 本文后续工作可以是通过正文中得到的结果,选择几个合适的模型,通过适当的模型调参方法选择恰当的参数,以确定本次数据挖掘的最终模型。

    2.3K31发布于 2021-09-26
  • Python数据挖掘编程基础3

    <3>集合a.Python内置了集合这一数据结构,它的概念与数学上集合的概念基本一致。集合的元素是不重复的,而且是无序的。集合不支持索引。 代码清单2-7 创建集合k={1,1,2,3,3}//注意1和3会自动去重,得到{1,2,3}k=set([1,1,2,3,3])//同样地,将列表转换为集合,得到{1,2,3}b.由于集合的特殊性(特别是无序性 代码清单2-8 特别的集合运算f={1,2,3,4}g={1,2,3,5,6}a=f|g//f和g的并集b=f&g//f和g的交集c=f-g//求差集(项在f中,但不在g中)d=f^g//对称差集(项在

    17310编辑于 2025-05-09
  • 来自专栏CDA数据分析师

    成为“大数据企业”,献给不懂数据挖掘的你!

    企业外部大数据的基本特征,也正是在这两个维度的发展之中呈现出来的。如图3所示。 供应链信息集成与社会化商务信息的融合,构成企业外部大数据的核心特征。 在这种策略下,大规模多源异构数据的采集、清洗和整合方法,将成为大数据管理的核心支撑。 如何挖掘企业数据的价值 企业数据的价值开发高度依赖于深度数据分析能力。 对于这一平台所积累的大量数据的价值开发,首先体现在对其信息内容的提炼上。 平台上与工作相关的博文内容,如客服案例、经验分享等,经自动筛选分类、主题识别、关键词索引之后,被构建成企业知识库,为业务及管理工作提供快速有效的知识支撑,同时成为员工培训和自学的有力工具。 通过对这些关系结构的深度分析和挖掘,G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。

    1.1K60发布于 2018-02-11
  • 来自专栏灯塔大数据

    成为“大数据企业”,献给不懂数据挖掘的你

    在这种策略下,大规模多源异构数据的采集、清洗和整合方法,将成为大数据管理的核心支撑。 如何挖掘企业数据的价值 企业数据的价值开发高度依赖于深度数据分析能力。 对于这一平台所积累的大量数据的价值开发,首先体现在对其信息内容的提炼上。 平台上与工作相关的博文内容,如客服案例、经验分享等,经自动筛选分类、主题识别、关键词索引之后,被构建成企业知识库,为业务及管理工作提供快速有效的知识支撑,同时成为员工培训和自学的有力工具。 通过对这些关系结构的深度分析和挖掘,G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。 例如,当G公司试图整合博客平台、业务系统、人力资源系统中的数据以全方位分析员工、团队特质以及绩效信息时,大量的数据属性之间所构成的复杂潜在关联网络,就需要强有力的关联发现技术来加以处理。

    75170发布于 2018-04-04
  • 来自专栏搜狗测试

    软件品质评测系统- 数据挖掘处理平台

    软件品质评测体系建立之后,在进行评测之前首先要确定评测使用的数据,这就需要数据挖掘平台发挥作用了,本文将以输入法评测语料制作为例介绍我们的评测数据挖掘处理平台。 1 数据挖掘处理原则 全面性 使用场景 依照不同用户需要的打字环境的差别,结合当前使用频率较高的几种应用,尽可能全面地覆盖用户使用的打字场景,主要分为以下两个类别: 聊天场景:用户聊天的打字内容,例如 因此我们在挖掘用户打字行为时,除了满足普通打字需求的同时也设计了多种用户可能的行为,包括联想、组词、纠错、退格等。 以下是数据获取效果: 3评测数据的处理与语料制作 数据清洗 数据获取之后,通常将原始数据来自的文章或者评论以json格式保存下来,这些文章或者评论可能包含很多例如换行符等特殊符号或者输入法无法识别的特殊字符等内容 expect_cand": ""} //表示退格 {"pinyin": "#", "expect_cand": ""} //表示换行 ], "键盘类型":26 } 4结语 评测数据挖掘不是一成不变的

    93020发布于 2020-07-16
  • 来自专栏PPV课数据科学社区

    数据挖掘系列(3)--关联规则评价

    0.91 90557 9.26 0.91 0.91 0.91 0.91 D2 10000 1000 1000 100 12100 0.91 0.91 0 1.00 0.91 0.91 0.91 0.91 D3 D1-D4,从后面四列可以看出,D1,D2中milk与coffee是正相关的,而D3是负相关,D4中是不相关的,大家可能觉得,D2的lift约等于1应该是不相关的,事实上对比D1你会发现,lift受MC 卡方和lift还把D3判别为正相关,而实际上他们应该是负相关,M=100+1000=1100,如果这1100中有超过550的购买coffee那么就认为是正相关,而我们看到MC=100<550,可以认为是负相关的 总结   本文介绍了9个关联规则评价的准则,其中全自信度、最大自信度、Kulc、cosine,Leverage是不受空值影响的,这在处理大数据集是优势更加明显,因为大数据中想MC这样的空记录更多,根据分析我们推荐使用 待续…… 来源:www.cnblogs.com/fengfenggirl 关联文章 1.数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法 2.数据挖掘系列(2)--关联规则FpGrowth算法

    1.6K90发布于 2018-04-23
  • 来自专栏python3

    R语言数据挖掘实战系列(3

    R语言数据挖掘实战系列(3) 三、数据探索         通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。 缺失值的影响有(1)数据挖掘建模将丢失大量的有用信息;(2)数据挖掘模型所表现出的不确定性更加显著,模型中蕴含的规律更难把握;(3)包含空值的数据会使建模过程陷入混乱,导致不可靠的输出。 对变量做一个描述性统计,进而查看哪些数据是不合理的。最常用的统计量是最大值和最小值,用来判断这个变量的取值是否超出了合理的范围。         (2)3σ原则。 如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过三倍标准差的值。如果数据不服从正态分布,也可以用远离平均值的多少倍标准差来描述。         (3)箱型图分析。 在数据挖掘过程中,不一致数据的产生主要发生在数据集成的过程中,可能是由被挖掘数据来自于不同的数据源、对于重复存放的数据未能进行一致性更新造成的。

    1.5K30发布于 2020-01-08
  • 来自专栏韩曙亮的移动开发专栏

    数据挖掘数据挖掘总结 ( 数据挖掘相关概念 ) ★★

    用于挖掘的数数据源 必须 真实 : ① 存在的真实数据 : 数据挖掘处理的数据一般是存在的真实数据 , 不是专门收集的数据 ; ② 数据收集 : 该工作不属于数据挖掘范畴 , 属于统计任务 ; 2 . ; 3 . , 如金融领域数据挖掘结果 , 只能在金融领域及相关领域使用 ; 参考博客 : 【数据挖掘数据挖掘简介 ( 数据挖掘引入 | KDD 流程 | 数据源要求 | 技术特点 ) 二、 数据挖掘组件化思想 异常模式 , 频繁模式 ; ② 描述建模 : 如 聚类分析 ; ③ 预测建模 : 如 分类预测 , 趋势分析等 ; 3 . | 评分函数 | 搜索和优化算法 | 数据管理策略 ) 【数据挖掘数据挖掘算法 组件化思想 示例分析 ( 组件化思想 | Apriori 算法 | K-means 算法 | ID3 算法 ) 三、

    5.3K00编辑于 2023-03-28
  • 来自专栏CDA数据分析师

    测试:你是否具备企业数据挖掘能力?

    Recall, ROC 3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务? A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据挖掘与知识发现 B. 领域知识发现 C. 文档知识发现 D. 动态知识发现 6.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务? A. 探索性数据分析 B. 建模描述 C. 考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是 A 2 B 3 C 3.5 D 5 19.下面哪个属于映射数据到新的空间的方法? ,箱的深度为3。 关于基本数据的元数据是指: A.基本元数据数据源,数据仓库,数据集市和应用程序等结构相关的信息; B.基本元数据包括与企业相关的管理方面的数据和信息; C.基本元数据包括日志文件和简历执行处理的时序调度信息

    1.2K60发布于 2018-02-11
  • 来自专栏全栈数据化营销

    3个案例了解数据挖掘,学会数据挖掘方法和思路

    一、银行信用卡欺诈与拖欠行为分析: 1、客户信用等级影响因素      1.1客户信用卡申请数据预处理      1.2信用卡申请成功影响因素 2、信用卡客户信用等级影响因素 3、基于消费的信用等级影响因素      5.6根据消费历史分析客户特征     5.7基于聚类分析客户特征     5.8基于客户细分的聚类分析 二、商务宾馆竞争分析 1、目前经济型酒店行业的竞争态势 2、根据业务和分析目标准备寻找数据 3、通过python编程抓取数据 4、数据初步预处理 5、商务酒店客户数据分析     5.1酒店评分影响因素     5.2酒店评分与酒店业绩关系     5.3酒店评分分析     5.4客户情感分析     5.5商务酒店竞争分 6、根据分析给出相应的建议 三、海底捞火锅运营分析 1、火锅相关业务分析,建立分析指标 2、火锅相关数据抓取 3数据预处理 4、海底捞运营状态分析 5、店铺选址分析 6

    977130发布于 2018-05-07
  • 来自专栏数据科学与人工智能

    数据挖掘】图数据挖掘

    那么图数据挖掘是干什么的呢?难道是开着挖掘机来进行挖掘?还是扛着锄头?下面讲讲什么是图数据挖掘。 一、什么是图数据挖掘 这个话题感觉比较沉重,以至于我敲打每个字都要犹豫半天,这里我说说我对图数据挖掘的理解。数据是一个不可数名字,那么说明数据是一个没有边界的东西。 那么不难理解,数据挖掘就是挖掘数据里面的“宝贝”,图数据挖掘,就是以图的结构来存储、展示、思考数据,以达到挖掘出其中的“宝贝”。那这个“宝贝”是什么? 这就是我认为的图数据挖掘。 从学术上讲,图数据挖掘分为数据图,模式图两种。至于这两个类型的区别,由于很久没有关注这块,所以只能给出一个字面意义上的区别。 3、BLINK BLINKS Ranked keyword searches on graphs 这个实现是解决了大图问题,通过对图进行分割,形成超图的概念,加载内存只需要把超图进来,当需要遍历这个超图节点的时候

    3.3K81发布于 2018-02-27
  • 来自专栏PPV课数据科学社区

    ☞【观点】成为“大数据企业”,献给不懂数据挖掘的你

    企业外部大数据的基本特征,也正是在这两个维度的发展之中呈现出来的。如图3所示。 ? 供应链信息集成与社会化商务信息的融合,构成企业外部大数据的核心特征。 在这种策略下,大规模多源异构数据的采集、清洗和整合方法,将成为大数据管理的核心支撑。 如何挖掘企业数据的价值 企业数据的价值开发高度依赖于深度数据分析能力。 对于这一平台所积累的大量数据的价值开发,首先体现在对其信息内容的提炼上。 来源:软件定义世界 PPV课其他精彩文章: ---- 1、回复“干货”查看干货 数据分析师完整知识结构 2、回复“答案”查看大数据Hadoop面试笔试题及答案 3、回复“设计”查看这是我见过最逆天的设计 知识无极限 6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布 7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载 8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募 9、

    73970发布于 2018-04-20
  • 来自专栏华章科技

    如何成为大数据企业?献给不懂数据挖掘的你

    企业外部大数据的基本特征,也正是在这两个维度的发展之中呈现出来的。如图3所示。 ? 供应链信息集成与社会化商务信息的融合,构成企业外部大数据的核心特征。 在这种策略下,大规模多源异构数据的采集、清洗和整合方法,将成为大数据管理的核心支撑。 如何挖掘企业数据的价值 企业数据的价值开发高度依赖于深度数据分析能力。 对于这一平台所积累的大量数据的价值开发,首先体现在对其信息内容的提炼上。 平台上与工作相关的博文内容,如客服案例、经验分享等,经自动筛选分类、主题识别、关键词索引之后,被构建成企业知识库,为业务及管理工作提供快速有效的知识支撑,同时成为员工培训和自学的有力工具。 通过对这些关系结构的深度分析和挖掘,G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。

    38820发布于 2018-08-14
  • 来自专栏人生代码

    数据挖掘实践指南读书笔记3

    写在之前 本书涉及的源程序和数据都可以在以下网站中找到: http://guidetodatamining.com/ 这本书理论比较简单,书中错误较少,动手锻炼较多,如果每个代码都自己写出来,收获不少。 当所用数据挖掘方法基于特征的值来计算 两个对象的距离,且不同特征的尺度不同,就需要使用归一化。 (list3, m3) asd4 = classifier.getAbsoluteStandardDeviation(list4, m4) assert(round(m1, 3) == 65) assert(round(m2, 3) == 66) assert(round(m3, 3) == 69) assert(round(m4, 3) == 70.5) assert(round(asd1, 3) == 8) assert(round(asd2, 3) == 7.5) assert(round(asd3, 3) == 0) assert

    48110发布于 2019-10-30
  • 来自专栏我的AI专栏

    Orange3数据挖掘简单使用教程

    Orange3数据挖掘简单使用教程最新版 3.36.2,欢迎加入QQ群681586766交流学习。 1、 首先启动orange-canvas,界面如下:2、 点击左边数据栏,拖到“文件“组件到控制台,然后双击,弹出对话框,选择数据源文件,对话框会呈现文件的相关信息3、 如果我们想要以表格的方式预览数据 ,可以双击或者拖动“数据表”,然后鼠标左键点“文件”组件右边的弧线拖到“数据表”右边的弧线,并建立了数据连接4、 再双击“数据表”进行数据浏览5、 也可以点击可视化分类里的散点图进行数据可视化,使其连接到 “数据表”6、 通过面板参数控制和观察数据分布情况7、 点击报告,可以预览和保存数据8、 点击模型分类中的分类树可以得到分类报告9、 同时可以对这个学习器进行测试和评估

    1.7K20编辑于 2023-11-06
  • 来自专栏NLPIR

    NLPIR中文数据挖掘帮助企业执行最佳商业决策

    数据在生活中应用增加,数据仓库,数据安全,数据分析,数据挖掘这些技术的热度居高不下。其中,数据挖掘能够对企业的业务数据进行抽取,转换和分析,促成企业执行最佳商业决策。 同时,在企业进行营销方面,从海量数据挖掘信息,将复杂数据设置成量化数据进行分析,是企业实行数字化营销的重要方面,对数据的准确分析能够实现最佳商业决策。 灵玖软件NLPIR大数据语义智能分析平台针对中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,先后历时十八年,服务了全球四十万家机构用户,是大时代语义智能分析的一大利器 NLPIR-Parser大数据语义分析平台企业提供了一体式全链条服务,包括分词词性、情感分析、实体识别、关键词提取,实现对语法、词法和语义的综合应用。 NLPIR大数据语义智能分析平台是根据中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台

    99640发布于 2019-09-24
领券