首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据科学与人工智能

    【数据挖掘】数据挖掘#商业智能(BI)数据分析挖掘概念

    数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。 商业智能(Business Intelligence): 分析数据、展示信息以帮助企业的执行者、管理层、其他人员进行更有根据的商业决策的应用、设施、工具、过程。 与人工智能、数据挖掘、统计方法关系密切。 购物篮分析(Market Basket Analysis): 识别在交易中经常同时出现的商品组合或服务组合,例如经常被一起购买的产品。 文本挖掘(Text Mining): 对包含自然语言的数据的分析。对源数据中词语和短语进行统计计算,以便用数学术语表达文本结构,之后用传统数据挖掘技术分析文本结构。 网络挖掘/网络数据挖掘(Web Mining / Web Data Mining) : 使用数据挖掘技术从互联网站点、文档或服务中自动发现和提取信息。

    3.2K90发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    【数据挖掘】详细解释数据挖掘中的 10 大算法(下)

    举个 AdaBoost 算法的例子:我们开始有3个弱学习器,我们将在一个包含病人数据的数据训练集上对他们做10轮训练。数据集里包含了病人的医疗记录各个细节。 在10轮结束的时候,我们剩下了一个带着不同权重的已经训练过的联合学习分类器,之后重复训练之前回合中被误分类的数据。 这是个监督还是非监督算法? 10.CART 分类算法 算法是做什么的? CART 代表分类和回归树(classification and regression trees)。它是个决策树学习方法,同时输出分类和回归树。 和分类树预测分类不同,回归树预测一个数字或者连续数值,比如一个病人的住院时间或者一部智能手机的价格。 这么记比较简单: 分类树输出类、回归树输出数字。 原文来源:http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english/

    1.6K60发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    【数据挖掘】详细解释数据挖掘中的 10 大算法(上)

    在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。 一旦你知道了这些算法是什么、怎么工作、能做什么、在哪里能找到,我希望你能把这篇博文当做一个跳板,学习更多的数据挖掘知识。 还等什么?这就开始吧! ? 1.C4.5算法 C4.5是做什么的? 分类器是进行数据挖掘的一个工具,它处理大量需要进行分类的数据,并尝试预测新数据所属的类别。 举个例子吧,假定一个包含很多病人信息的数据集。 关联规则学习是学习数据库中不同变量中的相互关系的一种数据挖掘技术。 在数据挖掘领域,最大期望算法(Expectation-Maximization,EM) 一般作为聚类算法(类似 kmeans 算法)用来知识挖掘

    1.6K51发布于 2018-02-27
  • 来自专栏个人分享

    数据挖掘10大算法详细介绍

     想初步了解下怎样数据挖掘,看到一篇不错的文章转载过来啦~ 转自:http://blog.jobbole.com/89037/ 在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法 在数据挖掘领域,最大期望算法(Expectation-Maximization,EM) 一般作为聚类算法(类似 kmeans 算法)用来知识挖掘。 举个 AdaBoost 算法的例子:我们开始有3个弱学习器,我们将在一个包含病人数据的数据训练集上对他们做10轮训练。数据集里包含了病人的医疗记录各个细节。 在10轮结束的时候,我们剩下了一个带着不同权重的已经训练过的联合学习分类器,之后重复训练之前回合中被误分类的数据。 这是个监督还是非监督算法? 和分类树预测分类不同,回归树预测一个数字或者连续数值,比如一个病人的住院时间或者一部智能手机的价格。 这么记比较简单: 分类树输出类、回归树输出数字。

    2.3K40发布于 2018-09-06
  • 来自专栏原创

    智能数据架构,挖掘增长金矿

    对很多技术团队来说,在搭建智能数据架构的过程中,或多或少会遇到一些疑惑和挑战,经过多次实践后,有些团队已经破除疑惑,成功探索出一条搭建智能数据架构之路,那么他们是如何实现这一技术的呢? 个推通过机器学习,构建了独有的冷、热、温标签,用以分析不同群体的基础属性和行为特征,描绘用户的精准画像,最终运用于智能推送和精准营销。 聚美优品大数据高级工程师 贺鹏《大数据3.0流计算与智能决策》 大数据3.0时期,Hadoop第一代、Spark内存计算第二代,早期流计算以及人工智能流计算同时并存。 流计算发展至今,已经具备了CEP这一强大功能,这也是支撑流计算智能化的关键因素所在。

    66120发布于 2019-03-12
  • 来自专栏大数据

    10大数据挖掘算法及其简介

    Naive Bayes 10. CART 1.C4.5 C4.5以决策树的形式构造了一个分类器。为了做到这一点,C4.5给出了一组已经分类的数据。 分类器是数据挖掘中的一个工具,它取一堆数据来表示我们想要分类的东西,并试图预测新数据属于哪个类。 例如,假设在患者数据集中。 关联规则学习是一种数据挖掘技术,用于学习数据库中变量之间的相互关系和关系。 例如,假设我们有一个超市交易数据库。 10.CART CART代表分类和回归树。它是一种决策树学习技术,它输出分类或回归树。和C4.5一样,CART是一个分类器。 分类树是否像决策树?分类树是决策树的一种类型。分类树的输出是一个类。 与预测类的分类树不同,回归树预测一个数字或连续的值,例如病人的住院时间或智能手机的价格。

    1.2K70发布于 2018-01-19
  • 来自专栏智能大数据分析

    【机器学习 | 数据挖掘智能推荐算法

    智能大数据分析是指利用先进的技术和算法对大规模数据进行深入分析和挖掘,以提取有价值的信息和洞察。 它结合了大数据技术、人工智能(AI)、机器学习(ML)和数据挖掘等多种方法,旨在通过自动化的方式分析复杂数据集,发现潜在的价值和关联性,实现数据的自动化处理和分析,从而支持决策和优化业务流程。 与传统的人工分析相比,智能大数据分析具有自动化、深度挖掘、实时性和可视化等特点。智能大数据分析广泛应用于各个领域,包括金融服务、医疗健康、零售、市场营销等,帮助企业做出更为精准的决策,提升竞争力。 三、基于关联规则的智能推荐 关联规则可以挖掘出物品间的关联关系,物品间的关联性越强推荐给用户时越可能受用户喜欢,提取关联规则的最大困难在于当存在很多商品时,可能的商品的组合(规则的前项与后项)的数目会达到一种令人望而却步的程度 接着介绍了智能推荐几种常见的智能推荐算法,包括关联规则和协同过滤等,其中关联规则可以挖掘出物品间的关联关系,依据关联关系的强弱为用户推荐,常见的关联规则算法有Apriori和FP-Growth。

    1K10编辑于 2025-01-22
  • 黑马-人工智能与数据挖掘

    在高校毕业生就业形势复杂的今天,一个领域的相关人才却持续被企业高薪争抢,起薪远超许多传统行业,成为了名副其实的“职场黑马”——这就是人工智能与数据挖掘领域。 这就需要既懂数据挖掘技术,能“淘出真金”,又懂人工智能算法,能“点石成金”的复合型人才。市场上对这类人才的需求呈现爆炸式增长。 核心技术与工具:数据挖掘:精通数据清洗、预处理、特征工程,掌握聚类、分类、关联分析等经典算法。机器学习:深入理解监督学习、无监督学习、强化学习等模型原理与应用场景。 三、职业前景:一条广阔的上升通道选择AI与数据挖掘赛道,意味着选择了一条高成长性的职业路径。 结语:人工智能与数据挖掘作为一匹强劲的“黑马”,正奔驰在时代的最前沿。对于个人而言,它或许意味着一个充满挑战与机遇的职业新起点;对于社会而言,它则是推动产业升级、迈向智能未来的核心驱动力。

    37210编辑于 2025-09-12
  • 来自专栏全栈程序员必看

    人工智能万亿市场待挖掘

    在未来5-10年之内,专用领域的定向智能化将是AI主要的应用发展方向。在更远的将来,如果人脑芯片等硬件架构能有所突破,运算能力有极大提高,则专用智能将逐步进化成为跨场景跨下游应用的通用智能。 因此,通过数据挖掘和搜索算法对数据工厂中的知识库和信息库进行分类与关联的技术能力同样是人工智能企业的重要进入门槛。 舆情监测以中文信息处理技术和中文自然语言处理技术为基础,融合了信息检索、文本挖掘等研究技术,提供中文智能信息挖掘智能分析软件,具有对海量文本内容进行智能检索、智能分析及智能化自动处理的功能,可以解决海量信息的智能分析处理 未来语义识别将和文本挖掘、数据挖掘等技术结合,更多地应用在商业化的领域,发展空间巨大。 深度挖掘大数据形成对企业商业决策的有效支持是行业未来重要发展方向,拓尔思将以此形成自己独特的商业智能应用模式。

    2K20编辑于 2022-06-25
  • 来自专栏ATYUN订阅号

    10大数据挖掘算法及其简介

    Naive Bayes 10. CART 1.C4.5 C4.5以决策树的形式构造了一个分类器。为了做到这一点,C4.5给出了一组已经分类的数据。 分类器是数据挖掘中的一个工具,它取一堆数据来表示我们想要分类的东西,并试图预测新数据属于哪个类。 例如,假设在患者数据集中。 关联规则学习是一种数据挖掘技术,用于学习数据库中变量之间的相互关系和关系。 例如,假设我们有一个超市交易数据库。 10.CART CART代表分类和回归树。它是一种决策树学习技术,它输出分类或回归树。和C4.5一样,CART是一个分类器。 分类树是否像决策树?分类树是决策树的一种类型。分类树的输出是一个类。 与预测类的分类树不同,回归树预测一个数字或连续的值,例如病人的住院时间或智能手机的价格。

    1.2K130发布于 2018-03-06
  • 来自专栏PPV课数据科学社区

    【观点】数据挖掘入门必看10个问题

    从数据仓库挖掘出对决策有用的信息与知识,是建立数据仓库与使用Data Mining的最大目的,两者的本质与过程是两回事。 找出假设并提出解释; 10. 持续应用于企业流程中。 Data Mining在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。 利用Data Mining技术建立更深入的访客数据剖析,并赖以架构精准的预测模式,以期呈现真正智能型个人化的网络服务,是Web Mining努力的方向。 NO.10 目前业界有哪些常用的Data Mining分析工具? 工具市场大致可分为三类: 1.

    74170发布于 2018-04-19
  • 来自专栏萝卜大杂烩

    10 种最流行的 Web 挖掘工具

    下面就来介绍 10 种最流行的 Web 挖掘工具和软件。 SimilarWeb(Web 使用挖掘工具) ? SimilarWeb SimilarWeb是一款功能强大的商业智能工具。借助此工具,用户可以快速了解网站的研究,排名和用户参与度。 Tableau(Web 使用挖掘工具) Tableau是商业智能行业中使用最快,最快速增长的数据可视化工具之一。它可以使你将原始数据简化为可访问的格式。通过仪表板和工作表可以很方便地进行数据可视化。 特征 树/导航 分页 加载更多按钮 云刮板 一次运行多个刮刀 安排刮刀 下载 CSV 和 CouchDB 中的数据 数据导出到 DropBox 10. 特征 数据预处理 集群 分类 回归 可视化 功能选择 以上是 10 种 Web 挖掘工具和软件的简单介绍,详细内容可以参考下方原文链接: http://www.prowebscraper.com/blog

    3.3K20发布于 2019-07-17
  • 来自专栏灯塔大数据

    干货 | 数据挖掘入门必看10个问题

    从数据仓库挖掘出对决策有用的信息与知识,是建立数据仓库与使用Data Mining的最大目的,两者的本质与过程是两回事。 找出假设并提出解释; 10. 持续应用于企业流程中。 Data Mining在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。 利用Data Mining技术建立更深入的访客数据剖析,并赖以架构精准的预测模式,以期呈现真正智能型个人化的网络服务,是Web Mining努力的方向。 NO.10 目前业界有哪些常用的Data Mining分析工具? 工具市场大致可分为三类: 1.

    95240发布于 2018-04-08
  • 来自专栏科技记者

    10章 关联分析和序列挖掘 笔记

    频繁序列模式挖掘,可以预测购买行为,生物序列等等。 Apriori是最广为人知的关联规则挖掘算法,依靠逐层地广度优先策略来生成候选项集。还可以调用intersectMeasure函数来获得其他有趣的指标。 transactionInfo(trans)$SequenceID <- c(1,1,1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4) transactionInfo(trans)$eventID<- c(10,20,30,40,50,10,20,30,40,10,20,30,40,50 3 8 {D,G,H} 4 10 3 9 {B,F} 4 20 2 10 {A,G,H} 10.9 cSPADE挖掘频繁时序模式 等价类序列模式挖掘,是广为人知的一种频繁序列模式挖掘算法,利用垂直数据库的特性,通过ID表的交集及有效的搜索策略完成频繁序列模式的挖掘,支持对挖掘到的序列添加约束

    71640编辑于 2022-03-04
  • 来自专栏数据科学与人工智能

    【金融数据】挖掘数据价值,打造智能银行

    第三层,从信息上升至知识,即知识发现层,在此层面,数据挖掘技术和人工智能至关重要,对整合的信息进行分解、提炼,从中找出有价值的信息点,实现信息到知识的转变。 结合国内外先进企业的大数据经验,民生银行围绕充分挖掘大数据价值,以“智能化、云端化、标准化、移动化”(“四化”)建设为主线,努力打造和提升大数据能力,积极推进全行的大数据战略。 “四化”建设纵贯数据获取与存储、数据整合、数据挖掘、数据应用整个大数据价值链,是一个影响深远的系统性工程。 大数据智能化 为进一步提升客户关系管理与服务水平,营造可持续发展的金融生态环境,切实提高全行对公业务的规划能力、营销能力、产品支持能力、风险管理能力、考核评价能力,民生银行建成智能管家平台,借助互联网思维和大数据分析挖掘工具 ,运用复杂网络科学、文本挖掘、购物篮分析等数据挖掘技术和力导向布局图、蜗牛图等数据可视化手段,构建了上下游客户推荐模型、智能产品推荐模型、交易网络模型,设计开发了客户推荐、产品推荐等功能,为客户经理、管理人员提供针对性

    1.4K50发布于 2018-02-27
  • 来自专栏CDA数据分析师

    【干货】数据挖掘10大分析方法

    4.TheApriorialgorithm Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。 10.CART:分类与回归树 CART,ClassificationandRegressionTrees。在分类树下面有两个关键的思想。

    2K80发布于 2018-02-11
  • 来自专栏生信技能树

    2023-10(数据挖掘马拉松)答疑汇编

    10为什么我的图出现在了左侧的控制台上? rmd文件示例会在代码下发出现运行结果,设置只在网页输出即可。 11请问这个警告要去管他吗?

    33010编辑于 2024-01-11
  • 来自专栏云计算D1net

    在2016年挖掘云端能力的10种方式

    下面就是其中10种方法。 1、应用开发和测试 通过将应用开发和测试活动外包到云中,一些大公司已经可以推迟甚至取消他们自己数据中心内昂贵的硬件升级。 10、需求高峰期的扩展 零售商有他们自己的节日和促销季,但是他们不希望在数据中心上投资以覆盖使用高峰期,然后在需求减弱期间让这些资源闲置着。

    1.5K50发布于 2018-03-23
  • 来自专栏信数据得永生

    Python 智能项目:6~10

    在这里,S表示智能体可能会暴露的所有状态,而A则表示智能体可以参与的可能动作。 您现在可能想知道智能体如何采取行动。 应该是随机的还是基于启发式的? 好吧,这取决于智能体与相关环境的交互程度。 状态和奖励将由环境呈现给智能体,而智能体将通过采取适当的行动对智能体采取行动。 这些状态采用从汽车前面的摄像头拍摄的图像的形式。 设计智能体 该智能体将与环境交互,并在给定状态的情况下,尝试执行最佳操作。 智能体最初将执行随机动作,并且随着训练的进行,动作将更多地基于给定状态的 Q 值。 因此,每个字符可以是26字母和10数字中的任何一个。 这要求 CNN 的最终输出层预测与26字母和10数字有关的36类之一。

    90620编辑于 2023-04-23
  • 来自专栏数据的力量

    数据挖掘中易犯的10大错误

    编译:IDMer(数据挖掘者) http://www.salford-systems.com/doc/elder.pdf 按照Elder博士的总结,这10大易犯错误包括: 0. (每种工具或方法可能最多带来5%~10%的改进)。 3. 认真、仔细、有条理是数据挖掘人员的基本要求。 预报(Forecast)示例:预报芝加哥银行在某天的利率,使用神经网络建模,模型的准确率达到95%。但在模型中却使用了该天的利率作为输入变量。 于是建模人员做了如下抽样:把所有响应者放入样本集,然后在所有不响应者中进行系统抽样,即每隔10人抽一个放入样本集,直到样本集达到10万人。 来自:数据挖掘者 链接:http://idmer.blog.sohu.com/117134261.html

    68650发布于 2018-06-20
领券