0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

了解数据挖掘的概念和特点

如意 来源:百家号 作者:看数据说事儿 2020-06-29 17:31 次阅读

数据挖掘源自《从数据库中发现知识》(缩写为KDD)。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解,FayyadPiatetsky-Shapiro和Smyth在权威文章集《知识发现与数据进展》中给出了KDD和数据挖掘的最新定义。从中总结了1996年该领域的进展,并予以区分:

KDD的定义是:KDD是从数据中识别有效,新颖,潜在有用且最终可以理解的模式的过程。

数据挖掘的定义是:数据挖掘是KDD中的一步,它使用特定算法在可接受的计算效率限制内生成特定模式。

数据挖掘威廉希尔官方网站 的特点

1.基于大量数据:不是说无法挖掘小数据量。实际上,大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是,一方面,过小的数据量可以通过手动分析来总结,另一方面,小数据量通常不能反映现实世界的一般特征。

2.非平凡性:所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似:“经过我的计算,直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合!”这种知识。这似乎没有必要,但是许多不了解业务知识的数据挖掘新手经常会犯此错误。

3.隐含性:数据挖掘是发现数据深处的知识,而不是直接出现在数据表面的信息。常用的BI工具(例如亿信BI和豌豆BI)完全可以让用户找到此信息。

4.新奇性:挖掘的知识以前应该是未知的,否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。

5.价值性:挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙威廉希尔官方网站 ”。它看起来牛气哄哄,但没有用。这只是一个错误的想法。不可否认的是,在某些数据挖掘项目中,由于缺乏明确的业务目标,或者由于数据质量不足,或者由于人们抵制不断变化的业务流程,又或者由于挖掘人员缺乏经验,都会导致结果不佳甚至根本没有效果。但是,大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47239

    浏览量

    238353
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    24235
收藏 人收藏

    评论

    相关推荐

    什么是大屏数据可视化?特点有哪些?

    介绍: 特点 直观易懂:大屏数据可视化通过图表、图形和其他可视化元素,将复杂的数据转化为直观易懂的形式,使得用户无需深入挖掘数据细节即可快速
    的头像 发表于 12-16 16:59 157次阅读

    DAC81408的建立时间为12uS,如何理解数据手册中的12uS建立时间这个参数呢?

    中建立时间曲线,±20V输出,如果按照数据手册中4V/uS爬升速率计算,0到20V跳变时间为5uS,从以上两图页可以看出,信号在5uS内达到设定值20V,该时间也小于建立时间典型值12uS。 请问如何理解数据手册中的12uS建立时间这个参数呢
    发表于 12-09 08:33

    了解无功补偿的概念

    关注“acrelzx”微信号,了解更多产品资讯,可咨询相关案例 (具体咨询安科瑞187021张欣11310) 无功补偿,是一种在电力供电系统中起提高电网的功率因数的作用,降低供电变压器及输送线
    的头像 发表于 11-15 09:08 136次阅读
    <b class='flag-5'>了解</b>无功补偿的<b class='flag-5'>概念</b>

    如何进行有效的eda分析

    进行有效的EDA(Exploratory Data Analysis,探索性数据分析)分析,是数据科学中的关键步骤,它能够帮助分析人员深入了解数据、发现潜在的模式,并为进一步的分析和建模提供
    的头像 发表于 11-13 10:48 241次阅读

    如何利用traceroute命令发现网络中的负载均衡

    在网络管理和故障排除中,了解数据包的路径和识别负载均衡节点是非常重要的。traceroute 命令是一个用于跟踪数据包在网络中经过的路由路径的工具。本文将详细介绍如何利用 traceroute 命令发现网络中的负载均衡,并解释相关的概念
    的头像 发表于 08-07 15:13 425次阅读
    如何利用traceroute命令发现网络中的负载均衡

    中科曙光受邀参加第十届中国数据挖掘会议

    近日,国内数据挖掘领域最主要的学术活动之一—第十届中国数据挖掘会议(CCDM2024)于山东泰安举行,中科曙光参与并分享了曙光AI构建产学研用的生态实践。
    的头像 发表于 08-01 10:43 583次阅读

    数字电路的基础概念:MOS晶体管

    对于从事芯片行业的人员来说,还是有必要了解数字电路中的一些基本概念,例如用作逻辑开关的 MOS 晶体管。当然,我们的目的是了解现代芯片中的行为本质,而不需要陷入半导体物理方程。
    的头像 发表于 07-29 10:02 752次阅读
    数字电路的基础<b class='flag-5'>概念</b>:MOS晶体管

    BP网络的基本概念和训练原理

    )的多层前馈神经网络。BP网络自1985年提出以来,因其强大的学习和适应能力,在机器学习、数据挖掘、模式识别等领域得到了广泛应用。以下将对BP网络的基本概念、训练原理及其优缺点进行详细阐述。
    的头像 发表于 07-19 17:24 1597次阅读

    卷积神经网络的基本概念、原理及特点

    的基本概念、原理、特点以及在不同领域的应用情况。 一、卷积神经网络的基本概念 卷积神经网络是一种深度学习算法,它由多层卷积层和池化层堆叠而成。卷积层负责提取图像中的局部特征,而池化层则负责降低特征的空间维度,同时增加对图像位移的
    的头像 发表于 07-11 14:38 1039次阅读

    增材制造威廉希尔官方网站 的概念特点

    增材制造威廉希尔官方网站 ,又称为3D打印威廉希尔官方网站 ,是一种通过逐层叠加材料来制造三维实体的先进制造威廉希尔官方网站 。本文将详细介绍增材制造威廉希尔官方网站 的概念特点、应用领域以及发展趋势。 一、增材制造威廉希尔官方网站 的概念 增材制造威廉希尔官方网站
    的头像 发表于 06-07 14:37 3366次阅读

    耗尽型MOSFET的基本概念特点及工作原理

    型MOSFET作为MOSFET的一种重要类型,在电子设计和工程领域中有着其独特的地位。本文将对耗尽型MOSFET的基本概念特点以及工作原理进行详细的探讨。
    的头像 发表于 05-12 17:19 2166次阅读

    数据中台工具的选型要点

    数据中台工具扮演着举足轻重的角色。想要全面理解数据中台工具的意义、作用以及应用方式,就必须深入探讨这一概念以及相关实践。
    的头像 发表于 04-24 15:07 305次阅读

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别 在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。本文旨在阐明
    的头像 发表于 03-11 11:29 908次阅读
    深入理<b class='flag-5'>解数据</b>备份的关键原则:应用一致性与崩溃一致性的区别

    数据挖掘的应用领域,并举例说明

    数据挖掘(Data Mining)是一种从大量数据中提取出有意义的信息和模式的威廉希尔官方网站 。它结合了数据库、统计学、机器学习和人工智能等领域的理论和方法,通过高效的算法和工具,对大
    的头像 发表于 02-03 14:19 3085次阅读

    带您一起详细了解IEEE802.3bt(PoE++)的有关特点

    Hqst华强盛(盈盛电子)导读:带您一起详细了解IEEE802.3bt(PoE++)的有关特点,让我们对IEEE802.3bt(PoE++)协议有更具体的了解
    的头像 发表于 01-04 11:26 2169次阅读
    带您一起详细<b class='flag-5'>了解</b>IEEE802.3bt(PoE++)的有关<b class='flag-5'>特点</b>