首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >香农熵中的"S“代表什么?

香农熵中的"S“代表什么?
EN

Data Science用户
提问于 2021-10-18 23:52:59
回答 1查看 49关注 0票数 0

在分类/监督学习上下文中,我看到许多机器学习文本使用以下表示法来表示Shannon熵:

H(S) = \sum_{i \in Y}p_i \log(p_i)

其中,p_i是给定点属于i类的概率。我只是不明白什么是S,因为没有提供关于它的进一步解释。它与数据集中的特性S有关吗?

S似乎再次出现在信息增益公式中:

\operatorname{IG}(S,A) = H(S) - \sum_{a \in A} \frac{S_a}{S}H(S_a)

我知道信息增益和熵的概念,我只是想了解数学形式主义。

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-10-19 06:48:21

为了回答你的问题,

  • shannon熵中的S表示具有s_{1},s_{2},..s_{n}值的离散随机变量
  • 信息增益中的S{\displaystyle ({\textbf {s}},t)=(s_{1},s_{2},s_{3},...,s_{k},t)}形式表示一组培训示例,其中{\displaystyle s_{a}\in vals(a)}{\displaystyle a^{\text{th}}}属性的值或示例{\displaystyle {\textbf {s}}}的特性,t是类标签。

下面是维基百科的信息

Shannon熵:wiki链接

给出一个离散随机变量X,具有可能的结果x_{1} ,x_{2} ,....x_{n}

,它发生在概率{\displaystyle \mathrm {P} (x_{1}),...,\mathrm {P} (x_{n}),}{\displaystyle \mathrm {P} (x_{1}),...,\mathrm {P} (x_{n}),}中,X的熵正式定义为:

{\displaystyle \mathrm {H} (X)=-\sum _{i=1}^{n}{\mathrm {P} (x_{i})\log \mathrm {P} (x_{i})}}

信息增益:wiki链接

{\displaystyle T}表示一组训练示例,每个表单{\displaystyle ({\textbf {x}},y)=(x_{1},x_{2},x_{3},...,x_{k},y)},其中{\displaystyle x_{a}\in vals(a)}是示例{\displaystyle {\textbf {x}}}{\displaystyle a^{\text{th}}}属性或特性的值,y是相应的类标签。属性{\displaystyle a}的信息增益用Shannon熵{\displaystyle \mathrm {H} (-)}定义如下。对于属性{\displaystyle v}获取的值{\displaystyle a},让

{\displaystyle S_{a}{(v)}=\{{\textbf {x}}\in T|x_{a}=v\}}被定义为属性{\displaystyle a}等于{\displaystyle v}{\displaystyle T}的训练输入集。然后,{\displaystyle T}对于属性{\displaystyle a}的信息增益是训练集的先验Shannon熵{\displaystyle \mathrm {H} (T)}与条件熵{\displaystyle \mathrm {H} (T|a)}之间的区别。

{\displaystyle \mathrm {H} (T|a)=\sum _{v\in vals(a)}{{\frac {|S_{a}{(v)}|}{|T|}}\cdot \mathrm {H} \left(S_{a}{\left(v\right)}\right)}.}
{\displaystyle IG(T,a)=\mathrm {H} (T)-\mathrm {H} (T|a)}
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/103261

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档