搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏技术总结
iOS之DBL_EPSILON,FLT_EPSILON,FLT_MIN和FLT_MAX
了解这些C语言的基础，对我们理解iOS源代码有促进作用，并且在iOS开发中可以用到,下面我简单介绍下： float.h DBL_EPSILON和 FLT_EPSILON 主要用于单精度和双精度的比较当中，归在c语言标准函数库 FLT_EPSILON用于float类型。它是满足 x+1.0不等于1.0的最小的正数也就是说，所有比FLT_EPSILON小的正数x，x+1.0==1.0都是成立的。 FLT_EPSILON 1.192092896e-07F DBL_EPSILON 2.2204460492503131e-016 这个
2.2K60发布于 2018-05-22
来自专栏合集
支持向量机-epsilon-SVR
? ? ? ? ? ? ?
1.3K20发布于 2021-02-07
来自专栏程序员果果
第六篇 : Epsilon 垃圾收集器
一、简介 Epsilon（A No-Op Garbage Collector）垃圾回收器控制内存分配，但是不执行任何垃圾回收工作。一旦java的堆被耗尽，jvm就直接关闭。使用Epsilon垃圾收集器启动参数： UnlockExperimentalVMOptions：解锁隐藏的虚拟机参数。 Xmx100m 运行程序后，结果如下：程序开始 Terminating due to java.lang.OutOfMemoryError: Java heap space 会发现很快就内存溢出了，因为Epsilon
81940发布于 2019-05-23
来自专栏查理不是猹的Python专栏
【抬抬小手学Python】yolov3代码和模型结构图详细注解【图文】
= norm\_epsilon) conv\_index += 1 conv = self. = norm\_epsilon) conv\_index += 1 conv = self. = norm\_epsilon) conv\_index += 1 conv = self. = norm\_epsilon) conv\_index += 1 conv = self. = norm\_epsilon) conv\_index += 1 conv = self.
53610编辑于 2022-01-07
来自专栏mathor
矩阵分析（十）正交、投影、标准正交
,y_n)^T $$ 即 $$ \alpha = (\epsilon_1,\epsilon_2,...,\epsilon_n)X\\ \beta=(\epsilon_1,\epsilon_2,... _1,\epsilon_2\right>&\cdots &\left<\epsilon_1,\epsilon_n\right>\\\left<\epsilon_2,\epsilon_1\right>&\ left<\epsilon_2,\epsilon_2\right>&\cdots &\left<\epsilon_2,\epsilon_1\right>\\\vdots & \vdots & \ddots & \vdots \\\left<\epsilon_n,\epsilon_1\right>&\left<\epsilon_n,\epsilon_2\right>&\cdots &\left<\epsilon_n _1,\epsilon_1\right>=1$，所以 $$ \beta_2=\epsilon_2-\frac{\left<\epsilon_2,\epsilon_1\right>}{\left<\epsilon
1.4K30发布于 2021-04-01
来自专栏Linux学习~
⭐️ 关键字深度剖析 ⭐️第五章（深入C语言三种类型（float/bool/指针）与“零值“的比较）
= 1.0 */ #define FLT_EPSILON 1.192092896e-07F /* smallest such that 1.0+FLT_EPSILON ! = 1.0 */ XXX_EPSILON 是最小误差 , 是： XXX_EPSILON + n 不等于 n 的最小的正数。 ){ //写法1 //if (fabs(x) < DBL_EPSILON){ //写法2 if(x > -DBL_EPSILON && x < DBL_EPSILON) { //书中写法 printf DBL_EPSILON: 为何不是>= && <= 呢？个人看法：XXX_EPSILON是最小误差,是：XXX_EPSILON+n不等于n的最小的正数 XXX_EPSILON+n不等于n的最小的正数: 有很多数字+n都可以不等于n，但是XXX_EPSILON
1K30编辑于 2022-11-30
来自专栏机器人课程与技术
强化学习笔记5-Python/OpenAI/TensorFlow/ROS-阶段复习
=0.9) initial_epsilon = qlearn.epsilon epsilon_discount = 0.9986 start_time = time.time observation = env.reset() if qlearn.epsilon > 0.05: qlearn.epsilon *= epsilon_discount : "+str(round(qlearn.epsilon,2))+"] - Reward: "+str(cumulated_reward)+" Time: %d:%02d:%02d" % (h, =0.9, alpha=0.2, gamma=0.9) initial_epsilon = sarsa.epsilon epsilon_discount = 0.9986 observation = env.reset() if sarsa.epsilon > 0.05: sarsa.epsilon *= epsilon_discount
77710发布于 2019-06-15
来自专栏ClearSeve
C++11 中的 lambda 表达式是什么
void func5(std::vector<double>& v, const double& epsilon) { std::transform(v.begin(), v.end(), v.begin (), [epsilon](double d) -> double { if (d < epsilon) { return 0; } else { return d; } }); } [] 不捕获任何变量 [epsilon] 仅捕获 epsilon 变量，且是值捕获 [v, epsilon] 仅捕获 v 和 epsilon 变量，且是值捕获（多个变量以 , 隔开） [&epsilon] 引用捕获 epsilon 变量 [&] 引用捕获所有变量 [ =] 值捕获所有变量 [&, epsilon] 除了 epsilon 是值捕获，其它的都引用捕获 [=, &epsilon] 除了 epsilon 是引用捕获，其它的都值捕获 [this] 值捕获 this
60420编辑于 2022-02-10
来自专栏杨熹的专栏
DQN 的代码实现
deque class DQNAgent(): def __init__(self, env_id, path, episodes, max_env_steps, win_threshold, epsilon_decay , state_size=None, action_size=None, epsilon=1.0, epsilon_min=0.01, _max_episode_steps = max_env_steps self.win_threshold = win_threshold self.epsilon = epsilon self.epsilon_decay = epsilon_decay self.epsilon_min = epsilon_min self.gamma epsilon，epsilon_decay，epsilon_min：这三个是用来进行 exploration-exploitation trade off 的，其中 epsilon_decay 越大的话
1.7K20发布于 2020-03-20
来自专栏数学与计算机
烧脑证明别看系列之1
声明: 本篇摘录川大高等数学第一册第四版例题, 原文有改动, 勿喷证 \lim \limits_{n\rightarrow\infty} \sqrt[n]{a} = 1, a>0 根据极限的\epsilon - N定义, 需证明 \mid \sqrt[n]{a} - 1 \mid < \epsilon 当a > 0, 可去掉上式绝对值符号, \sqrt[n]{a} - 1 < \epsilon 求解此式 , 请读者脑补过程, 下面是结果: n > \frac{\lg a}{\lg {1+\epsilon}} 回顾\epsilon - N定义内容, 有一个条件\exists N \in N \forall n > N, 这里的N是正整数, 上式却不是, 我们可以对\frac{\lg a}{\lg {1+\epsilon}}向上取整, 令N = \left [ \frac{\lg a}{\lg {1+\epsilon }}\right ], 这样条件就满足了, 接下来把\epsilon - N定义再写一遍, 把里边的N换成\left [ \frac{\lg a}{\lg {1+\epsilon}}\right ],
62530发布于 2019-10-12
来自专栏从流域到海域
ϵ-greedy Policies
本文链接：https://blog.csdn.net/Solo95/article/details/102751088 ϵ\epsilonϵ-greedy Policies 非常简单的平衡探索(Explotation 实际上这个策略在论文里一般一句话就可以概括:ϵ\epsilonϵ-greedy policy that selects a random action with probability ϵ\epsilonϵ ϵ∣A∣ \pi(a|s) = \begin{cases} \mathop{argmax}\limits_{a}Q^\pi(s,a) \quad with \ probability \ 1-\epsilon 证明ϵ\epsilonϵ-greedy策略能单调提升 ? ，其中ϵ\epsilonϵ以ϵi=1i\epsilon_i = \frac{1}{i}ϵi=i1的比率逐渐减小到0
1.1K20发布于 2019-10-28
来自专栏Coding迪斯尼
自己动手写编译器：使用NFA状态机识别字符串
{D}) 这个表达式的目的是识别浮点数，用我们前面做好的代码生成的NFA状态机如下：这里我们需要引入两个个概念及其对应操作，首先是epsilon-clousure操作，它表示给定一系列初始状态后，然后找到从这些状态出发通过epsilon边所能抵达的状态集合，例如epsilon-closure(0)={0，27,11,9,12,13,19},从上图看出，状态0开始经过epsilon边后能抵达点27 ，然后从点27经过epsilon边又能抵达点11,19，依此类推，这里需要注意的是episilon-closure的结果包含其输入的状态，例如epsilon-closure(0)的结果中就包括了节点0、例如epsilon-closure(0)对应的节点集合是{0,27,11,9,12,13,19}，此时如果输入字符为数字，那么在这些点中，只有点9和19能接收字符集D,其中节点9接收数字后进入节点10，对于集合{10, 20}，我们有epsilon-closure({10,20})={10, 20,12,13,9, 21}, 然后继续对其执行move操作，由于这些节点中，节点9接受数字然后进入节点10
96121编辑于 2022-12-02
来自专栏Python项目实战
强化学习在游戏开发中的应用：打造智能化游戏体验
=1.0, epsilon_decay=0.995, epsilon_min=0.01): for episode in range(episodes): state = env.reset = max(epsilon_min, epsilon * epsilon_decay) print(f'Episode: {episode}, Total Reward: {total_reward }, Epsilon: {epsilon:.2f}')train_dqn(model, env)2. = max(epsilon_min, epsilon * epsilon_decay) print(f'Episode: {episode}, Total Reward: {total_reward }, Epsilon: {epsilon:.2f}')train_dqn(model, env)通过训练AI玩《Flappy Bird》，我们可以验证强化学习在游戏中的应用效果，并进一步研究其应用前景。
90810编辑于 2024-12-27
来自专栏WebJ2EE
【深度强化学习】—— Q-Learning with Taxi-v3
= 1.0 # Exploration rate max_epsilon = 1.0 # Exploration probability at Exponential decay rate for exploration prob Step 4: Define the epsilon-greedy policy def epsilon_greedy_policy = env.action_space.sample() return action def reduce_epsilon(episode): epsilon = min_epsilon + (max_epsilon - min_epsilon) * \ np.exp(-decay_rate*episode) return epsilon Step 5: Define (because we need less and less exploration) epsilon = reduce_epsilon(episode) # log
1.3K10编辑于 2022-03-30
来自专栏DotNet NB && CloudNative
停止使用==和!=来判断浮点数是否相等
double a = 0.1 + 0.2; double b = 0.3; double epsilon = 1e-10; Console.WriteLine(Math.Abs(a - b)< epsilon 进一步优化我们的比较算法如何选择一个合理的 epsilon 值选择合适的 epsilon 值(即比较浮点数时的精度)取决于具体的应用场景和浮点数的范围.以下是一些指导原则,可以帮助你选择合适的 epsilon 值：基于数值范围：对于较小的数值范围(例如 0 到 1),可以选择较小的 epsilon 值,例如 1e-6 或 1e-7. 对于较大的数值范围(例如 0 到 1000),可以选择较大的 epsilon 值,例如 1e-5 或 1e-4. 基于应用需求：如果应用对精度要求较高(例如科学计算或金融应用),应选择较小的 epsilon 值. 如果应用对精度要求较低(例如图形渲染或物理模拟),可以选择较大的 epsilon 值.
49510编辑于 2024-12-20
来自专栏学习
深入浅出对抗学习：概念、攻击、防御与代码实践
扰动的计算公式为： \eta = \epsilon \cdot \text{sign}(\nabla_x J(\theta, x, y)) 其中： \epsilon 是一个很小的正数，控制扰动的大小记录在不同 epsilon 下的准确率，并保存一些对抗样本用于可视化。运行测试: 使用不同的 epsilon 值测试攻击效果。epsilon=0 相当于没有攻击的原始准确率。范数，将 x_{t+1}^{adv} 裁剪到 [x-\epsilon, x+\epsilon] ，并同时裁剪到有效数据范围如 [0,1] ）。投影: eta = torch.clamp(adv_image_update - image, min=-epsilon, max=epsilon): 计算扰动 eta，并将其限制在 [-epsilon , epsilon] 范围内，这是 L_\infty 范数约束。
99210编辑于 2025-05-28
来自专栏探物及理
RL实践3——为Agent添加Policy
中，介绍了动态规划DP 求解价值函数并没有形成一个策略Policy$\pi$来指导agent的动作选取，本节将利用SARSA（0）的学习方法，帮助agent学习到价值函数(表），指导$\epsilon Agent的写法 Agent的三要素是：价值函数、策略、模型 Sarsa（0）是不基于模型的控制，其动作选择策略是\(\epsilon$-greedy，根据价值函数选择动作。 \)策略，评估过程的A'没有实际执行 control：$\epsilon-greedy$策略 SARSA：更新和执行都用$\epsilon-greedy$策略 def performPolicy (self, s, episode_num, use_epsilon): epsilon = 1.00 / (episode_num+1) Q_s = self.Q[s] str_act = "unknown" rand_value = random() action = None if use_epsilon and rand_value < epsilon:
60930发布于 2020-09-07
来自专栏前行的CVer
概率论与数理统计
，恒有 \lim_{n \to\infty}P(|X_n-X|<\epsilon)=1 \lim_{n \to\infty}P(|X_n-a|<\epsilon)=1 ¶1.2 例题设$\{ )=\dfrac{n}{\pi(1+n^2x^2)},{-\infty}<{x}<{+\infty}$，证明$x_n \xrightarrow{p} 0$ 证明： $$ P(|X_n-0|<{\epsilon })=p(-\epsilon<{x_n}<{\epsilon})\\ =\int_{-\epsilon}^{\epsilon}\frac{n}{\pi(1+n^2x^2)}dx\\="\frac{1}{ \pi}\arctan{n\epsilon}|_{-\epsilon}^{\epsilon}\\" =\frac{2}{\pi}\arctan{n\epsilon}\\ \lim_{n \to \infty }p\{|x_n-0|<{\epsilon}\}="\lim_{n" \infty}\frac{2}{\pi}\arctan{n\epsilon}="1\\" 故x_n\xrightarrow{p}{0
58210发布于 2021-03-04
来自专栏YoungGy
机器为什么可以学习
) &\le 2\exp(-2\epsilon^2N) \\ &P(|E_{in}-E_{out}| > \epsilon) &\le 2\exp(-2\epsilon^2N) \\ &P(BAD) &\le 2\exp(-2\epsilon^2N) \end{split} 设定一定的误差容忍限ϵ\epsilon后，需要做到如下的事情机器才可能学习：采样样本量NN足够大 EinE_{in} ) &\le 2M\exp(-2\epsilon^2N) \\ &P(BAD) &\le 2M\exp(-2\epsilon^2N) \end{split} 设定一定的误差容忍限ϵ\epsilon ) &\le 2M\exp(-2\epsilon^2N) \\ &P(BAD) &\le 2M\exp(-2\epsilon^2N) \end{split} 稍作变换，即得到： P(|Ein ) &\le 4(2N)^{d_{vc}}\exp(-\frac{1}{8}\epsilon^2N) \\ &P(BAD) &\le 4(2N)^{d_{vc}}\exp(-\frac{1}{8}\epsilon
1K50发布于 2018-01-02
来自专栏AI SPPECH
109_噪声鲁棒微调：对抗训练
(self.epsilon * 0.5) # 对低置信度样本减少扰动 else: adaptive_epsilon.append(self.epsilon 不同噪声强度的评估 results["varying_epsilon"] = {} for epsilon in config["epsilon_values"]: adv_config = { "epsilon": epsilon, "alpha": epsilon / 3, # 保持alpha与epsilon的比例 ": epsilon, "alpha": epsilon / 3, # 保持alpha与epsilon的比例 "steps": 3 = 0.0 for epsilon in epsilon_candidates: adv_config = { "epsilon": epsilon
33610编辑于 2025-11-16

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

iOS之DBL_EPSILON,FLT_EPSILON,FLT_MIN和FLT_MAX

支持向量机-epsilon-SVR

第六篇 : Epsilon 垃圾收集器

【抬抬小手学Python】yolov3代码和模型结构图详细注解【图文】

矩阵分析（十）正交、投影、标准正交

⭐️ 关键字深度剖析 ⭐️第五章（深入C语言三种类型（float/bool/指针）与“零值“的比较）

强化学习笔记5-Python/OpenAI/TensorFlow/ROS-阶段复习

C++11 中的 lambda 表达式是什么

DQN 的代码实现

烧脑证明别看系列之1

ϵ-greedy Policies

自己动手写编译器：使用NFA状态机识别字符串

强化学习在游戏开发中的应用：打造智能化游戏体验

【深度强化学习】—— Q-Learning with Taxi-v3

停止使用==和!=来判断浮点数是否相等

深入浅出对抗学习：概念、攻击、防御与代码实践

RL实践3——为Agent添加Policy

概率论与数理统计

机器为什么可以学习

109_噪声鲁棒微调：对抗训练

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐