首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-9 更多有关k近邻算法的思想

    划分数据集为训练集和测试集; 对于kNN这种算法,需要数据在同一尺度下,因此要进行数据的归一化: 先将训练集进行归一化Scaler,然后将归一化后的数据进行训练,得到最终的模型; 测试集要使用训练集上的 Scaler进行归一化,然后送进使用训练集训练的模型,来得到模型分类的准确度,这样我们就得到了这个模型具体的性能有多好。 当然训练模型中已经固定好了一组超参数,为了获得最好的模型,使用前面介绍的网格搜索的方式来寻找最好的超参数,进而得到一个最好的模型

    59100发布于 2019-11-13
  • day13 学习日记: 一天内把一个建议RAG项目初版跑通(RAG + 日期检索救火)

    线上问题往往是环境/网络:代理、环境变量作用域(Preview vs Production)、Serverless 出站网络,都会伪装成“模型不行”。 按时间线拆解) 1)目标确认:先把“能用的 RAG”跑起来 我给自己定的验收标准很简单: 能流式对话(体验像“打字机”一样顺滑) 能从 Supabase 向量库检索到上下文并回答 能按日期准确命中(例如:问 4- 9 必须能明确找到 2026-4-09.md) 2)第一轮实现:RAG 通了,但日期查询会漂移 现象库里确实有 2026-4-09.md 的切片,但问“4-9 写了什么”时,经常出现: 找不到相关内容 match_documents、日期锚点、流式输出 Next.js 负责:/api/py/chat 作为 BFF 代理,前端继续用水墨风 UI 做流式渲染 这一步的价值是把“复杂度”从前端移走:以后不管换模型 为什么不命中) 链路可排障(日志能定位 threshold、Top-K、锚点注入、网络/代理) 架构优先级清晰(AI/向量在 Python;纯交互/代理在 TS) 最后的碎碎念: “RAG 的问题不在于模型聪不聪明

    10300编辑于 2026-06-17
  • 尼康五年来首度营业亏损,下调全年光刻机销量

    11月6日,日本相机及光刻机大厂尼康(Nikon)公布了2026财年上半年(2025年4-9月)财报。 从主营业务来看,今年4-9月期间精机业务(包含半导体光刻、FPD光刻设备)营收较去年同期减少14.3%至698.86亿日元、营业利润受益于结构改革效益而暴涨222.6%至30.44亿日元;图像业务(相机业务 从产品销量来看,4-9月期间,尼康半导体光刻机销量为9台,低于去年同期的10台;FPD光刻设备销量为15台,低于去年同期的16台;尼康单反相机全球销售量同比增长17%至48万台、更换用镜头销售量同比增长

    46610编辑于 2026-03-19
  • 来自专栏深度学习和计算机视觉

    【从零学习OpenCV 4】直方图匹配

    在代码清单4-9中给出了实现直方图匹配的示例程序。 程序中待匹配的原图是一个图像整体偏暗的图像,目标直方图分配形式来自于一张较为明亮的图像,经过图像直方图匹配操作之后,提高了图像的整体亮度,图像直方图分布也更加均匀,程序中所有的结果在图4-8、图4-9给出 代码清单4-9 myHistMatch.cpp图像直方图匹配 1. #include <opencv2\opencv.hpp> 2. #include <iostream> 3. 4. 图4-9 myHistMatch.cpp程序中给图像的直方图

    3K30发布于 2019-12-24
  • 来自专栏机器学习算法与Python学习

    机器学习(4) -- 神经网络

    图4-3 生物神经系统中的神经元 而神经元模型便是模拟上述的神经元接受信息并传递信息的过程。 图4-6 从偏移单元角度理解的神经元模型 4.3 Forward Propagation 4.2节已经学习了神经网络的最基本成分-神经元模型,下面将介绍如何用神经元搭建多层前馈神经网络(multi-layer 一个没有隐藏层且输出层只有一个单元的神经网络就相当于线性的Logistic模型。 ? 但是,异或/同或却是非线性可分的,如图4-9所示。 ? 图4-9 异或/同或问题 在数字逻辑中我们知道可以利用与或非门搭出异或/同或门,那是因为有如下运算法则, a XOR b = ((NOT a) AND b) OR (a AND (NOT b)); a

    1.3K60发布于 2018-04-04
  • 来自专栏深度学习

    【自然语言处理】NLP入门(九):1、正则表达式与Python中的实现(9):自动机:⾮确定有限⾃动机与正则表达式

    机器学习和人工智能中的模型:可以用作学习和决策的简单模型。 2. 下推自动机(Push-down Automata, PDA) 定义   下推自动机是一种带有堆栈存储的扩展有限自动机模型。 软件工程中的模型验证:用于验证软件模型的正确性。 网络协议解析和验证:确保网络消息遵循正确的语法和格式规范。 密码学中的加密解密算法:实现一些基于上下文的加密解密算法。 图灵机被认为是最通用的计算模型,所有可计算的函数理论上都可以由某个图灵机来计算。这一性质被称为"图灵完备"。 应用 复杂度理论分析:图灵机的计算能力:是研究算法时间和空间复杂性的理论模型。 正则表达式 import re pattern = r'^(13[4-9]\d{8}|15[01289]\d{8})$' x = ["13915556234", "13025621456", "15325645124 print(f"{phone} 是移动手机号码") else: print(f"{phone} 不是移动手机号码") import re pattern = r'(13[4-

    63310编辑于 2024-07-30
  • 来自专栏AI科技大本营的专栏

    从原理到代码,轻松深入逻辑回归模型

    虽然逻辑回归也有回归这个词,但由于这里的自变量和因变量呈现的是非线性关系,因此严格意义上讲逻辑回归模型属于非线性模型。逻辑回归模型通常用来处理二分类问题,如图 4-4 所示。 类似的,在 4.2.1 小节学习完逻辑回归模型的数学表达之后我们来学习逻辑回归模型的训练方法。首先与 4.1.1 小节类似,我们首先需要确定逻辑回归模型的评价方式,也就是模型的优化目标。 效果如图 4-9 所示: ? 图4-9 学习率 ? 时,一元二次损失函数梯度下降过程示意图 第三个例子,我们将 ? 设置为1.1,看一下效果。 np.linspace(0.001, 1, 50) #取0.001避免除数为0 plot_y = logp(plot_x) plt.plot(plot_x, plot_y) plt.show() 如下图4-4-9 损失函数if y=1 当p=0的时候,损失函数的值趋近于正无穷,根据 ? ? 说明y的预测值 ? 偏向于0,但实际上我们的 y 真值为 1 。

    84120发布于 2019-08-16
  • 来自专栏新智元

    RLHF何以成LLM训练关键?AI大牛盘点五款平替方案,详解Llama 2反馈机制升级

    在ChatGPT引领的大型语言模型时代,一个绕不过去的话题就是「基于人类反馈的强化学习」(RLHF),不仅提升了语言模型的性能,也将人类社会的价值观注入到模型中,使得语言模型能够帮助用户解决问题,提高模型的安全性 简单来说,Llama-2-chat在第一步RLHF微调上使用相同的指令数据,但在第二步使用了两个奖励模型;通过多个阶段的不断进化,奖励模型也会根据Llama-2-chat模型出现的错误进行更新;并且增加了拒绝采样 Margin Loss 在标准InstructGPT中使用的RLHF PPO方法,研究人员需要收集同一个提示下的4-9模型输出并进行排序,比如四个回复的排序结果为A<C< D<B,那么就可以得到六个对比结果 :A < C,A < D ,A < B,C < D,C < B,D < B Llama 2的数据集也采用类似的方式,不过标注人员每次只能看到两个(而非4-9个)回复并进行对比,但新增了一个边际(margin ,也就意味着两个模型的差距并不大,并且RLHF和RLAIF都大大优于纯粹通过监督指令微调训练的模型

    1.5K50编辑于 2023-09-19
  • 来自专栏机器学习与自然语言处理

    Stanford机器学习笔记-4. 神经网络Neural Networks (part one)

    图4-3 生物神经系统中的神经元 而神经元模型便是模拟上述的神经元接受信息并传递信息的过程。 图4-6 从偏移单元角度理解的神经元模型 4.3 Forward Propagation 4.2节已经学习了神经网络的最基本成分-神经元模型,下面将介绍如何用神经元搭建多层前馈神经网络(multi-layer 一个没有隐藏层且输出层只有一个单元的神经网络就相当于线性的Logistic模型。 ? 但是,异或/同或却是非线性可分的,如图4-9所示。 ? 图4-9 异或/同或问题 在数字逻辑中我们知道可以利用与或非门搭出异或/同或门,那是因为有如下运算法则, a XOR b = ((NOT a) AND b) OR (a AND (NOT b)); a

    1.3K110发布于 2018-03-13
  • 来自专栏常用算法专栏

    常用的排序算法之桶排序(Bucket Sort)

    确定桶的数量和范围:假设我们使用5个桶,每个桶的范围是0-1, 1-2, 2-3, 3-4, 4-9。 将数据放入对应的桶中: 桶0(0-1): 无数据 桶1(1-2): [1] 桶2(2-3): [2, 2, 3, 3] 桶3(3-4): [4] 桶4(4-9): [8] 对每个桶内的数据进行排序:

    59710编辑于 2025-04-05
  • 来自专栏二猫の家

    GEE代码实例教程详解:地表温度长时间序列分析

    通过结合Landsat 4-9的数据,我们将探索1982年至2024年间地表温度的变化趋势。 加载Landsat数据集 加载Landsat 4-9的数据集,并根据时间范围、地理范围和质量条件进行筛选。 3.

    1.1K10编辑于 2024-07-09
  • 来自专栏碱基矿工

    今天在看NAR的database专刊时无意发现“国家基因组科学数据中心”在这上面连续6年每年都发一篇介绍中心的文章,图片4-9分别对应2017-2022的文章主图。我服了,原来可以这样干!每年都更新一

    今天在看NAR的database专刊时无意发现“国家基因组科学数据中心”在这上面连续6年每年都发一篇介绍中心的文章,图片4-9分别对应2017-2022的文章主图。我服了,原来可以这样干!

    52320编辑于 2022-04-12
  • 来自专栏python3

    python 正则匹配手机号

    import re phone = str(input('请输入手机号:')) # b = str(12345678912) t = re.compile(r'^1(3\d|4[4-9]|5[0-35-

    3.7K10发布于 2020-01-17
  • 来自专栏机器之心

    LLM成功不可或缺的基石:RLHF及其替代技术

    然后在 RLHF 第 2 步,使用经过监督式微调的模型创建一个奖励模型,如下所示。 RLHF 第 2 步,图片来自 InstructGPT 论文 如上图所示,用上一步中创建的已微调 LLM 为每个 prompt 生成 4-9 个响应。然后再让人基于自己的偏好对这些响应进行排名。 在之前讨论的 InstructGPT 所用的标准 RLHF PPO 中,研究者会根据自己创建的「k 选 2」比较方法来收集排名 4-9 的输出响应。 然而,每位人类标记者在每轮标记时仅会比较 2 个响应(而不是 4-9 个响应)。 两个奖励模型 如前所述,Llama 2 中有两个奖励模型,而不是一个。一个奖励模型基于有用性,另一个则是基于安全性。而用于模型优化的最终奖励函数是这两个分数的一种线性组合。

    1.4K40编辑于 2023-10-08
  • 来自专栏全栈程序员必看

    java验证电话号码的正则_html注册验证正则表达式

    PhoneFormatCheckUtils { public static boolean isMobile(String mobile) { String regex = "^((13[0-9])|(14[0,1,4-

    1.4K10编辑于 2022-09-30
  • 来自专栏全栈程序员必看

    正则表达式验证手机号码格式_正则表达式身份证校验

    import re patt=r’(13[4-9]\d{8,})KaTeX parse error: Undefined control sequence: \d at position 12: |(15

    92010编辑于 2022-09-30
  • 来自专栏数据分析与挖掘

    pycaret之集成模型(集成模型、混合模型、堆叠模型

    1、集成模型 组装训练好的模型就像编写ensemble_model一样简单。它仅采用一个强制性参数,即经过训练的模型对象。 此函数可用于混合可以使用blend_models中的estimator_list参数传递的特定训练模型,或者如果未传递列表,它将使用模型库中的所有模型。 3、堆叠模型 堆叠模型是使用元学习的整合方法。堆叠背后的想法是建立一个元模型,该模型使用多个基本估计量的预测来生成最终预测。在PyCaret中堆叠模型就像编写stack_models一样简单。 此函数使用estimator_list参数获取训练模型的列表。所有这些模型构成了堆栈的基础层,它们的预测用作元模型的输入,可以使用meta_model参数传递该元模型。 restack参数控制将原始数据公开给元模型的能力。默认情况下,它设置为True。当更改为False时,元模型将仅使用基本模型的预测来生成最终预测。

    3.6K10发布于 2020-10-27
  • 来自专栏全栈程序员必看

    –AR模型,MA模型,ARMA模型介绍

    AR模型的定义 ————— AR模型平稳性判别 AR模型是常用的平稳序列的拟合模型之一,但并非所有的AR模型都是平稳的 。 第一个平稳的AR模型 这个AR模型的递推式子是x[t]=0.8*x[t-1]+e,其实e是一个误差项。 AR模型的一些性质 若AR模型满足平稳性条件,则他的均值为0,我们可以从上面的图中看出 AR模型的自相关系数是呈复指数衰减– 有拖尾性 AR模型的偏自相关系数有截尾性 注意第二,第三条很重要,后面可以用来做模型的识别 我在强调一遍 AR模型的自相关系数是呈复指数衰减– 有拖尾性 * AR模型的偏自相关系数有截尾性* MA模型 MA模型的定义 MA模型的可逆性 这个性质在推到MA模型的相关系数和自相关系数的时候比较有用 看一下可逆的定义 接下来看一下MA模型怎么转换成AR模型 最后我们看一下什么样的MA模型可以转化为AR模型 可逆MA模型的应用 对于一些MA模型,虽然其生成的式子不一样,但是其自相关图是一样的

    2.7K20编辑于 2022-09-20
  • 来自专栏啄木鸟软件测试

    更正以前风险调整中的一个缺陷

    用户登录 3 6 18 用户注册 2 7 14 填写购物地址及支付信息 2 5 10 选择商品 3 4 12 放入购物车 3 5 15 结算 4 5 20 在线付款 4 6 24 目前级别发现的风险见表4-4-9 目前级别发现的缺陷 模块 高级 中级 低级 用户登录 2 5 16 用户注册 3 6 31 填写购物地址及支付信息 2 7 22 选择商品 1 5 13 放入购物车 1 0 3 结算 2 4

    52600编辑于 2025-01-22
  • 来自专栏学习

    【软件测试】敏捷模型(Scrum模型)和V模型、W模型

    敏捷模型 前面的那些模型以前非常流行,但现在开发人员在使用的时候会遇到各种问题。主要困难包括在项目开发期间处理来自客户的变更请求,以及合并这些变更所需要的高成本和时间。 在实际工作中,一款产品的功能是不断在变化的 所以为了克服这些缺点,就提出了敏捷软件开发模型。在敏捷模型中,需求被分解成许多可以增量开发的小部分。敏捷模型采用迭代开发。每个增量部分都是在迭代中开发的。 敏捷模型主要旨在帮助项目快速适应变更请求。 V 模型 V 模型中,明确的标注了测试过程中存在的不同类型的测试 右边的测试,都需要参考左边对应高度的要求 缺点: 仅仅把测试作为在编码之后的一个阶段,未在需求阶段就介入测试。 缺点和瀑布模型一样 W 模型(双 V 模型) V 模型中未将测试前置的问题在 W 模型中得以解决 开发 V 模型并不是单单指编码阶段,而是为产品开发流程而实施的各个阶段 测试的对象不仅是程序,需求、

    3.1K10编辑于 2024-11-15
领券