首页
学习
活动
专区
圈层
工具
发布
首页标签特征工程

#特征工程

从原始数据转换为特征向量的过程。 特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。 典型的特征工程包括数据清理、特征提取、特征选择等过程。

Adv. Drug Deliv. Rev.|面向数据受限药物发现的机器学习与深度学习策略

DrugOne

在药物发现流程中,限制机器学习(ML)和深度学习(DL)模型潜力的一个关键瓶颈是高质量实验数据的匮乏。将标准ML和DL算法直接应用于这些小规模数据集会带来显著挑...

7610

2:L用监督学习对抗入侵:蓝队的证据链分析

安全风信子

作者: HOS(安全风信子) 日期: 2026-03-17 主要来源平台: GitHub 摘要: 作为数字世界的守护者,我将标签数据视为证据链,用监督学习...

6610

税务钓鱼攻击中社会工程学机制与防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着全球数字化税务系统的普及,针对纳税人及税务机构的网络钓鱼攻击呈现出爆发式增长态势。此类攻击不再局限于简单的邮件欺诈,而是演变为结合高度逼真的品牌伪装、心理操...

7910

利用LLM嵌入优化时间序列预测的特征工程方法

用户11764306

接下来的代码片段加载第一个数据集,并应用简单的特征工程来添加滞后特征和滚动统计量——这是时间序列预处理中的常见做法,旨在为下游预测任务更好地捕捉有意义的信号模式...

15210

基于社会工程学诱导的社交媒体账户窃取机制与防御体系研究——以喜马偕尔邦网络钓鱼案件为例

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着移动互联网的深度普及,社交媒体已成为个人信息交互与数字身份承载的核心平台。然而,依托社会工程学原理的网络钓鱼攻击正呈现出规模化、精准化与产业化的演变趋势。本...

14810

生成式AI驱动的社会工程学钓鱼攻击演进与防御范式重构

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着大语言模型(LLM)与生成式人工智能技术的爆发式增长,网络钓鱼攻击正经历从“广撒网”式批量投递向高度定制化、智能化社会工程学攻击的范式转变。Check Po...

14810

2026年2月钓鱼网站投诉特征分析与防御机制优化研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文基于12321网络不良与垃圾信息举报受理中心发布的《2026年2月被投诉钓鱼网站TOP10》数据报告,系统梳理当月钓鱼网站的类型分布、仿冒对象集中度、技术实...

19410

基于多维特征融合的钓鱼网站动态识别与防御机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着网络钓鱼攻击技术的迭代升级,传统基于黑名单和静态特征匹配的防御手段已难以应对日益复杂化、隐蔽化的钓鱼网站。本文以KnowBe4最新发布的网络安全威胁情报为实...

16510

基于Teams社交工程的A0Backdoor隐蔽渗透机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着远程办公模式的常态化,Microsoft Teams已成为企业核心协作平台,同时也演变为网络攻击者实施社会工程学攻击的高频载体。本文深入剖析了一起针对金融与...

10310

特征泛滥:量化回归模型的生产脆弱性

用户11764306

在模型中加入更多特征,乍一看似乎是提升性能的明显途径。如果一个模型能从更多信息中学习,它理应做出更好的预测。然而在实践中,这种直觉往往会引入隐藏的结构性风险。每...

12310

基于社会工程学的宽带钓鱼诈骗机制分析与防御体系构建

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着数字化进程的加速,网络钓鱼攻击已从广撒网式的垃圾邮件演变为高度定制化、场景化的社会工程学攻击。本文以2026年3月发生在爱尔兰都柏林的一起典型案件为切入点,...

16210

基于多维特征融合的钓鱼网站识别机制与防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着网络攻击技术的迭代演进,钓鱼网站已成为网络犯罪生态中最为普遍且危害巨大的攻击载体。据KnowBe4发布的最新数据显示,2025年全球数据泄露平均成本已达44...

26610

基于社会工程学视角的网络钓鱼攻击持续有效性分析与组织防御体系构建

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着数字化转型的深入,网络钓鱼(Phishing)已演变为全球范围内最具破坏性和普遍性的网络安全威胁。尽管企业在技术防御层面投入巨大,部署了先进的邮件网关、反病...

25410

税务周期下的社会工程攻击:基于OPP警示的钓鱼与欺骗机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着年度税务申报周期的到来,网络犯罪活动呈现出显著的周期性爆发特征。本文基于安大略省警察局(OPP)发布的最新警示及哈尔顿山地区的具体案例,深入探讨了针对纳税人...

15310

生成式AI驱动的社会工程学攻击演化与多维防御架构研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着大语言模型(LLM)与生成式人工智能技术的普及,网络钓鱼攻击正经历从“劳动密集型”向“智能自动化”的范式转变。近期网络安全数据显示,网络钓鱼已占据邮件威胁总...

16710

基于绩效评估焦虑的社会工程学攻击机制与防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着企业数字化转型的深入,人力资源管理的电子化流程已成为常态,其中绩效评估作为连接员工利益与组织目标的核心环节,其信息交互频率高、敏感度强。近期网络安全监测数据...

14010

机器学习特征工程:分类变量的数值化处理方法

deephub

编码是机器学习流程里最容易被低估的环节之一,模型没办法直接处理文本形式的分类数据,尺寸(Small/Medium/Large)、颜色(Red/Blue/Gree...

8310

基于行为特征与动态沙箱的AsyncRAT变种检测及防御机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着远程办公模式的常态化与企业数字化转型的深入,远程访问木马(Remote Access Trojan, RAT)已成为高级持续性威胁(APT)组织及网络犯罪团...

17210

使用 tsfresh 和 AutoML 进行时间序列特征工程

deephub

时间序列无处不在,心电图上的心跳、股票价格、家庭智能电表读数,甚至句子中词语——这些都是时间序列。它们的特殊之处在于顺序:过去影响未来,相邻的数据点往往高度相关...

16810

特征选择 vs 特征提取的根本差异:安全攻防中的特征工程策略

安全风信子

作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 本文深入剖析特征选择与特征提取的根本差异,揭示它们在安全攻防中的不...

18010
领券