首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深蓝居

    使用Outlook对邮件进行分类

    我加入了公司的一个技术讨论组,结果每天差不多就有100来封邮件,相比以前我每天也就是几封而已。邮件太多了就有点看不过来,接下来遇到的问题就是我们部门的邮件些容易被淹没在讨论组100多封的邮件中。 所以我希望能够系统自动将邮件分组,所有收件人地址为讨论组的邮件自动转移到另外一个文件夹中。 我相信Outlook应该有这个功能,但是一直不知道怎么设,我也问过几个同事,他们都不知道。 直到前天在办公室看到梁振的邮件分成了很多个文件夹,我就知道他肯定知道怎么设置。果然,梁振就是强,对微软的产品十分熟悉,两三下帮我搞定了。 (4)接下来就是选择具体情况,例外情况之类的,最后是给规则命名,然后选中“立即运行此规则”即可。 运行后邮件完全通过规则分开了,部门的邮件就不会被大量的讨论组的邮件给淹没了。如图:

    3.1K10编辑于 2022-06-16
  • 来自专栏图像处理与模式识别研究所

    基于支持向量机的电子邮件垃圾邮件分类

    \n') x1 = [1 2 1]; x2 = [0 4 -1]; sigma = 2; sim = gaussianKernel(x1, x2, sigma); fprintf(['Gaussian Kernel between x1 = [1; 2; 1], x2 = [0; 4; -1], sigma = %f :' ... \n'); pause; %% =============== Part 4: Visualizing Dataset 2 ================ % The following code

    79230编辑于 2022-05-28
  • 来自专栏HHTjim'S 部落格

    利用 LLM 自动分类Gmail邮件汇总

    利用 LLM 自动分类Gmail邮件汇总 作者:matrix 被围观: 14 次 发布时间:2025-04-30 分类:零零星星 | 无评论 » 我邮箱订阅了很多博客或者 dev 相关的通知, 但又不想退订 咋整 有邮件汇总服务就完美了,能自动分类和汇总, 标记已读和label。 " //使用模型 准确率来说gpt-4o不错,deepseek v3也可以 // 汇总任务配置 const TASK_NAME = "daily.dev" //任务名称 作为汇总邮件标题的一部分 const "[script.google]AI汇总" //汇总的分类名 const MAX_EMAILS_PER_BATCH = 5; // 每次最多汇总邮件数 5 const MAX_EMAILS_BATCH 标记邮件为特定分类(标签) limitedThreads.forEach(thread => { // 获取或创建标签 const labelName = LABEL_NAME

    77000编辑于 2025-05-01
  • 来自专栏Michael阿明学习之路

    SpamHam Email Classification 垃圾邮件分类(BERT)

    加载数据 4. 定义模型 5. 训练 6. 提交测试结果 练习地址:https://www.kaggle.com/c/ds100fa19 相关博文: [Kaggle] Spam/Ham Email Classification 垃圾邮件分类( spacy) [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(RNN/GRU/LSTM) 本文使用 huggingface 上的预训练模型,在预训练模型的基础上 ,使用垃圾邮件数据集,进行训练 finetune,在kaggle提交测试结果 本文代码参考了《自然语言处理动手学Bert文本分类》 1. msg = 'Iter:{0:>6}, Train Loss:{1:>5.2}, Train Acc:{2:>6.2}, Val Loss:{3:>5.2}, val Acc :{4:

    2.1K20发布于 2021-02-19
  • 来自专栏Michael阿明学习之路

    SpamHam Email Classification 垃圾邮件分类(RNNGRULSTM)

    建模 4. 训练 5. 测试 练习地址:https://www.kaggle.com/c/ds100fa19 相关博文 [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(spacy ) [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(BERT) 1. , 1 是垃圾邮件 print(train['spam'].unique()) [0 1] 2. params: 27,497 Non-trainable params: 0 _________________________________________________________________ 4.

    99920发布于 2021-02-19
  • 来自专栏foochane

    词嵌入+神经网络进行邮件分类

    1 问题描述 问题:邮件分类问题(Email classification) 任务:将邮件分为两类(spam or ham) 数据集:https://www.kaggle.com/uciml/sms-spam-collection-dataset spam.csv', encoding = "ISO-8859-1") data.columns Index(['v1', 'v2', 'Unnamed: 2', 'Unnamed: 3', 'Unnamed: 4' labels_train = to_categorical(np.asarray(train_labels)) labels_test = to_categorical(np.asarray(test_labels)) 4 ===========] - 25s 7ms/step - loss: 0.0940 - acc: 0.9731 - val_loss: 0.2079 - val_acc: 0.9787 Epoch 4/ 0.92 150 avg / total 0.98 0.98 0.98 1115 文章来源: foochane Blog:词嵌入+神经网络进行邮件分类

    68920发布于 2019-05-23
  • 来自专栏Michael阿明学习之路

    SpamHam Email Classification 垃圾邮件分类(spacy)

    建模 4. 训练 5. 预测 练习地址:https://www.kaggle.com/c/ds100fa19 相关博文: [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(RNN/ GRU/LSTM) [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(BERT) 1. 特征组合 对邮件的主题和内容进行组合 + 处理标签 train['all'] = train['subject']+train['email'] train['label'] = [{"spam": bool label] correct = (pred == true_class) acc = sum(correct)/len(correct) # 准确率 return acc 4.

    1.4K10发布于 2021-02-19
  • 来自专栏王念博客

    log4j发送邮件

    =WARN log4j.logger.org.hibernate=WARN #Console log4j.appender.Console=org.apache.log4j.ConsoleAppender 使用Log4J SMTPAppender log4j.appender.Mail=org.apache.log4j.net.SMTPAppender #只发送日志级别大于等于ERROR的日志 log4j.appender.Mail.Threshold log4j.appender.Mail.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %p [%t:%F:%L] - <%m>%n #发送邮件的邮箱帐号 ,需要开通SMTP服务 log4j.appender.Mail.From=wangnian4307@163.com #SMTP邮件发送服务器地址 log4j.appender.Mail.SMTPHost =false #邮件主题 log4j.appender.Mail.Subject=og4j项目报错 #接收方邮箱,如果要发送给多个邮箱,则用逗号分隔; log4j.appender.Mail.To=2251181679

    71730发布于 2019-07-25
  • 来自专栏人工智能头条

    机器学习做中文邮件内容分类,准确识别垃圾邮件,真香!

    但是不管是企业内部工作邮箱,还是个人邮箱,总是收到各种各样的垃圾邮件,包括商家的广告、打折促销信息、澳门博彩邮件、理财推广信息等等,不管如何进行垃圾邮件分类,总有漏网之鱼。 因此打算针对同一数据集,逐步尝试各种方法,来进行垃圾邮件的识别分类——希望假以时日,这种定制化的垃圾邮件识别工具能大幅提升用户的邮箱使用体验。 因此我们依次对上述要素进行分析: 垃圾邮件内容分类(通过提取垃圾邮件内容进行判断) 中文垃圾邮件分类 英文垃圾邮件分类 垃圾邮件标题分类 垃圾邮件发送方分类 最终,我们可以根据这三个维度进行综合评判,从而实现垃圾邮件的准确分类 本文将根据邮件内容进行垃圾邮件分类。 中文邮件内容分类实现步骤 1、数据集介绍首先我们选择TREC 2006 Spam Track Public Corpora这一个公开的垃圾邮件语料库。 not None: writer.writerow([emlContent[0],emlContent[1],emlContent[2],emlContent[3],emlContent[4]

    2.1K20编辑于 2022-03-03
  • 来自专栏机器学习AI算法工程

    python实现朴素贝叶斯模型:文本分类+垃圾邮件分类

    4训练模型:在训练样本中计算先验概率 p(Ci) 和 条件概率 p(x,y | Ci),本实例有0和1两个类别,所以返回p(x,y | 0),p(x,y | 1)和p(Ci)。    改进方法:采用词袋模型,见下面垃圾邮件分类实战。 四 实战2-垃圾邮件分类   1 对邮件的文本划分成词汇,长度小于2的默认为不是词汇,过滤掉即可。返回一串小写的拆分后的邮件信息。 3 输入为25封正常邮件和25封垃圾邮件。50封邮件中随机选取10封作为测试样本,剩余40封作为训练样本。     训练模型:40封训练样本,训练出先验概率和条件概率;    测试模型:遍历10个测试样本,计算垃圾邮件分类的正确率。 ? p=2683   2 除0问题:     Laplace校准 所有计算均加一,总类别数目加n;   3 下溢出:很小的值相乘,四舍五入误差     采用log 乘法变相加;   4 移除停用词:也可以提高文本分类的性能

    2.8K71发布于 2018-03-14
  • 来自专栏拓端tecdat

    weka文本挖掘分析垃圾邮件分类模型

    WEKA文本分词预处理 首先对于训练集文件夹中的两类邮件文档进行分析,可从不同角度自动化分析两类文件特征,编写算法,构建分类模型。 首先设置工作目录,并且读取分类后的文本文件 可以看到垃圾邮件和非垃圾邮件的频数直方图 ? ? 然后对得到的原始语料进行分词处理 得到词频矩阵文件 ? 得到各个词频的分类直方图 ? 得到词频矩阵后 对数据进行分类器的建模 2. 找出区分positive和negative的分类规则(即哪些词在一起出现的时候会导致分类器判断的结果为positive,哪些词在一起出现的时候会导致分类器判断的结果为negative) 从结果可以看出cell WEKA文本分词结果比较 下面得到每个分类器的准确度和混淆矩阵: NaiveBayes 结语 基于判别方法的垃圾邮件过滤在现代研究中引起比较少的关注 ,结果很清楚地表明,基于随机森林、SVM模型的分类方法相对于传统的方法

    1K21发布于 2020-09-23
  • 来自专栏简书专栏

    基于jieba、TfidfVectorizer、LogisticRegression的垃圾邮件分类

    generated/sklearn.feature_extraction.text.TfidfVectorizer.html LogisticRegression中文叫做逻辑回归模型___,是一种基础、常用的分类方法 0.打开jupyter 在桌面新建文件夹命名为基于TfidfVectorizer的垃圾分类,如下图所示: ? image.png 打开基于TfidfVectorizer的垃圾邮件分类文件夹,在按住Shift键的情况下,点击鼠标右键,出现如下图所示。 第4行代码调用pickle.dump方法将python中的对象保存到文件中。 最后在全部样本的f1-score指标为0.98,总体来说这个分类模型较优秀,能够投入实际应用。

    1.6K20发布于 2018-10-09
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-4 分类精度

    本小节主要介绍kNN算法的分类精度以及在sklearn中的实现。 分类精度 ? 评测模型的效果是通过计算测试集在模型中得到标签与真实的测试集标签相同的样本数量除以测试集总数,即分类的准确度(accuracy)来近似的。 下面我们使用sklearn封装好的手写数字数据集,自己简单代码得到分类的精确度: ? ? ? ? ? 因为计算分类精度的功能非常常用,因此我们将其加入playML包下,在playML包下新建一个名为"metrics"(度量)的Python文件,里面的内容如下: ? 在jupyter中调用即可: ? 在jupyter中直接计算分类精度: ? sklearn中的分类精度 ? ? 这里简单总结一下求解分类精度: ?

    93000发布于 2019-11-13
  • 来自专栏IT笔记

    log4j配置邮件发送

    log4j为java提供记录日志文件的包,提供了多种方式记录,包括终端(Console),文件(File),数据库(JDBC),邮件(SMTP)等等。 本来系统中日志记录以及警报是用的elk系统,但是这只是一个小项目,然后就用了log4j自带的邮件发送。 log4j-1.2.14.jar不支持SMTP认证,如果发送到邮件时,并且这个邮件服务商是需要认证的(也就是说需要账号和密码),需要自己封装这个功能,不过现在用的15次修订版,已经封装进这个功能,可以直接拿来用了 =false #发送邮件的门槛,仅当等于或高于ERROR(比如FATAL)时,邮件才被发送 log4j.appender.MAIL.Threshold=ERROR #缓存文件大小,日志达到10k时发送 EMAIL log4j.appender.MAIL.BufferSize=10 #发送邮件的邮箱帐号 log4j.appender.MAIL.From =345849402@qq.com #SMTP

    1.2K50发布于 2018-04-13
  • 来自专栏简书专栏

    基于tensorflow+CNN的垃圾邮件文本分类

    文本分类是NLP(自然语言处理)的经典任务。 893d622d1b5a 3.下载并解压数据集 数据集下载链接: https://pan.baidu.com/s/10QtokJ8_tkK6I3GifalxWg 提取码: uytb 压缩文件CNN垃圾邮件分类中有 数据集中共有2种分类:垃圾邮件用spam表示,正常邮件用ham表示。 垃圾邮件样本40000多条,正常邮件样本20000多条,样本总共60000多条。 4.完整代码 完整代码已经在数据集文件中给出,即cnn_package.ipynb文件; 从工程开发的角度考虑,本文作者封装了一个类TextClassification,对于样本数量在10万左右的分类任务较为适用 2.分类模型的评估指标F1score为0.994左右,总体来说这个分类模型很优秀,能够投入实际应用。

    2.1K30发布于 2018-10-18
  • 来自专栏科学Sciences

    数据的分类(Data Classification)常识(4)

    A.数据(Data)和信息(Information)常识 B.数据的分类(Data Classification)常识 一、宏观的数据分类 二、统计数据分类和数据标准 三、大数据业务领域中的数据类型 四、中国数据资源分类分级管理 四、中国数据资源分类分级管理 《数字内容资源分类规范》由中国音像与数字出版协会团体标准化技术委员会于2019年9月30日批准标准立项。 因此,在推动数据资源共享开放的同时,加强数据资源的安全性,实行数据资源分级、分类管理就变得非常重要,也非常必要。 数据资源分类、分级管理有什么好处呢?通过实行数据资源分级、分类管理,有助于从国家层面加强对政府部门数据的统筹管理,提升政府数据共享、开放标准化程度,从而更快地推进政府数据共享和公共数据开放工作。 2020年2月27日,工业和信息化部办公厅印发了《工业数据分类分级指南(试行)》。

    1.8K21发布于 2020-04-21
  • 来自专栏iOSDevLog

    4章:K 近邻分类

    source=collection_home---4------4--------------------- ? image.png 监督学习最后一个基本分类!K 近邻。 当计算机感染病毒时 简而言之, 对象通过其邻居的多数投票进行分类,对象被分配给其 k 个 最近邻居中最常见的类(k 是正 整数,通常是小 整数)。 如果孩子喜欢味道和颜色的组合,并且有 4 种(我在这里相当乐观:-))不同的颜色,那么他已经必须选择 4x4 种不同的类型; 此外,如果他想要考虑饼干的形状,有 5 种不同的形状,那么他将不得不尝试 4x4x5

    96660发布于 2019-05-08
  • 2026实战指南:怎么配置 OpenClaw 自动分类过滤垃圾邮件,并把重要邮件转成日历日程?

    每天早上打开邮箱,几十封未读邮件扑面而来——客户询价、会议邀请、系统通知混在一起。光是分类就得花半小时,转头发现日历里三个会议时间冲突,又得挨个发邮件重新协调。 本文将手把手教你如何部署 OpenClaw,实现自动清洗垃圾邮件并将重要邮件转为日历日程。 基础设施选型:为什么不用 AWS 而选轻量应用服务器? 我只是想部署个邮件管理工具,不是搭建生产级分布式系统。 核心配置建议如下: 实例规格:2核4G(足以应对日均 1000+ 封邮件处理) 系统盘:80GB SSD 带宽:6Mbps(拉取 Docker 镜像速度快) 价格:¥62/月起(套餐制,无额外流量账单焦虑 进阶配置:实现自动分类与日历转换 部署成功后,访问 http://<服务器公网IP>:8080 完成首次授权。接下来是 OpenClaw 的核心——规则配置。

    1.4K10编辑于 2026-03-06
  • 来自专栏机器学习与统计学

    数据挖掘实例:朴素贝叶斯分类器进行垃圾邮件过滤

    可以在任意的分类场景中使用朴素贝叶斯分类器,不一定非要是文本 文本分类 准备数据:从文本中构建词向量 将文本看成单词向量或词条向量,也就是说把句子转换为向量。 if word in vocabList: returnVec[vocabList.index(word)] += 1 return returnVec 示例:电子邮件垃圾过滤 the', 'best', 'book', 'on', 'python', 'or', 'm', 'l', 'i', 'have', 'ever', 'laid', 'eyes', 'upon'] 切分邮件 并转换为小写 return [tok.lower() for tok in listOfTokens if len(tok) > 2]def spamTest(): ''' 贝叶斯分类器对垃圾邮件进行自动化处理 这里出现的错误是将垃圾邮件误判为了正常邮件

    1.8K40发布于 2019-04-10
  • 来自专栏数据指象

    筑墙:基于朴素贝叶斯的垃圾邮件分类实践

    使用sklearn包下的朴素贝叶斯算法,它包含三种模型——高斯模型、多项式模型和伯努利模型, 本文将使用贝叶斯多项式模型类来解决英文邮件分类的问题。 、be等单词对分类没有影响,故可以将其禁用。 test.reset_index(drop=True, inplace=True) # 同上 print(train['label_num'].value_counts()) plt.figure(figsize=(6, 4) , thresholds = roc_curve(y_test, y_pred[:, 1]) auc = auc(fpr, tpr) # roc 曲线 plt.figure(figsize=(6, 4) , dpi=100) plt.plot(fpr, tpr) plt.title('roc = {:.4f}'.format(auc)) plt.xlabel('fpr') plt.ylabel('tpr

    64110编辑于 2024-11-23
领券