首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据科学和人工智能

    数据集 | 20NewsGroup新闻数据集

    本数据集包含20个不同主题的英文新闻,涵盖信息技术、自然科学、政治、宗教等多个领域。该数据集是用于文本分类、文本挖掘和信息检索研究的国际标准数据集之一。

    1.4K30编辑于 2022-03-30
  • 来自专栏拓端tecdat

    R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究|附代码数据

    raw_text ## # A tibble: 511,655 x 3 ##    newsgroup   id    text                                                               alt.atheism 49960 Keywords: FAQ, atheism, books, music, fiction, addres ## # … with 511,645 more rows 请注意该newsgroup newsgroup_cors ## # A tibble: 380 x 3 ##    item1                    item2                    correlation

    36820编辑于 2023-07-24
  • 来自专栏拓端tecdat

    R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究

    raw_text ## # A tibble: 511,655 x 3 ## newsgroup id text alt.atheism 49960 Keywords: FAQ, atheism, books, music, fiction, addres ## # … with 511,645 more rows 请注意该newsgroup newsgroup_cors ## # A tibble: 380 x 3 ## item1 item2 correlation

    24720编辑于 2023-08-31
  • 来自专栏阮一峰的网络日志

    如何使用mIRC下载电子书

    网上现在找英文电子书的方法,除了网页上直接下载以外,大概无非就三种吧:P2P/BT,mIRC,newsgroup。下面转载一篇别人写的如何使用mIRC找书。

    1.4K50发布于 2018-04-12
  • 来自专栏自然语言处理

    20 newsgroups数据介绍以及文本分类实例简介基本使用将文本转为TF-IDF向量使用贝叶斯进行分类参考

    0.8965262379896526 参考 数据集地址:http://www.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/news20.html sklearn关于20newsgroup

    3.6K20发布于 2018-08-02
  • 那些年我的NAS用过的常用套件?

    2、Download Station:这是一个下载管理器,支持多种协议,如HTTP、FTP、BitTorrent(BT)和Newsgroup Direct Access(NZB)等,使用户能够在NAS上直接下载文件

    73610编辑于 2024-06-05
  • 来自专栏简单就是美!

    How To Ask Questions The Smart Way

    .) ---- Before You Ask Before asking a technical question by email, or in a newsgroup, or on a website It is courteous to try and save the mailing list or newsgroup a flood of substantially identical postings If the problem attracted general interest in a mailing list or newsgroup, it's appropriate to post the If someone is really acting out, it is very likely that a senior person on the list or newsgroup or forum

    85530发布于 2019-02-28
  • 来自专栏zaking's

    RFC2616-HTTP1.1-Methods(方法规定部分—单词注释版)

          - Annotation(注释) of existing resources;       - Posting a message to a bulletin(公布,公告;) board, newsgroup same way that a file is subordinate to a directory containing it, a news article is subordinate to a newsgroup

    63850发布于 2018-07-04
  • 来自专栏Python爬虫与数据挖掘

    盘点一款强大的网络工具集------netwox

    server always answering same values 105:Sniff and send DNS answers 106:Send an email 107:Post a newsgroup message 108:List newsgroups available on a server 109:Download one, or more, newsgroup messages 110 network configuration easy to parse 170:TELNET server 171:DHCP client 172:List articles range of a newsgroup 173:Download overview of one, or more, newsgroup messages 174:FTP client : get a file and check its

    5K73发布于 2021-04-19
  • 来自专栏NewBeeNLP

    SDNE:深度模型图网络

    综合损失 综合考虑全局和局部损失,有, 其中 为正则化项, 实验 论文的实验部分也非常详实,在ARXIV GR-QC,20-NEWSGROUP,BlogCatalog,Flickr,YouTube

    1.1K10发布于 2021-03-03
  • 来自专栏福大大架构师每日一题

    2025年11月TIOBE编程语言排行榜,Go语言排名第11,Rust语言排名14。C# 会首次在历史上超越 Java 吗?

    重要观察: • 2001 年之前的数据并不是基于网页搜索引擎的统计,而是基于 **Usenet 新闻组(newsgroup)**的统计,并且是通过回溯计算得到的。

    31510编辑于 2025-12-19
  • 来自专栏全栈程序员必看

    RFC2616-HTTP1.1-Methods(方法规定部分—单词注释版)

    – Annotation(注释) of existing resources; – Posting a message to a bulletin(公布,公告;) board, newsgroup same way that a file is subordinate to a directory containing it, a news article is subordinate to a newsgroup

    46730编辑于 2022-07-21
  • 来自专栏BestSDK

    看完Python 简史,你就知道他为啥这么火了

    尽管Internet为主体的信息革命尚未到来,但许多程序员以及资深计算机用户已经在频繁使用Internet进行交流 (包括email和newsgroup)。Internet让信息交流成本大大下降。 Python的社区不断扩大,进而拥有了自己的newsgroup,网站(python.org),以及基金 (Python Software Foundation)。

    1.4K100发布于 2018-03-01
  • 来自专栏数据STUDIO

    ​用 Python 和 Gensim 库进行文本主题识别

    在本中,将使用LDA 从 20Newsgroup 数据集 中提取主题的实战案例。 主题识别的基础知识 本节将涵盖主题识别和建模的原则。 数据集 本次案例使用可以 从 sklearn 下载的 20Newsgroup 数据集。

    2.7K21编辑于 2022-05-24
  • 来自专栏AI科技大本营的专栏

    神爱程序员,于是带来Python

    开发者们还为社区建立了 newsgroup,网站(python.org),以及相关基金 (Python Software Foundation)。

    60230发布于 2019-03-15
  • 来自专栏方亮

    一种精确从文本中提取URL的思路及实现

    gopher (用来指定互联网资源,已经很少用了) gopher://<host>:<port>/<gopher-path>     nntp(网络新闻传输协议) nntp://<host>:<port>/<newsgroup-name Servic) prospero://<host>:<port>/<hsoname>;<field>=<value> 形式多样的协议的URL Scheme的BNF范式     news news:<newsgroup-name

    5.8K20发布于 2019-01-16
  • 来自专栏源码之家

    EXCEL密码去除(工作表、工作薄密码保护破解)

    REPBACK As String = DBLSPACE & "Please report failure " & _ "to the microsoft.public.excel.programming newsgroup

    2.3K110发布于 2018-06-04
  • 来自专栏积木居

    EXCEL密码去除(工作表、工作薄密码保护破解)

    REPBACK As String = DBLSPACE & "Please report failure " & _ "to the microsoft.public.excel.programming newsgroup

    15K40发布于 2019-02-27
  • 来自专栏玄魂工作室

    CTF实战10 CSRF跨站请求伪造漏洞

    这里题目的大概意思是这样的: 你的目标是向newsgroup发送一个email,其中email中包含URL指向恶意请求的图像 尝试包含网址的1x1像素图片 然后将该URL应该指向CSRF课程页面,并带有一个额外的参数

    3.3K50发布于 2018-07-25
  • 来自专栏智能大数据分析

    【大数据分析与挖掘技术】Mahout分类算法

    List<File> files = new ArrayList<File>(); for(File newsgroup: base.listFiles()){ newsGroups.intern (newsgroup.getnName()); files.addAll(Arrays.addList(newsgroup.listFiles())); } Collections.shuffle

    36110编辑于 2025-01-22
领券