首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏小巫技术博客

    2026.3.7 今日5大AI前沿新闻

    14010编辑于 2026-03-30
  • 来自专栏小巫技术博客

    2026.3.9 今日5大AI前沿新闻

    8310编辑于 2026-03-30
  • 来自专栏大数据文摘

    数据新闻:全球新闻界的新宠

    8个新闻作品从300多个参赛作品中脱颖而出,获得了最终的“数据新闻奖”。 这是全球第一个专门为数据新闻设立的奖项,从2012年开始颁发。 在全球新闻界,“数据新闻”(也称“数据驱动新闻”)已经不再停留于一个新名词,它代表着新闻业正在进行的一系列如火如荼的实践。 《数据新闻手册》。    众多媒体专家看好数据新闻的前景。“精确新闻学”的奠基人、美国北卡罗来纳大学教堂山分校荣休教授菲利普·迈耶如此强调推行数据新闻的时代意义:“现在是个信息过剩的时代,对信息进行处理很重要。 给新闻业注入创新活力   无论老牌主流媒体还是新兴网络媒体,都不约而同地投入资金和人力开发数据新闻业务——究其原因,是数据新闻为它们注入了创新的活力。   

    2.9K120发布于 2018-05-18
  • 来自专栏小巫技术博客

    2026.3.8 今日5大AI前沿新闻

    9510编辑于 2026-03-30
  • 来自专栏PPV课数据科学社区

    新闻】魔兽大数据

    作者按:随着《魔兽》成功首映,身边一众魔兽粉丝群情激动,甚至发出了”今晚我们都是魔兽人“的声音,好吧,作为一个魔兽的老玩家,让我们用数据重温一下这部已经过了巅峰期的经典游戏。 下面,我们一起通过大数据来探寻这款游戏不为人知的一面。 全球有超过1亿名的《魔兽世界》玩家 ? (数据来源:17173新闻中心) 他们来自全球244个国家和地区 ? (数据来源:17173新闻中心) 联盟总人数略微高出部落一些,同时还有1%的和平爱好者 ? (数据来源:17173新闻中心) 《魔兽世界》角色数量超过了美国总人口 ? (数据来源:17173新闻中心) 《魔兽世界》音乐长达3900分钟,需要44张CD才装的下 ? (来源:17173新闻中心) 游戏内总数字超过600万,相当于12本《魔戒三部曲》 ? (来源:17173新闻中心) 中国的魔兽角色超过1.4亿,相当于7个上海市常驻人口的数量 ? (来源:魔兽世界中文网站) 人口最多的种族是人类,超过了20% ?

    85450发布于 2018-04-25
  • 来自专栏C++ 动态新闻推送

    C++ 动态新闻推送 第5

    C++ 动态新闻推送 第5期 从reddit/hackernews/lobsters/meetingcpp摘抄一些c++动态。

    1.2K30发布于 2021-08-31
  • 来自专栏ApacheHudi

    2025 年 5 月 Apache Hudi 社区新闻

    社交媒体:使用Hudi的实时数据湖仓[2] Naga分享了Apache Hudi在2025年成为现代数据湖仓堆栈必备组件的简要分析。 社区活动 即将到来:Apache Hudi 在"数据流峰会" Hudi开源团队将在即将到来的数据流峰会(5月28-29日)上发表关于"在Lakehouse中使用Apache Flink & Hudi的非阻塞并发控制 在此注册[5]! 过去:OpenXData的Hudi演讲 OpenXData - 今年关于开放数据架构的首要教育活动,由Onehouse、Confluent、Databricks和DBT Labs于5月21日主办。 member_desktop&rcm=ACoAAAe2ProBHdAyUIZhBrUpAkbJdP0HvCi1uAU [4]Apache Amoro(孵化中):https://amoro.apache.org/ [5]

    40600编辑于 2025-06-09
  • 来自专栏SpringBoot+MyBatis前端

    JavaBean——实现新闻数据维护

    这个属性可以是任意合法的Java数据类型,包括自定义Java类         2.2:一个JavaBean对象的属性可以是读写,或只读,或只写。 //新闻数据维护以修改为例(其他功能差不多) 以下代码呢? 大概就是写一个DBHelper来连接数据库(Oracle),还有一个Daol类来写方法(下面的代码就是方法来帮助修改的) public int updaNewst(int nid,News newst) newst.getNtitle()); ps.setString(3, newst.getNzz()); ps.setString(4, newst.getNcontent()); ps.setString(5, <% request.setCharacterEncoding("utf-8");//防止乱码 //新闻主题编号 int nid=Integer.valueOf(request.getParameter

    43220编辑于 2022-11-18
  • 来自专栏数据科学和人工智能

    数据集 | 中文新闻分词

    下载数据集请登录爱数科(www.idatascience.cn) 包含一些中文新闻文本,可用于训练中文自动分词。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源

    61220编辑于 2022-03-30
  • APP 中的新闻列表 5 种布局方式

    APP 中的新闻列表 5 种布局方式 经常看到一些新闻类或有新闻板块的APP,内容布局各不相同,呈现出的效果与用户实际体验也都不一样,下面总结为5种不同的新闻布局,并列出行业里使用不同布局的相应APP界面 案例解析 第一种大图布局,如果希望重点突出的新闻,希望引起用户的注意,可以使用大图布局方式。 第二种多图布局,如果是娱乐新闻、社会新闻等以图片为主的内容可以使用多图布局方式,通过图片可以引起用户注意,并可以通过图片了解新闻的大致内容。 第三种左图右文,如果是以文字信息为主的新闻如科技新闻、财经新闻等,同时希望用户关注图片信息的时候,可采用左图右文的布局方式。 总结 一共解析了五种新闻的布局方式,这些布局方式不仅仅运用于新闻列表,在以列表形式呈现的界面都能看到。

    86810编辑于 2024-03-12
  • 来自专栏马拉松程序员的专栏

    数据分类:新闻信息自动分类

    1.下载并统计新闻数量 数据下载完成后,解压后的文件名news_sohusite_xml.smarty.dat(迷你版),文件编码是用的GBK。 这些类别的数量足够多,其次特点都相对的明显一些,虽然'roll'的分类高达658640条,但是从字面意思上看这是滚动新闻,可能是当时采集数据的那一个月的头条新闻,头条新闻类别并不明显,并不利于做分类训练 2.获取训练测试集 前面我们选定了8个类别的新闻,现在的需要把原始文件的内容拆分出来一部分,作为数据集,考虑到每个类别数据差距比较大,选择一个平衡的数量,每个类别取3000条数据5.制作通用分类器 到现在为止,文本分类的前期已经准备完成了,下面就是训练模型并且制作分类器。 这还是仅仅在不到2万条的数据量而且并没有设置各项参数下进行的。 那么现在的模型对于预测其他时间段的新闻是否可以呢,这里从网上找了21年时间的几条新闻验证一下。

    97020编辑于 2023-09-21
  • 来自专栏数据科学实战

    AkShare-新闻数据-财经资讯

    作者寄语 新增新闻数据-财经资讯接口;最新资讯:主要返回最近几个小时的国内国际新闻。最新数据:主要返回最新发布的国际国内财经数据。 更新接口 "js_news" # 实时财经资讯 实时财经-资讯 接口: js_news 目标地址: https://www.jin10.com/ 描述: 获取实时财经新闻资讯数据 限量: 当日最近 4 小时内的新闻资讯数据 输入参数 名称 类型 必选 描述 indicator str Y indicator='最新资讯'; choice of {'最新资讯', '最新数据'}, 其中 '最新数据' 返回当前发布的重要经济指标 输出参数 名称 类型 默认显示 描述 datetime datetime Y 消息发布时间 content str Y 新闻内容 接口示例 import akshare as ak js_news_df = ak.js_news(indicator='最新资讯') print(js_news_df) 数据示例 datetime

    1.5K10发布于 2020-12-08
  • 来自专栏sktj

    python解析排名最靠前的5新闻

    =rss') f = StringIO(g.read()) g.close() tree = ElementTree.parse(f) f.close() def topnews(count=5)

    32330编辑于 2022-05-14
  • 来自专栏数据科学和人工智能

    数据集 | 20NewsGroup新闻数据

    下载数据集请登录爱数科(www.idatascience.cn) 本数据集包含20个不同主题的英文新闻,涵盖信息技术、自然科学、政治、宗教等多个领域。 该数据集是用于文本分类、文本挖掘和信息检索研究的国际标准数据集之一。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 http://qwone.com/~jason/20Newsgroups/

    1.4K30编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据集 | 金融新闻标题数据

    下载数据集请登录爱数科(www.idatascience.cn) 该数据集包含从路透社抓取的金融版面头版新闻数据包括标题、发布日期和文章的预览文本。 每天的头条新闻反映了过去一年到两年间的美国经济和股市的大体情况。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    77010编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据集 | 金融新闻情感分析数据

    下载数据集请登录爱数科(www.idatascience.cn) 数据集从零售投资者的角度包含了金融新闻头条的观点。数据集包含两列,情感标签和新闻标题,情感标签包含消极的,中立的或积极的。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用 Malo P, Sinha A, Korhonen P, et al.

    2.7K20编辑于 2022-03-30
  • 来自专栏大数据采集

    干货 | 日采100W新闻数据,如何实现新闻自动分类?

    新闻行业发展之初,分类是由人工处理的,但伴随着互联网和计算机行业的发展,人工处理局限性开始显露: 数据量激增:新闻数据来源众多,可能一分钟就有成千上万条新的数据产生; 人工成本高:数据量激增的情况下,需要付出更多的人力成本 ,今天我们来讨论一下如何利用计算机技术来实现新闻数据的自动分类: ✔ 新闻数据的分类经历过哪些发展阶段? ✔ 如何利用计算机完成对大量文本的分类归档? ✔ 新闻自动分类是怎么做到的,有哪些流程? 在获取到新闻数据后,对新闻进行分类还需要经过以下流程: ①数据清洗:过滤和筛除一些与新闻无关的符号或特殊字段,去除重复内容,提升文本质量,减轻系统负荷; ②特征筛选:根据业务需求,针对性地对关键词、新闻标题 最后插入一个小广告: 八爪鱼新闻数据中台历经 8 年沉淀,已汇集海量境内外新闻网站及自媒体平台数据,产品采集范围覆盖全球 55 个国家和地区,31 个语种,日增数据近 4000 万条。 1. 国内各类数据应用范围广 1) 新闻数据:已覆盖包括但不限于人民网、新华网等央媒党媒、 地方政府机构网站以及今日头条、网易等新闻聚合平台累计,超 2000 个平台,每日增量数据超 15 万条(经清洗入库后二次筛选的精准数据

    1.9K30发布于 2021-08-17
  • 来自专栏阿牛的牙

    简单爬取新浪新闻数据

    KHTML, like Gecko) ' 'Chrome/76.0.3809.132 Safari/537.36' } # 新浪新闻首页 每日要闻、重点新闻 id="wrap" > class="part_01 clearfix" > class="p_middle" self.base_url = 'https:/

    62840编辑于 2022-09-07
  • 来自专栏大数据文摘

    数据新闻周报(314~320)

    据介绍,盘古数据的主营业务为互联网数据中心基础架构服务以及基于互联网数据中心的增值服务,包括云服务、大数据运营服务等。 把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。 同时,加快政府数据开放共享。 本次峰会分为Keynote、大数据基础架构、大数据行业应用和实时大数据技术4个技术专场,邀请了来自阿里巴巴、Ebay、IBM、Hortonworks、小米等企业的21位嘉宾。 百度大数据产业园上海推介会举行:3月14日,2016常州百度大数据产业园上海推介会在上海日航酒店举行。会议上,华院数据技术有限公司与常州百度大数据产业园就意向入驻园区与大数据产业合作完成现场签约。 新闻采编:闵黎、张冬阳、赖格、赵梦云、Yimi 播音:Joanna 剪辑:晨露、Fay

    59740发布于 2018-05-24
  • 来自专栏大数据文摘

    数据新闻周报(37~313)

    让我们来听听2016.3.7~2016.3.13本周大数据新闻: 行业趋势 人机世纪大战:谷歌人工智能机器人AlphaGo连胜韩国职业围棋九段、世界冠军李世石,开启机器纪元。 大会以“开放共享、转型创新”为主题,聚焦通信业大数据产业生态,邀请工信部、院士专家、三大运营商集团及省市大数据相关业务部门领导以及领先的大数据产业领军企业及应用单位代表出席,共同探讨通信业大数据发展带来的产业机遇和挑战 业界动态 2016大数据产业峰会将于4月举行:为落实《促进大数据发展行动纲要》,支撑大数据国家战略落地,促进大数据产业交流与合作、开展大数据政策宣贯,由工业和信息化部指导、中国信息通信研究院主办,数据中心联盟 泰国建成亚洲第一个超级数据中心:据悉,2017年第一季度,泰国将建成亚洲首个被数据中心基础设施评估机构Uptime研究所评为四级的数据中心——Supernap数据中心。 新闻采编:闵黎、张冬阳、赖格、赵梦云、Yimi 播音:Joanna 剪辑:瞳瞳、Fay

    77570发布于 2018-05-22
领券