首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CDA数据分析师

    如何识别虚假数据

    要想从有效(因此也可能是)有用的数据中剔除虚假(因此也是)无效的数据,就需要问以下九个问题。如果对于任何一个问题的答案是“是的”,那么数这些据就是虚假的。 1. 这些数据的来源是否以此牟利? 任何缺少原始数据的研究结果都是虚假的。原始数据不公布一定是因为以下的某一个原因: * 原始数据实际上完全证明了别的事情。 * 原始数据会显示出该研究使用了奇怪的定义或者有偏见的问题。 3. 是否扭曲了正常的定义? 虽然人类的语言本质上市不精确的,但是如果一份调查问卷或者调查提纲中对于某个词的定义超出了其普遍接受的含义,那么和这个词相关的所有数据就都是虚假的。 但是,任何基于“自我选择”的调查结果都必然是虚假数据。例如,如果我在网站上贴出一个类似这样的问题,“我们的客户服务如何?”只有那些得到非常好或者非常糟糕的客户服务体验的人才会参与回答。 昨天,一家名为Millward Brown的公司发布了该公司的“全球100个最流行品牌”榜单

    1.9K90发布于 2018-02-08
  • 来自专栏csdn

    线程虚假唤醒

    线程虚假唤醒 标签:多线程 资源类 class MyResource { private int product; public synchronized void produce() 虚假唤醒分析(if) 原因:生产者 消费者 锁的是同一个对象 生产者连续获得锁 生产者相互唤醒 过程: 消费者1获得锁 消费者1消费 因product=0消费者1等待 消费者2获得锁 消费者2消费 因 product=-1)消费者2wait 消费者1获得锁(product=-1) 消费者1消费(product=-2) 唤醒消费者2 消费者1再次消费因(product=-2)消费者1wait … 解决虚假唤醒方案分析

    29210编辑于 2024-04-10
  • 来自专栏Script Boy (CN-SIMO)

    PYTHON3 中的虚假四舍五入:round()

    PYTHON3 中的虚假四舍五入:round() 创建时间: 2017/12/5 17:08 作者: CN_Simo 标签: python基础, round, 四舍五入 一、这不是一个BUG! python2 中对 round() 的定义为:在  10的负ndigits次方  的倍数  取离  number  最近的数字返回,如果存在两个倍数离number一样近,那么取远离0的 python3 还有在 python3 中 '/' 就是普通的除,整除是 '//' 我的博客即将搬运同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan

    65400发布于 2018-07-31
  • 来自专栏Script Boy (CN-SIMO)

    PYTHON3 中的虚假四舍五入:round()

    -- body, td { font-family: 微软雅黑; font-size: 10pt; --> PYTHON3 中的虚假四舍五入:round() 创建时间: 2017 python2 中对 round() 的定义为:在  10的负ndigits次方  的倍数  取离  number  最近的数字返回,如果存在两个倍数离number一样近,那么取远离0的 python3 还有在 python3 中 '/' 就是普通的除,整除是 '//'

    1.1K00发布于 2017-12-26
  • 来自专栏量化投资与机器学习

    2022 Q3:『卖方金工』研报热度​榜单

    量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 免责声明:以下所引述机构或个人的观点、言论、数据及其他信息仅作参考和资讯传播之目的,不代表公众号赞同其观点或证实其描述。 让我们一起期待,2022新财富最佳金融工程分析师谁将一举夺魁!

    65510编辑于 2022-10-08
  • 来自专栏从头开始学习测试开发

    Skills榜单

    Smithery.ai https://smithery.ai/skills 显示“激活次数”和“GitHub Stars”,社区驱动,含技能创建工具 15,000+ 3. Python, Java, Go, JS, TS 4.8k 28,500+ 2 skill-creator Anthropic 官方 引导用户创建新 Skill 的元技能 全平台通用 官方内置 N/A 3 断言 + Mock REST/GraphQL 2.1k 11,500+ 10 PPT Generator Max Microsoft Copilot Labs 文案 → 多页 PPT(16:9 + 3: https://github.com/ai-skills-hub/universal-code-reviewer.git ~/.cursor/skills/code-reviewer-pro 方法 3: 数据来源:SkillsMP.com、Smithery.ai、GitHub Trending、Antigravity 官方报告(截至 2026 年 1 月 20 日) 更新频率:本榜单每月更新,关注可获取最新版本

    12.3K51编辑于 2026-01-29
  • 来自专栏JavaEdge

    Java 线程的虚假唤醒

    存在被虚假唤醒的可能。 何为虚假唤醒? 虚假唤醒就是一些obj.wait()会在除了obj.notify()和obj.notifyAll()的其他情况被唤醒,而此时是不应该唤醒的。 #3. 将if替换为while,解决虚假唤醒的问题。

    49920发布于 2021-02-22
  • 来自专栏JavaEdge

    Java 线程的虚假唤醒

    存在被虚假唤醒的可能。 何为虚假唤醒? 虚假唤醒就是一些obj.wait()会在除了obj.notify()和obj.notifyAll()的其他情况被唤醒,而此时是不应该唤醒的。 #3. 将if替换为while,解决虚假唤醒的问题。

    1.2K21发布于 2020-05-26
  • 来自专栏安恒信息

    警惕虚假安全软件升级威胁

    恶意软件开发者采取的方法多种多样,其中之一就是伪装电子邮件来自某安全软件公司,要求终端用户安装一个重要的系统升级,其附件则为一个虚假的杀毒软件修复补丁。 通常在这种情况下,用户更易被迷惑,从而下载并安装这种虚假的修复补丁,而不考虑这个补丁的真实性。 3.在回复电子邮件时,不要提供任何个人信息。  4.安装功能全面的安全软件,确保电脑免遭钓鱼网站或社交网络的欺诈。  5.当点击电子邮件中或社交网络上的诱导性链接时,保持小心谨慎。

    86950发布于 2018-04-09
  • 来自专栏3D视觉从入门到精通

    3D版CenterNet: CenterPoint,小修小改也能刷爆榜单

    导言 最近3d目标检测领域出了一篇新作,思路简单,却在nuScenes榜单上高居第二。 正式讲解它之前,先附上文章和代码地址: 论文题目:Center-based 3D Object Detection and Tracking 在公众号「3D视觉工坊」后台,回复「CenterPoint」 Circular NMS与基于3D IoU的NMS具有一样的抑制效果,但速度更快。 3、基于上述的设计,检测器依然没有达到完美的旋转不变性和等变性。 其实当初看到CenterNet的时候,我相信很多做3D CVer都会自然的联想到将该方法移植到3D中。 the 3D detection task.

    2.4K20发布于 2020-12-11
  • 来自专栏贾志刚-OpenCV学堂

    刷爆榜单 | DeepSeek-AI发布3B OCR模型

    DeepSeek-AI 发布了 3B DeepSeek-OCR,这是一个端到端的 OCR 和文档解析视觉语言模型 (VLM) 系统,可将长文本压缩成一小组视觉标记,然后使用语言模型解码这些标记。 架构 DeepSeek-OCR-3B是典型的VLM模型、它有两个组件,一个名为 DeepEncoder 的视觉编码器和一个名为 DeepSeek3B-MoE-A570M 的 Mixed of Experts 解码器是一个 3B 参数的 MoE 模型(名为 DeepSeek3B-MoE-A570M),每个 token 的活动参数约为 570M。 3. 系统结构是将页面压缩为视觉令牌的 DeepEncoder 和具有约 570M 活动参数的 DeepSeek3B MoE 解码器,正如研究团队在技术报告中所描述的那样。

    12010编辑于 2026-04-02
  • 来自专栏悦思悦读

    自证法帮你识别虚假数据

    一向精通阴谋论,经常满面狡黠微笑“你懂得”的网友,居然一点不怀疑这些数据是虚假的! 我们就说上面图1吧。 打眼一看这样一张图表,WTF!在北上广深养个孩子要200多万! 至此,面对图1,这样一份连纯粹数据内部互相印证的合理性都不存在的数据,判断其为虚假数据,是确定无疑了。 ? ---- 《三亿》一文中引用的图表不止图1一幅。 这两份数据直接从本身看,并没有很明显直接违背一般常识的地方,也不好立刻就下结论说它们是虚假的。 但对于一篇文章的作者而言,如果已经引用了一份造假明显的数据,那么至少属于态度不严谨。

    83770发布于 2018-03-15
  • 来自专栏LoRexxar's Blog

    blockwell.ai 虚假转账 事件分析

    a=0xa3fe2b9c37e5865371e7d64482a3e1a347d03acd 可以看到通过调用这个合约,发起了一笔代币转账,在event logs里可以看到实际的交易 然后具体的交易地址为

    38120编辑于 2023-02-21
  • 来自专栏腾讯云开发者社区头条

    2022年3月腾讯云开发者社区视频月度榜单公布

    腾讯云开发者社区3月视频月度榜单公布拉! 部分地区由于疫情暂时不能发货,恢复物流后发出~ 请各位没有填收货地址的老师赶紧尽快联系小助理(微信:Tcloudedu3) 填写收货问卷并进入社区专有的视频群交流吧!!! 腾讯云开发者社区视频月度榜单的规则在腾讯云开发者社区招募技术视频创作者计划内有公示 以下是3月的月度榜单: 月度活跃创作者 UID 礼品 社区昵称 4199914 王者荣耀 自研-绝美拼图礼盒 动力节点 绝美拼图礼盒 嘉为蓝鲸 2553644 王者荣耀 自研-绝美拼图礼盒 程序员鱼皮 7413738 王者荣耀 自研-绝美拼图礼盒 艾编程 8826052 王者荣耀 自研-绝美拼图礼盒 用户8826052 月度榜单

    851101编辑于 2022-05-07
  • 王耀恒:GEO不是“刷榜游戏”,而是“信任基建”

    这些榜单往往缺乏真实的数据支撑、透明的评选流程或客观的评价标准,其唯一目的,就是利用当前大模型在知识整合时对“结构化榜单信息”的抓取偏好,进行算法层面的“信任欺诈”。 这与制造虚假榜单有着根本区别,体现在三个层面:1.逻辑出发点不同虚假榜单逻辑:研究“当前AI喜欢什么格式”,然后批量生产该格式的虚假内容,旨在“迎合与欺骗”。 2.构建的资产属性不同虚假榜单:生产的是“信息垃圾”,是算法净化对象。它不创造任何长期价值,反而消耗品牌声誉。信任基建:积累的是“数字信任资产”。 3.与算法进化的关系不同虚假榜单:与算法进化方向背道而驰。其生存依赖于算法的不完善,必然会被更强大的识别与过滤机制淘汰。信任基建:与算法进化方向同频共振。 那些选择用虚假榜单“污染”信源的人,或许能获得一时之利,但他们注定会成为算法进化过程中被清洗的“噪音”。

    20110编辑于 2025-12-12
  • 王耀恒:警惕我们正在滑向“AI温室效应”

    当AI开始郑重引用那些为欺骗它而生产的虚假信息时,比如虚假榜单、注水数据、虚假权威等,一场由数据污染引发的数字生态系统性危机已然降临,其影响将远超技术本身。 这种“榜单偏好”迅速催生了一个自我强化的污染循环:“AI算法偏好引荐榜单→GEO从业者批量生产虚假榜单→算法将此类榜单作为权威答案推荐→更多从业者效仿涌入→海量垃圾榜单充斥网络→算法进一步强化对榜单形式的依赖 行业观察显示,当前流行的投毒GEO(也称黑帽)手法主要有四种:1.榜单流水线作业:自动化工具批量生成各类“行业排名”,将付费客户置入前列,制造虚假的权威位置2.内容农场AI升级:使用生成工具制造海量内容空洞的文章 ,以数量策略淹没质量原则3.虚构权威体系:系统性地编造获奖经历、专家背书,构建完整的虚假信用闭环4.数据注水假象:虚构客户案例与市场数据,制造远离真实情况的繁荣幻象这些做法本质上都是生态污染行为——它们不创造任何真实价值 当企业发现自己在AI眼中的“权威形象”完全依赖于购买的虚假榜单,而非真实的产品与服务时,AI的“温室效应”的恶果已经显现。

    11110编辑于 2026-01-30
  • 来自专栏AllTests软件测试

    Faker - 高效生成虚假测试数据

    1、前言 在软件开发与测试等过程中,我们常常需要大量“虚假但合理”的数据——无论是为新系统初始化数据库、生成测试用例验证功能稳定性,还是对生产数据进行匿名化处理以保护隐私,这类数据都扮演着关键角色。 Faker以其简洁的接口、丰富的功能和强大的扩展性,成为生成虚假数据的首选工具。 2、简介 Faker是一个Python包,可为你生成虚假数据。 使用pip安装: pip install Faker 3、快速上手 1、基本用法: 使用faker.Faker()创建生成器,调用属性(如name()、address()、text())生成对应类型的虚假数据 faker import Faker fake = Faker(['it_IT', 'zh_CN', 'en_US']) for _ in range(10): print(fake.name()) 3、 命令行用法: 安装后可直接调用faker命令,支持参数: -l:指定本地化(如-l de_DE生成德语数据) -r:生成重复次数(如-r=3生成3条数据) -s:设置分隔符(如-s=";"用分号分隔结果

    49410编辑于 2025-09-02
  • 来自专栏算法一只狗

    AI幻觉下,如何识别虚假信息

    那我们如何辨别是否为虚假信息呢?可以从以下几个维度入手: 看信息来源:是否来自权威渠道,如新华社、央视、政府官网、主流媒体等更具可信度。 看内容逻辑:是否存在夸张不实的表述,如“一个动作治百病”、“吃这个立刻瘦十斤”,大概率是虚假信息。 虚假信息往往迎合人们的“认知偏见”,传播速度远胜于真相。只有学会冷静分析、主动查证,才能避免被虚假内容误导。

    80910编辑于 2025-04-02
  • 来自专栏CTF Crypto

    BUUCTF 虚假的压缩包 1

    密文: 下载附件解压,得到两个压缩包:虚假的压缩包.zip和真实的压缩包.zip 解题思路: 1、先处理虚假的压缩包.zip,因为真实的压缩包.zip需要密码。 虚假的压缩包.zip使用了伪加密,搜索50 4B 01 02,将文件头的第9位和第10位改为0。 gmpy2.gcd(a,b) #欧几里得算法,最大公约数 gmpy2.gcdext(a,b) #扩展欧几里得算法 gmpy2.iroot(x,n) #x开n次根 """ p = gmpy2.mpz(3) q = gmpy2.mpz(11) e = gmpy2.mpz(3) l = (p-1) * (q-1) d = gmpy2.invert(e,l) c = gmpy2.mpz(26) n = p * 3、解压真实的压缩包.zip,得到一张没卵用且会浪费你时间的图片.jpg和亦真亦假。 解压密码:答案是5 使用TweakPNG打开jpg图片,发现提示jpg图片CRC不对,应该是被修改宽高啦。

    63231编辑于 2025-11-30
  • 来自专栏山行AI

    实战之java中线程的虚假唤醒

    3. 等待直到条件变成true或者超时时 不正确的代码示范: synchronized (this) { if (! 错误的代码示范: synchronized (this) { // Give some time for the foos to bar wait(1000);} 虚假唤醒不会等待完整的1000 ms Thread.sleep(),不会被虚假唤醒,所以你应该使用Thread.sleep()来代替。 Thread.sleep(1000); 5. wait(1000); } catch (InterruptedException e) { } } } } public void test3( testNotObjectWait() { wait(new Object()); }} 上面的内容译自:http://errorprone.info/bugpattern/WaitNotInLoop 3.

    1.6K50发布于 2019-06-28
领券