向AI转型的程序员都关注了这个号 机器学习AI算法工程 公众号:datayx 所有论文 包括已经录制完成和之后将要介绍的论文。 总论文数 67,录制完成数 32 全部 代码 ,预训练模型 获取方式: 关注微信公众号 datayx 然后回复 论文 即可获取。
前言 本文主要推荐一些生成对抗网络(GAN,generative adversarial networks)相关的值得精读的论文,主要涉及GAN的优化,图像翻译,视频预测三个领域,可以作为GAN 在损失函数的优化论文方面,效果比较突出且使用较多的主要有三篇论文,分别是:lsgan, wgan-gp, 谱归一化GAN: Improved training of Wasserstein GANs : image synthesis and semantic manipulation with conditional GANs:https://arxiv.org/abs/1711.11585 这篇论文在 论文的推荐顺序既可以用来快速查找,也可以用来作为进阶的阅读顺序,人力有时穷,还有更多未提到的较好工作,欢迎补充。 ,就可以查找希望看到的论文。
大家好,又见面了,我是你们的朋友全栈君 图像拼接系列相关论文精读 Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Warps for Image Stitching Seam-Driven Image Stitching Parallax-tolerant Image Stitching 文章目录 图像拼接系列相关论文精读
论文地址:https://arxiv.org/abs/2210.15235本篇文章是阅读这篇论文的精读笔记。一、原文摘要从给定文本中生成一致且高质量的图像对于视觉语言理解至关重要。 htht再经过两组MLP分别学习由局部语义调节的尺度和偏差,变为ht+1′ht+1′(论文图中错误标注成了t-1)首先扩展到正确的形状,然后缩放并偏置。条件特征被平均并传递给后续处理器。
跟着我一起读这篇论文,希望论文的思路能够对你有所启发,如果觉得有用的,帮我分享出去,谢啦! RetinaFace的主要贡献 ? 训练细节:我们早四个 NVIDIA Tesla P40 (24GB) GPUs上使用 SGD 优化器 (momentum为0.9, 权重衰减为0.0005, batch size为8*4 )训练 RetinaFace END 参考文献: https://blog.csdn.net/weixin_40671425/article/details/97804981 论文地址:https://arxiv.org/pdf/1905.00641
论文标题:Underwater Waste Detection Using Deep Learning: A Performance Comparison of YOLOv7–10 and Faster R-CNN论文链接:https://arxiv.org/pdf/2507.18967一、研究方法数据本研究分析所用的数据来自一个在线数据仓库。 因此,如图6所示,获得了YOLOv8的混淆矩阵,它表明YOLOv8模型表现良好。还获得了YOLOv8模型的指标曲线,如图7所示。 这些曲线表明YOLOv8模型进展良好,损失值下降,召回率和mAP指标有所提升。此外,还获得了YOLOv8模型的预测结果,其中部分预测样本如图8、9、10和11所示。 根据图8、9、10和11中显示的模型预测结果,YOLOv8模型能够精确检测各种物品。因此,显然YOLOv8具备高效检测垃圾材料的能力。尽管取得了令人鼓舞的结果,本研究仍存在若干局限性。
本文为论文Rotated Binary Neural Network的精读总结,该论文发布于NeurIPS 2020,提出了RBNN,通过旋转来缩小二值化后的误差,效果较好。 文中部分表述为原文翻译,所有图片除非特别注明,都来自原论文。本文在多平台同步,进入主站获得更好体验。 并且,论文中指出,角度偏差 \theta 很大的情况出现的概率很大。 1.4 解决方案 论文中提出了 Rotated Binary Neural Network (RBNN) 来减少由角度偏差带来的量化误差。 此外,为了摆脱优化过程中陷入局部最优解的可能性,论文中在训练时,还会动态调整旋转矩阵的参数。
篇会议论文, 1 篇期刊论文; 另有 3 篇文章分别发表在人工智能领域的会议 IJCAI、数据挖掘领域的期刊 IPM 和交叉领域的会议 FCS 上. 论文首次从技术分类角度系统梳理这些防御手段,对比国内外研究差异,为后续研究指明方向。 在测试的 500 个合约中,ReGuard 的检出率达 92%,误报率仅 8%,好比 “监控摄像头”,重点盯着 “外部调用后未锁定状态” 这类危险行为。 图 8 进一步验证了漏洞类型研究的差异:国内对区块链特有漏洞的研究深度更高,而国外在传统漏洞检测上更全面,这种差异与国内外区块链应用场景的侧重有关 —— 国内 DeFi 应用更活跃,对实际攻击中高频出现的漏洞关注度更高 论文揭示的方法论范式对跨领域技术实践具有普适参考价值。下期将聚焦其他前沿成果,深入剖析其的突破路径。
笔者链接:扑克中的黑桃A 专栏链接:论文精读 本文关键词:开源软件; 漏洞感知; 软件安 引 诸位技术同仁: 本系列将系统精读的方式,深入剖析计算机科学顶级期刊/会议论文,聚焦前沿突破的核心机理与工程实现 从图 2 可以看出,漏洞感知领域的研究论文数量逐年递增,尤其是 2018 年后增速明显,说明该领域受到越来越多关注。而基于社区讨论和补丁的研究起步较晚(如图 3 所示),仍是待探索的蓝海。 论文整理了近年来的主流工具和数据集,为研究者提供 “弹药”。 1. 论文揭示的方法论范式对跨领域技术实践具有普适参考价值。下期将聚焦其他前沿成果,深入剖析其的突破路径。
这使其成为最普遍的应用,远超软件系统现代化(16 种方法)、程序迁移(11 种方法)和程序转译(将程序从一种语言翻译成另一种语言)(8 种方法)等更复杂的任务。 如下图所示,具体到收集的 64 种方法里,工具使用分两种情况:42 种方法自己开发了工具来实现研究思路,8 种方法直接用了现有的 MDRE 工具(主要是 MoDisco)。 从工具使用频率来看,EMF 用得最多,有 16 种方法在用;其次是 ATL,12 种方法使用;QVT 有 8 种方法在用;ANTLR 和 Xtext/Xtend 各有 5 种方法使用。 总结这篇综述通过对 83 篇学术论文的系统性回顾,让我们得以一窥软件逆向工程领域的真实面貌。
笔者链接:扑克中的黑桃A 专栏链接:论文精读 引 诸位技术同仁: 本系列将系统精读的方式,深入剖析计算机科学顶级期刊/会议论文,聚焦前沿突破的核心机理与工程实现。 1) 并行能力 一次处理一个状态 一次处理多个状态的叠加 当有 n 个量子比特时,它们的状态是2ⁿ个基本状态的叠加(比如 3 个量子比特就是 | 000 > 到 | 111 > 的叠加,能同时表示 8 图 4 的实验数据很扎心:即使是简单电路(8 比特以内,48 门以内),在不同机器上的正确率也从 0 到 100% 波动,很多时候还不如 “掷硬币” 靠谱。 运行时系统小结:从 “编译时优化” 到 “执行时补救” 运行时系统的优势是 “能利用执行时信息”(如实时错误率),但受限于 NISQ 硬件的短相干时间,目前只能在 “执行前” 和 “执行后” 工作(图 8b 第八章:可以延伸的邻域 此章节是我自己思考的想法,与论文无关。
论文标题:A Survey on Point-of-Interest Recommendation: Models, Architectures, and Security 作者:Qianru Zhang Wang(汪海昕), Xingwei He(贺星伟), Siu-Ming Yiu(姚兆明), Hongzhi Yin(阴红志) 机构:香港大学(HKU),加州大学洛杉矶分校(UCLA),昆士兰大学 论文链接 另一方面,针对 POI 推荐中安全问题的研究仍然代表性不足,约占现有研究的 8%。鉴于保护用户隐私、防御对抗性攻击以及确保基于位置的服务中的数据完整性日益重要,这突出了文献中的一个重大差距。
引言 本周精读的文章是 V8 引擎 Lazy Parsing,看看 V8 引擎为了优化性能,做了怎样的尝试吧! 这篇文章介绍的优化技术叫 preparser,是通过跳过不必要函数编译的方式优化性能。 概述 & 精读 解析 Js 发生在网页运行的关键路径上,因此加速对 JS 的解析,就可以加速网页运行效率。 然而并不是所有 Js 都需要在初始化时就被执行,因此也不需要在初始化时就解析所有的 Js! 这些代码看似在函数中应该惰性编译,但其实这些模块化代码从一开始就要被编译,否则反而会影响性能,因此 V8 有两种机制识别这些可能被立即调用的函数: 如果函数是带括号的,比如 (function(){.. 从 V8 v5.7 / Chrome 57 开始,还会识别 uglifyJS 的 ! 也有一些代码辅助转换工具帮助 V8 正确识别,比如 optimize-js,会将代码做如下转换。 转换前: !
论文PDF全文下载,公众号回复:20180425 作者简介 ? 本科研究助理 作者个人网址:https://www.cs.cmu.edu/~mshediva/ Github地址:https://github.com/alshedivat 特别说明 本论文是深度学习顶会 “无冕之王”之称的ICLR 2018三篇最佳论文之一。 本论文重点关注于元学习方向,提出了一种基于梯度的简单元学习算法,适用于动态变化和对抗性的场景,并获得显著高效的适应性智能体。 在本论文中,我们将持续适应问题交给了“learning-to-learn”的框架。我们开发了一种简单的基于梯度学习的元学习算法,适用于动态变化和对抗场景下的适应。
这篇论文试图解决以下问题 高效地表示区域内部特征:现有的研究在学习地理空间表示时通常使用卫星图像,但由于卫星图像与自然图像之间存在差异,现有方法的视觉编码器在卫星图像上的表现不佳。 因此,论文提出了一种基于语义分割的新的方法,旨在有效地捕捉区域内部特征。 全面建模复杂的高阶区域关系:在地理空间中,区域之间的关系不仅限于二元邻接关系,还包括三元和更高阶的依赖关系。 为了解决这个问题,论文提出了一种新的地理空间异质图结构,名为GeoHG,它能够有效地捕捉和建模高阶区域关系。 全面超越现有方法的性能:论文通过在多个数据集上进行实验证明,GeoHG相比现有方法在各种下游任务中具有更优越的性能。即使在数据稀缺的情况下,GeoHG仍能取得竞争性的表现。 实验 实验设置 在论文中,研究者们进行了广泛的实验,涵盖了多个数据集和多个任务。他们选择了北京、上海、广州等城市作为实验地点,并使用了各种下游任务,如人口预测、GDP预测、夜间光照预测等。
论文地址:# CodeWMBench: An Automated Benchmark for Code Watermarking Evaluation在 GitHub Copilot、ChatGPT 和 读前先问读论文之前首先要问几个问题:这篇论文大方向的目标是什么? 这篇论文要解决什么问题?论文主要解决代码水印评估标准不够全面和自动化的缺陷。 因此,论文旨在构建一个多维度的自动化评估框架,来全方位衡量代码水印的无害性(Harmlessness)、透明度(Transparency)和鲁棒性(Robustness)。为什么会有这些问题? 论文精读核心发现一:告别“盲盒检测”,主动水印成为版权防线的唯一选择长期以来,检测 AI 生成内容主要依赖于 ZeroGPT 等“被动检测”工具。但在代码领域,这类工具的表现只能用“灾难”来形容。
作者提取定位流的中层特征图,并通过线性变换 (论文中是通过一个 1 \times 1 的卷积核实现) 和Softmax激活函数计算注意力值,最后将注意力值作用于分类特征上,具体公式为:F'_c = \text class MPFF(nn.Module): def __init__(self, size=8): super(MPFF, self). 未提及人脸提取的方法,resize为(299\times 299 ),采用了数据增强 超参数:我们采用用预训练权值初始化的backbone Xception,并使用betas为0.9和0.999,epsilon为1e-8的
论文地址: https://arxiv.org/pdf/1710.10916v3.pdf代码地址: https://github.com/hanzhanggit/StackGAN-v2本博客是精读这篇论文的报告 这篇文章介绍了StackGAN-v1,其在上篇博客Text to image论文精读:StackGAN中已经进行讲解,本篇博客只对StackGAN-v2的内容进行总结。 相关阅读Text to image(T2I)论文整理 阅读路线和阅读指南我正在参与2024腾讯技术创作特训营最新征文,快来和我瓜分大奖!
图像拼接系列相关论文精读 Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Shape Manipulation Warps for Image Stitching Seam-Driven Image Stitching Parallax-tolerant Image Stitching 文章目录 图像拼接系列相关论文精读
论文地址: https://arxiv.org/pdf/1711.10485.pdf代码地址: https://github.com/taoxugit/AttnGAN本博客是精读这篇论文的报告,包含一些个人理解 没看StackGAN++可以点击->:Text to image论文精读 StackGAN++而损失函数的第二项LDAMSM是由DAMSM计算的字符级细粒度图像-文本匹配损失,这部分在本博文的第七节中介绍