我希望开发一个应用程序,将检测恶意网页。我在考虑一个浏览器扩展。因此,我开始寻找一些研究论文,并找到了以下一篇。
A Deep Learning Approach to detecting Malicious Javascript code - Wang et. al
虽然这看起来足够好了,但我找不到源代码的链接。如何获取研究论文的源代码?
有没有其他这样有前途的论文和源代码可以供我使用?
发布于 2018-06-25 03:05:36
本文是关于如何训练模型的,这是机器学习系统的核心。“源代码”通常是像TensorFlow这样的标准引擎。您需要的是恶意javascript和非恶意javascript的标记示例的大型语料库。收集、标记和构建基于该语料库的模型就是您正在描述的项目;可执行源代码只是一个次要的细节,您可能会使用TensorFlow,至少在入门时是这样,因为每个人都使用TensorFlow。(“使用TensorFlow构建ML系统”等同于说“使用C构建操作系统”。它的目的不是描述如何实际构建这个东西;构建这个东西是一项主要的任务。)
您链接的论文中的主要工件是“超过27个 000标签样本”。我不相信他们已经向公众发布了这个语料库(更不用说训练过的模型了)。本文描述了如何根据自己的样本构建自己的模型。
如果您对这类内容感兴趣,可以从TensorFlow教程开始。学习如何对花进行分类(因为这是每个人都从分类开始的)。然后学习如何对计算机语言进行分类(Java、Swift和Haskell)。有了这些经验,我相信这篇论文对你来说会更有意义。(它仍然很高级,但至少您会知道您的问题是什么。)
https://stackoverflow.com/questions/51011409
复制相似问题