本文是关于如何训练模型的，这是机器学习系统的核心。“源代码”通常是像TensorFlow这样的标准引擎。您需要的是恶意javascript和非恶意javascript的标记示例的大型语料库。收集、标记和构建基于该语料库的模型就是您正在描述的项目；可执行源代码只是一个次要的细节，您可能会使用TensorFlow，至少在入门时是这样，因为每个人都使用TensorFlow。(“使用TensorFlow构建ML系统”等同于说“使用C构建操作系统”。它的目的不是描述如何实际构建这个东西；构建这个东西是一项主要的任务。)

您链接的论文中的主要工件是“超过27个 000标签样本”。我不相信他们已经向公众发布了这个语料库(更不用说训练过的模型了)。本文描述了如何根据自己的样本构建自己的模型。

如果您对这类内容感兴趣，可以从TensorFlow教程开始。学习如何对花进行分类(因为这是每个人都从分类开始的)。然后学习如何对计算机语言进行分类(Java、Swift和Haskell)。有了这些经验，我相信这篇论文对你来说会更有意义。(它仍然很高级，但至少您会知道您的问题是什么。)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51011409

复制

相似问题

问基于机器学习的恶意网页检测
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于机器学习的恶意网页检测EN