记录黑客技术中优秀的内容,传播黑客文化,分享黑客技术精华

2000万恶意软件样本公开发布

2020-12-20 01:03
12月14日,网络安全公司Sophos和ReversingLabs联合发布生产级恶意软件研究数据库,可供构建有效防御,驱动业内安全检测与响应发展。
如名称所示,SoReL-20M(Sophos-ReversingLabs - 20 Million)是包含2000万Windows可移植可执行(.PE)文件元数据、标签和特征的数据集,其中包括1000万去除攻击载荷的恶意软件样本,旨在帮助设计机器学习方法以产出更好的恶意软件检测功能。
Sophos AI团队表示:“公开网络威胁信息,网络安全就更容易预测。防御者将能够预测攻击者打算做什么,从而做出更好的应对准备。”
在SoReL-20M数据上训练出的一套PyTorch和LightGBM机器学习模型也随同发布。
由于包含个人可识别信息、敏感网络基础设施数据和私有知识产权,而且还有向未知第三方提供恶意软件的风险,网络安全专用标准化标记数据集十分难以获取,不像自然语言处理和图形图像处理等其他领域那样可以广泛利用MNIST、ImageNet、CIFAR-10、IMDB Reviews、Sentiment140和WordNet等公开数据集。
图:恶意软件类型
尽管2018年发布了EMBER(Endgame Malware BEnchmark for Research)开源恶意软件分类器,但由于其样本规模较小(110万个样本),且数据集仅有单标签(良性/恶意),能用该分类器进行的实验很有限。
SoReL-20M旨在以2000万PE样本解决上述问题,这些样本中包括1000万卸载了攻击载荷的恶意软件样本(不可执行),以及从1000万良性样本中提取出来的特征和元数据。
此外,该方法利用基于深度学习的标记模型,可产生人类能理解的语义描述,具体描述所涉样本的重要属性。
SoReL-20M的发布遵循最近几个月推出的类似倡议,其中包括微软主导的一个联盟,该联盟在10月发布了对抗性机器学习威胁矩阵(Adversarial ML Threat Matrix),旨在帮助安全分析师检测、响应和修复针对机器学习系统的对抗性攻击。
ReversingLabs的研究人员称:“安全威胁情报共享的想法早已有之,但过去几年里恶意黑客所展现出的创新能力,让这种想法变得比以往任何时候都来得更加重要。机器学习和人工智能已成为威胁猎手和安全运营中心(SOC)团队超越特征码和启发式方法的关键,能够令他们更加主动地检测新型或针对性恶意软件。”
关键词:SoReL-20M;恶意软件样本

知识来源: https://mp.weixin.qq.com/s?__biz=MzkxNzA3MTgyNg==&mid=2247486443&idx=1&sn=65caf761745a5de345112dbcad960c02

阅读:177265 | 评论:0 | 标签:无

想收藏或者和大家分享这篇好文章→复制链接地址

“2000万恶意软件样本公开发布”共有0条留言

发表评论

姓名:

邮箱:

网址:

验证码:

黑帝公告 📢

永久免费持续更新精选优质黑客技术文章Hackdig,帮你成为掌握黑客技术的英雄

广而告之 💖

标签云 ☁