Daily Study

更新: 6/17/2025 字数: 0 字时长: 0 分钟

Daily Plan

#todo

写博客
[ ]

大模型做攻击的思考

现在主流的利用大模型做攻击有两个方面，参考PentesetLLM调研

针对CTF
针对渗透测试

目前看的CTF的还是偏多，针对CTF，大模型能够有明确的目标，同时针对CTF LLM 也包含很多开源的Benchmark，针对Pentest的Benchmark很少，针对Pentest的Benchmark现在的想法包括以下几个内容：

利用Hack The Box 来构建靶机
构建详细的渗透测试结果评分标准
要明确让LM Agent执行能够检验结果的指令来评判（例如Root权限才能执行的执行）

然后针对这两种类型的难点也不同：

CTF 整体的难度更高，涉及不同种类的任务，对LM Agent的模型能力和使用工具能力要求更高
渗透测试的整体难度没CTF高，但渗透测试的上下文很长，经常涉及到不同内容的关联（利用用一个目标信息来攻击另一个目标），因此对上下文的保存和分析要求更高

找到BurpSuite的官方靶场，可以当做Benchmark All Web Security Academy topics | Web Security Academy - PortSwigger

本站访客数人次本站总访问量次