Daily Study
更新: 6/17/2025 字数: 0 字 时长: 0 分钟
Daily Plan
#todo
- [ ]
大模型做攻击的思考
现在主流的利用大模型做攻击有两个方面,参考PentesetLLM调研
- 针对CTF
- 针对渗透测试
目前看的CTF的还是偏多,针对CTF,大模型能够有明确的目标,同时针对CTF LLM 也包含很多开源的Benchmark,针对Pentest的Benchmark很少,针对Pentest的Benchmark现在的想法包括以下几个内容:
- 利用Hack The Box 来构建靶机
- 构建详细的渗透测试结果评分标准
- 要明确让LM Agent执行能够检验结果的指令来评判(例如Root权限才能执行的执行)
然后针对这两种类型的难点也不同:
- CTF 整体的难度更高,涉及不同种类的任务,对LM Agent的模型能力和使用工具能力要求更高
- 渗透测试的整体难度没CTF高,但渗透测试的上下文很长,经常涉及到不同内容的关联(利用用一个目标信息来攻击另一个目标),因此对上下文的保存和分析要求更高
找到BurpSuite的官方靶场,可以当做Benchmark All Web Security Academy topics | Web Security Academy - PortSwigger