长亭x趋境：一张4090让安全大模型进入千亿时代

长亭科技 2024-09-12 22:06:55 浏览:263

2023年，以chatGPT为代表的大模型技术在上半年席卷全球，各大巨头间“百模大战”的竞争趋于白热化。毫无疑问，大模型已经成为新质生产力的代表。

2024年，大模型迈入商业化的下半场，长亭科技作为安全领域垂直大模型的先行者，明确大模型的价值锚点在于“向下扎根”，为客户带来实际应用的效率和效果。“向下扎根”一方面是深入垂直行业，灌入行业数据让大模型成为“专才”，长亭已凭借“攻防专家”的优势为问津（ChaitinAI）安全大模型注入了足够强的能力。

另一方面，对于大模型扎根落地，最关键、最实际的问题是优化性能。安全检测效果、用户响应效率和私有部署成本，“不可能三角”的矛盾必然难以破解。尽管最新推出的拥有千亿参数和十万上下文的大模型在效果上取得了显著进展，但它们高达数百万的入门门槛、昂贵的推理成本和漫长的响应延时仍然严重阻碍了这些模型的应用。

为了能让安全大模型真正发挥颠覆性的革命生产力的意义，长亭科技一直在积极寻求优化性能的各种解法。“大模型推理成本降10倍、速度快20倍”，这家同是清华系孵化、名为「趋境科技」的AI Infra公司给了长亭一个足够有吸引力的数据。这一数据也在趋境科技前不久发布的开源项目“KTransformers （https://github.com/kvcache-ai/ktransformers）”中被验证。趋境科技通过利用 MoE 模型和长文本注意力算子的稀疏特性，采用异构划分策略，能够大幅度提升超大模型和超长文本的推理性能。

经过调试适配，长亭科技和趋境科技共同推出新一代安全大模型解决方案，此次合作将问津（ChaitinAI）安全大模型参数规模提升至超过千亿，安全性能全方位大幅提升。

Q:从百亿到千亿，大模型参数规模升级，究竟能给网络安全带来什么改变？

以攻击识别准确率这个指标为例，在长亭科技30万+自有的多类型攻击样本测评的情况下，某国内头部大模型攻击识别率为48.3%，而通过长亭联合趋境科技发布的大模型解决方案可以把成绩提升到92.1%。在另一个基于真实攻击流量构建的私有数据集的测试中，方案也成功把成绩从65.5%提升到95.8%。

攻击识别准确率的跃升除了得益于性能优化，也是长亭科技首创的语义分析引擎和大模型融合革新的成果。问津（ChaitinAI）安全大模型对攻击载荷进行自然语言解释，和实际攻击意图的分析与联想，而语义分析引擎则为问津（ChaitinAI）提供语义特征，大幅提升攻击意图识别效率和准确度；从数据驱动模型迭代层面，利用问津（ChaitinAI）的解释能力和生成能力，实现大模型+生成式的语义分析评估模型训练迭代和效果优化，带来全新安全范式。

再拿对安全要求极高的金融企业举例，由于系统内各种交易行为活动量大，通常会有海量的日志数据，对应的攻击手段也非常多样。在某金融企业一次网络环境中出现异常行为时，获得趋境“最强辅助”的问津（ChaitinAI）安全大模型达到了秒级响应，且仅用3分钟就给出了精确的事件研判报告和处理对策，帮助安全团队成功阻断攻击，将MTTD（平均检测时间）和MTTR（平均响应时间）从原来的三十分钟到数小时，减少到10分钟以内。

像这样的提升，还有这么多：

事件研判处理建议采纳率提升；

安全报告的内容生成质量评分提升；

代码的问题发现和检测的准确率提升；

漏洞修复建议的采纳率提升；

对于违法、有害、暴力、色情等不良内容的识别能力更强。即对不良内容的识别准确率、召回率提升；

同一目标的渗透测试任务，大模型驱动的智能渗透测试的漏洞发现数量以及可真实利用数量提升；

基于不同场景选择合适工具/策略的准确率提升；

综合的输出健壮性和稳定性，不同场景下输出质量的波动率降低。

长亭科技和趋境科技的强强联合，让安全大模型跑得又快又好成为现实。未来，我们也期待问津（ChaitinAI）赋能更多行业用户，让AIGC在安全场景的投入产出比跨越量变、形成质变，真正解放、发展生产力。

SoHoBlink - 人工智能行业网站

关于SoHoBlink人工智能网

微信公众号