一、《我们如何安全地应对 DeepSeek》解读
总述
该报告探讨了与 DeepSeek 相关的安全风险,并给出相关的使用建议。
核心观点
- Gartner 认为 DeepSeek 是一家不以短期盈利为优先的公司。它从研究的角度支持工程师,并且不会面临实现财务或业务收益的重大压力。因此,DeepSeek 可能缺乏动力为其应用程序全面实施企业级安全控制。
- Gartner 认为 DeepSeek 已向国家网信办 (CAC) 完成了中国人工智能监管备案,可能存在信息泄漏风险,公司可能会使用数据进行模型训练。
核心内容
对于部署模式的选择
DeepSeek 部署存在 3 种不同的方式:
- 直接访问 DeepSeek 应用程序和平台。
- 来自 CSP 的模型即服务。
- DeepSeek 模型的私有部署。
Gartner 对这三种部署的建议分别是:
- 由于目前 DeepSeek 应用程序和开发者平台的安全控制对外界并不透明,因此 Gartner 不建议将其直接用于商业目的。
- 对于无法承担私人托管费用或没有成熟的安全能力来保护 LLM 的组织来说,这是首选方案。
- 此选项提供完整的数据主权,适用于合规敏感型行业。
由此来看,Gartner 更加建议有能力的企业使用私有部署的模式;对于缺乏专门的 AI 运营团队和 AI 安全知识的团队,建议使用 CSP 部署;不建议直接使用官方应用平台进行商业服务。
对安全使用的建议
1. 对于直接使用 DeepSeek 应用程序和平台的安全建议
- 审查 AI 使用情况,检测影子 AI。
- 通过 API 监控、Web 代理和 SIEM 工具跟踪 DeepSeek 使用。
- 防范网络钓鱼攻击,强化员工意识。
- 与法律团队合作,确保合规性。
2. 对于使用 CSP 的模型即服务的安全建议
- 启用 CSP 的安全功能(如反 DDoS、数据加密等)。
- 使用 CASB 监控数据流。
- 定期进行安全评估和红队演习。
3. 对于私有部署的安全建议
- 应用 AI TRiSM 框架,确保 AI 风险管理全面覆盖。
- 实施零信任架构、多因素认证和数据加密。
- 定期红队测试,增强模型的安全性。
- 监控 CoT 输出,控制信息展示范围。
二、《关于 DeepSeek 的最大误解是什么》解读
总述
该报告中 Gartner 对下列九个常见误解进行了澄清,并给出相关说明。
- 所有 DeepSeek 模型都会捕获您的数据并将其发送回中国。❌
- DeepSeek 大大降低了 AI 模型开发的成本。❌
- DeepSeek 大大降低了 AI 模型部署和推理的成本。❌
- DeepSeek 的表现已经超越了 OpenAI。❌
- 只有 DeepSeek 模型受到了审查。❌
- DeepSeek 受中国政府控制。❌
- DeepSeek 使用 OpenAI 数据来训练其模型。❌
- DeepSeek R1 有不同的尺寸。❌
- DeepSeek 违反美国出口管制,非法获取高性能 Nvidia 芯片。❌
核心内容
误解 1:所有 DeepSeek 模型都会捕获您的数据并将其发送回中国
事实: DeepSeek API 和应用程序收集您的数据并将其发送到中国,而 DeepSeek 模型并不执行此数据传输。
需要区分 DeepSeek 模型和应用程序。对于 DeepSeek 应用程序及其 API,DeepSeek 的隐私政策公开说明会进行各种用户数据的收集,许多人工智能提供商如 OpenAI 也有类似的数据收集政策。而 DeepSeek 模型可以部署到任何合适的基础设施,不会进行内部请求之外的数据传输。
误解 2:DeepSeek 大幅降低了 AI 模型开发成本
事实: 虽然 DeepSeek 降低了开发成本,但并没有从根本上改变 LLM 开发的经济性。
DeepSeek 通过各种创新技术优化了效率,但例如人才、基础设施、数据处理和先前模型训练方面仍需要大量财务投入。
误解 3:DeepSeek 大幅降低了 AI 模型部署和推理的成本
事实: 尽管 DeepSeek 已成功减少模型推理过程中的资源消耗,但 DeepSeek 模型仍然需要高端基础设施和大量计算资源来部署。
DeepSeek R1 和 V3 模型拥有 6710 亿个参数,部署这些模型仍然需要高端基础设施和大量计算资源,尽管 DeepSeek 在模型推理过程中降低了计算资源消耗。
误解 4:DeepSeek 已经超越了 OpenAI
事实: 虽然 DeepSeek 展示了一种提高 LLM 性能的经济有效方法,但 OpenAI 继续取得卓越的成果。
DeepSeek 主要的创新点在于优化效率,但在根本性的 AI 表现中 OpenAI 仍处于领先地位。
误解 5:只有 DeepSeek 模型受到了严格审查
事实: 所有模型均已受到审查。
大多数由领先提供商制作的 LLM 都经过了严格审查,旨在拒绝有害请求并遵守法规。
误解 6:DeepSeek 受中国政府控制
事实: 没有公开记录表明 DeepSeek 得到了中国政府的支持。
DeepSeek 的资金来自量化对冲基金 High-Flyer,没有发现 DeepSeek 存在风险投资或政府参与的证据。
误解 7:DeepSeek 使用 OpenAI 数据来训练其模型
事实: 数据来源虽未披露,但是否使用 OpenAI 数据并不十分关键。
DeepSeek 尚未公开其数据来源,但蒸馏是训练 LLM 的常用方法,是否使用 OpenAI 数据进行蒸馏并不十分重要。
误解 8:DeepSeek R1 有不同的大小
事实: R1 只有一种大小。其他蒸馏模型不是 DeepSeek 模型。
DeepSeek 还基于 Qwen2.5 和 Llama3 系列向社区蒸馏了 6 个更小的模型,这些更小的模型使用的是 Qwen 和 Llama 的模型架构,而非 DeepSeek R1 的模型架构。
误解 9:DeepSeek 违反美国出口管制,非法获取高性能 Nvidia 芯片
事实: DeepSeek 使用合法手段获取 GPU。没有证据表明其违反出口管制。
DeepSeek 表示,它使用了 2,048 块 H800 GPU 来训练其 V3 模型,没有证据表明 DeepSeek 违反美国出口管制。
发表回复