在北山上

明日之花,绽放遍野。 欢迎到访,在北山上。

解读Gartner关于DeepSeek的相关内容

一、《我们如何安全地应对 DeepSeek》解读

总述

该报告探讨了与 DeepSeek 相关的安全风险,并给出相关的使用建议。

核心观点

  1. Gartner 认为 DeepSeek 是一家不以短期盈利为优先的公司。它从研究的角度支持工程师,并且不会面临实现财务或业务收益的重大压力。因此,DeepSeek 可能缺乏动力为其应用程序全面实施企业级安全控制。
  2. Gartner 认为 DeepSeek 已向国家网信办 (CAC) 完成了中国人工智能监管备案,可能存在信息泄漏风险,公司可能会使用数据进行模型训练。

核心内容

对于部署模式的选择

DeepSeek 部署存在 3 种不同的方式:

  1. 直接访问 DeepSeek 应用程序和平台。
  2. 来自 CSP 的模型即服务。
  3. DeepSeek 模型的私有部署。

Gartner 对这三种部署的建议分别是:

  1. 由于目前 DeepSeek 应用程序和开发者平台的安全控制对外界并不透明,因此 Gartner 不建议将其直接用于商业目的。
  2. 对于无法承担私人托管费用或没有成熟的安全能力来保护 LLM 的组织来说,这是首选方案。
  3. 此选项提供完整的数据主权,适用于合规敏感型行业。

由此来看,Gartner 更加建议有能力的企业使用私有部署的模式;对于缺乏专门的 AI 运营团队和 AI 安全知识的团队,建议使用 CSP 部署;不建议直接使用官方应用平台进行商业服务。

对安全使用的建议

1. 对于直接使用 DeepSeek 应用程序和平台的安全建议

  • 审查 AI 使用情况,检测影子 AI。
  • 通过 API 监控、Web 代理和 SIEM 工具跟踪 DeepSeek 使用。
  • 防范网络钓鱼攻击,强化员工意识。
  • 与法律团队合作,确保合规性。

2. 对于使用 CSP 的模型即服务的安全建议

  • 启用 CSP 的安全功能(如反 DDoS、数据加密等)。
  • 使用 CASB 监控数据流。
  • 定期进行安全评估和红队演习。

3. 对于私有部署的安全建议

  • 应用 AI TRiSM 框架,确保 AI 风险管理全面覆盖。
  • 实施零信任架构、多因素认证和数据加密。
  • 定期红队测试,增强模型的安全性。
  • 监控 CoT 输出,控制信息展示范围。

二、《关于 DeepSeek 的最大误解是什么》解读

总述

该报告中 Gartner 对下列九个常见误解进行了澄清,并给出相关说明。

  1. 所有 DeepSeek 模型都会捕获您的数据并将其发送回中国。❌
  2. DeepSeek 大大降低了 AI 模型开发的成本。❌
  3. DeepSeek 大大降低了 AI 模型部署和推理的成本。❌
  4. DeepSeek 的表现已经超越了 OpenAI。❌
  5. 只有 DeepSeek 模型受到了审查。❌
  6. DeepSeek 受中国政府控制。❌
  7. DeepSeek 使用 OpenAI 数据来训练其模型。❌
  8. DeepSeek R1 有不同的尺寸。❌
  9. DeepSeek 违反美国出口管制,非法获取高性能 Nvidia 芯片。❌

核心内容

误解 1:所有 DeepSeek 模型都会捕获您的数据并将其发送回中国

事实: DeepSeek API 和应用程序收集您的数据并将其发送到中国,而 DeepSeek 模型并不执行此数据传输。

需要区分 DeepSeek 模型和应用程序。对于 DeepSeek 应用程序及其 API,DeepSeek 的隐私政策公开说明会进行各种用户数据的收集,许多人工智能提供商如 OpenAI 也有类似的数据收集政策。而 DeepSeek 模型可以部署到任何合适的基础设施,不会进行内部请求之外的数据传输。

误解 2:DeepSeek 大幅降低了 AI 模型开发成本

事实: 虽然 DeepSeek 降低了开发成本,但并没有从根本上改变 LLM 开发的经济性。

DeepSeek 通过各种创新技术优化了效率,但例如人才、基础设施、数据处理和先前模型训练方面仍需要大量财务投入。

误解 3:DeepSeek 大幅降低了 AI 模型部署和推理的成本

事实: 尽管 DeepSeek 已成功减少模型推理过程中的资源消耗,但 DeepSeek 模型仍然需要高端基础设施和大量计算资源来部署。

DeepSeek R1 和 V3 模型拥有 6710 亿个参数,部署这些模型仍然需要高端基础设施和大量计算资源,尽管 DeepSeek 在模型推理过程中降低了计算资源消耗。

误解 4:DeepSeek 已经超越了 OpenAI

事实: 虽然 DeepSeek 展示了一种提高 LLM 性能的经济有效方法,但 OpenAI 继续取得卓越的成果。

DeepSeek 主要的创新点在于优化效率,但在根本性的 AI 表现中 OpenAI 仍处于领先地位。

误解 5:只有 DeepSeek 模型受到了严格审查

事实: 所有模型均已受到审查。

大多数由领先提供商制作的 LLM 都经过了严格审查,旨在拒绝有害请求并遵守法规。

误解 6:DeepSeek 受中国政府控制

事实: 没有公开记录表明 DeepSeek 得到了中国政府的支持。

DeepSeek 的资金来自量化对冲基金 High-Flyer,没有发现 DeepSeek 存在风险投资或政府参与的证据。

误解 7:DeepSeek 使用 OpenAI 数据来训练其模型

事实: 数据来源虽未披露,但是否使用 OpenAI 数据并不十分关键。

DeepSeek 尚未公开其数据来源,但蒸馏是训练 LLM 的常用方法,是否使用 OpenAI 数据进行蒸馏并不十分重要。

误解 8:DeepSeek R1 有不同的大小

事实: R1 只有一种大小。其他蒸馏模型不是 DeepSeek 模型。

DeepSeek 还基于 Qwen2.5 和 Llama3 系列向社区蒸馏了 6 个更小的模型,这些更小的模型使用的是 Qwen 和 Llama 的模型架构,而非 DeepSeek R1 的模型架构。

误解 9:DeepSeek 违反美国出口管制,非法获取高性能 Nvidia 芯片

事实: DeepSeek 使用合法手段获取 GPU。没有证据表明其违反出口管制。

DeepSeek 表示,它使用了 2,048 块 H800 GPU 来训练其 V3 模型,没有证据表明 DeepSeek 违反美国出口管制。

 

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注