解读Gartner关于DeepSeek的相关内容

一、《我们如何安全地应对 DeepSeek》解读

总述

该报告探讨了与 DeepSeek 相关的安全风险，并给出相关的使用建议。

核心观点

Gartner 认为 DeepSeek 是一家不以短期盈利为优先的公司。它从研究的角度支持工程师，并且不会面临实现财务或业务收益的重大压力。因此，DeepSeek 可能缺乏动力为其应用程序全面实施企业级安全控制。
Gartner 认为 DeepSeek 已向国家网信办 (CAC) 完成了中国人工智能监管备案，可能存在信息泄漏风险，公司可能会使用数据进行模型训练。

核心内容

对于部署模式的选择

DeepSeek 部署存在 3 种不同的方式：

直接访问 DeepSeek 应用程序和平台。
来自 CSP 的模型即服务。
DeepSeek 模型的私有部署。

Gartner 对这三种部署的建议分别是：

由于目前 DeepSeek 应用程序和开发者平台的安全控制对外界并不透明，因此 Gartner 不建议将其直接用于商业目的。
对于无法承担私人托管费用或没有成熟的安全能力来保护 LLM 的组织来说，这是首选方案。
此选项提供完整的数据主权，适用于合规敏感型行业。

由此来看，Gartner 更加建议有能力的企业使用私有部署的模式；对于缺乏专门的 AI 运营团队和 AI 安全知识的团队，建议使用 CSP 部署；不建议直接使用官方应用平台进行商业服务。

对安全使用的建议

1. 对于直接使用 DeepSeek 应用程序和平台的安全建议

审查 AI 使用情况，检测影子 AI。
通过 API 监控、Web 代理和 SIEM 工具跟踪 DeepSeek 使用。
防范网络钓鱼攻击，强化员工意识。
与法律团队合作，确保合规性。

2. 对于使用 CSP 的模型即服务的安全建议

启用 CSP 的安全功能（如反 DDoS、数据加密等）。
使用 CASB 监控数据流。
定期进行安全评估和红队演习。

3. 对于私有部署的安全建议

应用 AI TRiSM 框架，确保 AI 风险管理全面覆盖。
实施零信任架构、多因素认证和数据加密。
定期红队测试，增强模型的安全性。
监控 CoT 输出，控制信息展示范围。

二、《关于 DeepSeek 的最大误解是什么》解读

总述

该报告中 Gartner 对下列九个常见误解进行了澄清，并给出相关说明。

所有 DeepSeek 模型都会捕获您的数据并将其发送回中国。❌
DeepSeek 大大降低了 AI 模型开发的成本。❌
DeepSeek 大大降低了 AI 模型部署和推理的成本。❌
DeepSeek 的表现已经超越了 OpenAI。❌
只有 DeepSeek 模型受到了审查。❌
DeepSeek 受中国政府控制。❌
DeepSeek 使用 OpenAI 数据来训练其模型。❌
DeepSeek R1 有不同的尺寸。❌
DeepSeek 违反美国出口管制，非法获取高性能 Nvidia 芯片。❌

核心内容

误解 1：所有 DeepSeek 模型都会捕获您的数据并将其发送回中国

事实： DeepSeek API 和应用程序收集您的数据并将其发送到中国，而 DeepSeek 模型并不执行此数据传输。

需要区分 DeepSeek 模型和应用程序。对于 DeepSeek 应用程序及其 API，DeepSeek 的隐私政策公开说明会进行各种用户数据的收集，许多人工智能提供商如 OpenAI 也有类似的数据收集政策。而 DeepSeek 模型可以部署到任何合适的基础设施，不会进行内部请求之外的数据传输。

误解 2：DeepSeek 大幅降低了 AI 模型开发成本

事实： 虽然 DeepSeek 降低了开发成本，但并没有从根本上改变 LLM 开发的经济性。

DeepSeek 通过各种创新技术优化了效率，但例如人才、基础设施、数据处理和先前模型训练方面仍需要大量财务投入。

误解 3：DeepSeek 大幅降低了 AI 模型部署和推理的成本

事实： 尽管 DeepSeek 已成功减少模型推理过程中的资源消耗，但 DeepSeek 模型仍然需要高端基础设施和大量计算资源来部署。

DeepSeek R1 和 V3 模型拥有 6710 亿个参数，部署这些模型仍然需要高端基础设施和大量计算资源，尽管 DeepSeek 在模型推理过程中降低了计算资源消耗。

误解 4：DeepSeek 已经超越了 OpenAI

事实： 虽然 DeepSeek 展示了一种提高 LLM 性能的经济有效方法，但 OpenAI 继续取得卓越的成果。

DeepSeek 主要的创新点在于优化效率，但在根本性的 AI 表现中 OpenAI 仍处于领先地位。

误解 5：只有 DeepSeek 模型受到了严格审查

事实： 所有模型均已受到审查。

大多数由领先提供商制作的 LLM 都经过了严格审查，旨在拒绝有害请求并遵守法规。

误解 6：DeepSeek 受中国政府控制

事实： 没有公开记录表明 DeepSeek 得到了中国政府的支持。

DeepSeek 的资金来自量化对冲基金 High-Flyer，没有发现 DeepSeek 存在风险投资或政府参与的证据。

误解 7：DeepSeek 使用 OpenAI 数据来训练其模型

事实： 数据来源虽未披露，但是否使用 OpenAI 数据并不十分关键。

DeepSeek 尚未公开其数据来源，但蒸馏是训练 LLM 的常用方法，是否使用 OpenAI 数据进行蒸馏并不十分重要。

误解 8：DeepSeek R1 有不同的大小

事实： R1 只有一种大小。其他蒸馏模型不是 DeepSeek 模型。

DeepSeek 还基于 Qwen2.5 和 Llama3 系列向社区蒸馏了 6 个更小的模型，这些更小的模型使用的是 Qwen 和 Llama 的模型架构，而非 DeepSeek R1 的模型架构。

误解 9：DeepSeek 违反美国出口管制，非法获取高性能 Nvidia 芯片

事实： DeepSeek 使用合法手段获取 GPU。没有证据表明其违反出口管制。

DeepSeek 表示，它使用了 2,048 块 H800 GPU 来训练其 V3 模型，没有证据表明 DeepSeek 违反美国出口管制。

在北山上

解读Gartner关于DeepSeek的相关内容

一、《我们如何安全地应对 DeepSeek》解读

总述

核心观点

核心内容

对于部署模式的选择

对安全使用的建议

二、《关于 DeepSeek 的最大误解是什么》解读

总述

核心内容

误解 1：所有 DeepSeek 模型都会捕获您的数据并将其发送回中国

误解 2：DeepSeek 大幅降低了 AI 模型开发成本

误解 3：DeepSeek 大幅降低了 AI 模型部署和推理的成本

误解 4：DeepSeek 已经超越了 OpenAI

误解 5：只有 DeepSeek 模型受到了严格审查

误解 6：DeepSeek 受中国政府控制

误解 7：DeepSeek 使用 OpenAI 数据来训练其模型

误解 8：DeepSeek R1 有不同的大小

误解 9：DeepSeek 违反美国出口管制，非法获取高性能 Nvidia 芯片

发表回复取消回复

解读Gartner关于DeepSeek的相关内容

一、《我们如何安全地应对 DeepSeek》解读

总述

核心观点

核心内容

对于部署模式的选择

对安全使用的建议

二、《关于 DeepSeek 的最大误解是什么》解读

总述

核心内容

误解 1：所有 DeepSeek 模型都会捕获您的数据并将其发送回中国

误解 2：DeepSeek 大幅降低了 AI 模型开发成本

误解 3：DeepSeek 大幅降低了 AI 模型部署和推理的成本

误解 4：DeepSeek 已经超越了 OpenAI

误解 5：只有 DeepSeek 模型受到了严格审查

误解 6：DeepSeek 受中国政府控制

误解 7：DeepSeek 使用 OpenAI 数据来训练其模型

误解 8：DeepSeek R1 有不同的大小

误解 9：DeepSeek 违反美国出口管制，非法获取高性能 Nvidia 芯片

发表回复 取消回复

发表回复取消回复