DeepSeek:国产开源AI大模型深度使用教程

DeepSeek:国产开源AI大模型深度使用教程

DeepSeek 是由深度求索公司推出的国产开源 AI 大模型,旗下拥有 DeepSeek-V3(通用对话)和 DeepSeek-R1(深度推理)两大核心模型,凭借开源协议、极低 API 价格和出色的中文能力,迅速成为全球开发者与普通用户的热门选择。本文将从安装注册、核心功能、R1 推理模型、提示词技巧、API 接入到高级玩法,带你全面掌握 DeepSeek 的深度使用方法。

下载与安装

DeepSeek 提供了多种使用方式,满足不同场景的需求。对于普通用户,推荐直接使用官方网页或移动端 App;对于开发者,则可通过 API 进行集成调用。

官方网页版

访问 chat.deepseek.com,使用手机号或邮箱即可免费注册登录。网页版支持全部核心功能,包括对话、文件上传、联网搜索等,无需安装任何软件,打开浏览器即可使用。

移动端 App

DeepSeek 提供了 iOS 和 Android 两大平台的官方应用:

平台下载方式核心功能支持
iOSApp Store 搜索 “DeepSeek”完整功能
Android官网下载 APK 或应用商店搜索完整功能

移动端支持语音输入、图片上传等便捷功能,适合随时随地使用。

使用费用

DeepSeek 网页端和 App 端目前均可免费使用,包括 R1 推理模型在内的大部分功能均不收费,这也是其广受欢迎的重要原因之一。

本节小结: DeepSeek 的安装门槛极低,网页端、iOS 和 Android 三端全覆盖,且核心功能完全免费,用户可以零成本上手体验。

核心功能

DeepSeek 提供了丰富的 AI 功能,覆盖日常对话、深度推理、代码生成等多个场景。

DeepSeek-V3 通用对话

DeepSeek-V3 是一款强大的通用大语言模型,擅长中文理解与生成、多轮对话、文本创作、翻译、知识问答等任务。其 6710 亿参数的 MoE 架构使其在保持高性能的同时,推理速度也非常快。

DeepSeek-R1 深度推理

DeepSeek-R1 是 DeepSeek 的推理增强模型,内置思维链(Chain of Thought)能力,能够对复杂问题进行逐步推理,特别擅长数学证明、逻辑分析和编程算法等需要深度思考的任务。

代码生成与调试

DeepSeek 在代码领域表现优异,支持 Python、JavaScript、Java、C++ 等数十种编程语言。用户可以直接描述需求,模型会生成完整代码,并支持代码解释和 Bug 排查。

联网搜索

开启联网搜索功能后,DeepSeek 可以实时获取互联网上的最新信息,回答时效性问题,并提供信息来源引用,适合新闻查询、技术调研等场景。

文件上传与分析

支持上传 PDF、Word、Excel、TXT、图片等多种格式的文件,模型可以阅读并分析文件内容,支持文档总结、数据提取、图表解读等操作。

本节小结: DeepSeek 的核心功能涵盖了通用对话、深度推理、代码生成、联网搜索和文件分析五大模块,能够满足从日常聊天到专业工作的多样化需求。

DeepSeek-R1 推理模型

DeepSeek-R1 是 DeepSeek 最具特色的产品之一,其推理能力在全球模型中处于领先水平。

R1 的核心特点

DeepSeek-R1 最大的特点是思维链(Chain of Thought, CoT)推理机制。在回答复杂问题前,模型会先在 <think 标签内展示完整的思考过程,包括问题拆解、假设验证、逻辑推导等步骤,最终得出经过严谨论证的结论。这种”慢思考”模式使其在数学竞赛、编程算法等场景中表现突出。

R1 与 V3 的区别

对比维度DeepSeek-V3DeepSeek-R1
模型定位通用对话模型深度推理模型
推理方式直接生成答案先思考再回答(CoT)
响应速度较快较慢(需思考时间)
数学能力优秀卓越
编程能力优秀卓越
日常对话流畅自然偏向严谨
适用场景写作、翻译、问答数学、编程、逻辑推理
API 模型名deepseek-chatdeepseek-reasoner

适用场景

R1 特别适合以下场景:数学证明与计算、编程算法设计、复杂逻辑分析、学术论文解读、多步骤问题求解。对于简单的日常对话,V3 反而是更高效的选择。

本节小结: DeepSeek-R1 通过思维链推理机制实现了卓越的数学和编程能力,与 V3 形成互补,用户可根据任务复杂度灵活选择。

提示词技巧

掌握提示词(Prompt)技巧,能够大幅提升 DeepSeek 的输出质量。

通用对话技巧

  • 明确角色设定:如”你是一位资深 Python 工程师,请帮我……”
  • 提供上下文:给出背景信息,让模型更精准地理解需求
  • 指定输出格式:如”请用表格形式输出””请分点列举”
  • 分步提问:复杂任务拆分为多个简单问题逐步引导

R1 推理场景提示词

  • 数学问题:直接描述题目,R1 会自动启动思维链推理
  • 逻辑分析:使用”请逐步分析””请详细推导”等关键词引导深度思考
  • 编程算法:说明题目要求、输入输出格式和约束条件

代码生成技巧

  • 提供清晰的函数签名和注释说明
  • 指定编程语言和框架版本
  • 给出测试用例或期望输出
  • 要求模型添加代码注释和错误处理

让模型”慢思考”的方法

  • 使用”请仔细思考后再回答””请逐步推理”等提示
  • 对于复杂问题,明确要求”请先分析问题,再给出方案”
  • 使用 R1 模型,它会自动进行深度推理

本节小结: 好的提示词应当明确、具体、有结构。针对不同任务选择合适的模型(V3 或 R1),并善用角色设定和格式要求,可以显著提升输出效果。

API 接入

对于开发者而言,DeepSeek 提供了兼容 OpenAI 格式的 API 接口,接入极为便捷。

API Key 获取

  1. 访问 deepseek.com(开发者平台)
  2. 注册并登录账号
  3. 进入「API Keys」页面,点击「创建 API Key」
  4. 复制生成的 Key(仅显示一次,请妥善保存)

模型选择

API 模型名对应模型适用场景输入价格输出价格
deepseek-chatDeepSeek-V3通用对话、代码、翻译1 元/百万 Token2 元/百万 Token
deepseek-reasonerDeepSeek-R1深度推理、数学、编程4 元/百万 Token16 元/百万 Token

DeepSeek 的 API 定价在全球主流模型中属于极低水平,仅为 GPT-4 的几十分之一,非常适合大规模应用开发。

调用示例

以下是 Python 调用示例:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "你是一个有帮助的助手。"},
        {"role": "user", "content": "请用 Python 写一个快速排序算法。"}
    ]
)

print(response.choices[0].message.content)

由于 DeepSeek API 兼容 OpenAI 格式,现有基于 OpenAI 的项目只需修改 base_urlapi_key 即可无缝迁移。

本节小结: DeepSeek API 兼容 OpenAI 格式,价格极低,接入简单,开发者可以零成本从其他平台迁移,是性价比极高的 AI API 选择。

高级技巧

深度搜索 DeepResearch

DeepSeek 的深度搜索功能可以针对复杂问题进行多轮信息检索和整合分析,自动拆解研究主题、搜集多方资料并生成结构化的研究报告,适合学术调研、竞品分析等场景。

文件多格式分析

上传 PDF 论文后,可以让 DeepSeek 完成以下任务:提取核心观点、总结研究方法、对比不同章节的结论、生成文献综述。对于 Excel 数据文件,可以进行统计分析、趋势识别和可视化建议。

代码项目理解

将整个代码项目打包上传或分段粘贴给 DeepSeek,它可以帮你:梳理项目架构、解释核心模块逻辑、发现潜在 Bug、提出优化建议、生成项目文档。

学术论文解读

上传学术论文 PDF,DeepSeek-R1 能够深度解读论文内容,包括:提炼研究背景与动机、解释核心算法原理、分析实验结果、指出论文的创新点与局限性。

本节小结: 善用文件上传和深度搜索功能,DeepSeek 可以胜任学术研究、代码审查、数据分析等专业级任务,远超基础对话的使用范畴。

优缺点分析

优点

  • 完全开源:模型权重公开,支持本地部署,社区生态活跃
  • 价格极低:API 定价全球最低梯队,网页端免费使用
  • 中文能力出色:作为国产模型,中文理解和生成质量极高
  • R1 推理能力卓越:数学和编程推理达到国际领先水平
  • 兼容 OpenAI 格式:开发者迁移成本几乎为零
  • 多端覆盖:网页、iOS、Android 全平台支持

缺点

  • 高峰期响应较慢:免费用户在高峰时段可能遇到排队
  • R1 思考时间较长:复杂推理任务需要等待较长时间
  • 长文本处理有限:超长文档的理解精度仍有提升空间
  • 多模态能力待加强:图像理解和生成能力相比头部模型仍有差距
  • 生态工具较少:插件和第三方集成数量不及 ChatGPT

本节小结: DeepSeek 在开源、价格和中文能力方面优势显著,但在响应速度、长文本处理和多模态能力上仍有进步空间。

写在最后

DeepSeek 作为国产开源 AI 大模型的代表,凭借 DeepSeek-V3 的通用能力和 DeepSeek-R1 的推理实力,已经在全球 AI 领域占据了重要位置。无论你是普通用户还是开发者,都可以从其免费的使用门槛和极低的 API 价格中受益。希望本教程能帮助你全面掌握 DeepSeek 的使用方法,在日常工作和学习中充分发挥 AI 的价值。AI 技术日新月异,DeepSeek 也在持续迭代更新,建议关注官方动态,及时体验新功能。

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容