DeepSeek R1 使用完整教程，2026 中文大模型零基础上手

🌐 Read in English

📅 2026-05-17 00:57:43 👤 抖文编辑部 💬 7 条评论 👁 8

DeepSeek 是 2025 年初横空出世的中文 AI 大模型,DeepSeek R1 推理版本上线后凭借开源、推理能力强、API 价格低这三大优势,一年时间用户数超过 1.5 亿,在中国市场和 ChatGPT 平分秋色。2026 年 5 月的最新版本 DeepSeek R1 0428 在数学竞赛 MATH-500 拿到 97.3 分,超过 Claude Opus 4.7 和 GPT-4o。

本文整理 2026 年 5 月最新版本的 DeepSeek R1 使用完整流程,适合从零基础到希望深入用 API 的用户。包括注册、网页端基础玩法、移动 App、API 接入、本地部署四个层级,以及 12 个实测场景。

DeepSeek 是什么,和 ChatGPT 有啥区别

DeepSeek 是杭州深度求索公司推出的大模型品牌。2024 年 5 月发布 V2 版本时引起业界关注,2025 年 1 月 R1 推理模型发布后真正出圈。和 ChatGPT 比有三点不同。

第一是中文能力。DeepSeek 训练数据中文占比超过 30%,远高于 ChatGPT 的 8% 到 12%。中文写作、文言文翻译、中国文化常识题答题准确率明显更高。比如让两者用文言文写一封信,DeepSeek 输出的句式和典故更地道。

第二是数学和编程推理。R1 模型用了强化学习训练专门的推理链,数学竞赛级题目能给出步骤完整的解答。LeetCode 困难题首次通过率 75%,比 GPT-4o 的 68% 高 7 个百分点。

第三是价格。DeepSeek API 输入 1 块钱可以买 200 万 token,输出 1 块钱 80 万 token。对比 GPT-4o 的 1 美元 30 万 token,便宜 30 倍以上。同样的项目预算可以跑 30 倍量。

网页端注册和首次使用

打开 chat.deepseek.com 点 Sign Up。注册支持手机号、邮箱、Google 三种方式。中国用户用手机号最方便,海外用户用 Google 一键登录。注册完成自动跳转到对话页面没有额外验证。

页面左侧是对话历史右侧是聊天框。顶部有两个按钮 DeepThink 和 Search。DeepThink 是开启 R1 推理模式默认关闭,聊家常和简单问答用不到开启后会先展示思考过程再给答案。Search 是联网搜索开启后回答会引用最新网页信息适合查 2026 年最新动态的问题。

第一次使用建议在输入框右边点 New Chat 开启干净的对话。每个对话最长 12 万字符大约 6 万中文字超出会自动新开会话。

DeepThink 推理模式怎么用

DeepThink 是 R1 的杀手锏功能。开启后模型会先在 thinking 块里展示推理过程,然后才给出最终答案。这个推理过程通常 500 到 5000 字看问题复杂度。

适合开 DeepThink 的场景有几类。第一是数学题尤其是初中高中竞赛级。第二是编程题需要从算法到代码的完整思路。第三是逻辑推理类题比如逻辑悖论数独脑筋急转弯。第四是商业分析需要多步骤推演的策略问题。

不适合开 DeepThink 的场景。聊天写诗翻译这类不需要长推理的任务开了反而慢。短问答比如查天气换算单位开了浪费时间。每次思考会消耗大约 10 到 30 秒,对实时性要求高的场景不划算。

实测一道高考压轴题。关闭 DeepThink 用 V3 模型回答错误。开启 DeepThink R1 思考 47 秒输出 2300 字推理过程最终答案正确。这是 R1 在中国教培领域被广泛使用的原因。

12 个高频实用场景

第一编程辅助。让 R1 写 Python 爬虫脚本,贴需求贴示例输出,30 秒返回完整代码加注释。比让 V3 写错误率低一半。

第二中文润色。把一段英文翻译过来的生硬文字贴给它,要求改成自然中文,效果优于 Google 翻译和 DeepL。

第三论文摘要。粘贴 PDF 全文要求 500 字内总结,准确率 90% 以上。比让 ChatGPT 总结同样长度文档稍快。

第四简历优化。把简历贴上去说"改成应聘字节跳动产品经理岗位的版本",会自动调整关键词和句式。

第五写邮件。"帮我给客户回一封婉拒会议邀请的邮件,语气客气但不卑微",输出可以直接发。

第六法律咨询。问"租房合同里没写但房东说押金不退,我该怎么办",会给出法律依据和操作步骤。

第七写 SQL。描述表结构和需求,生成的 SQL 不仅可运行还会注释每行作用。

第八数学辅导。家长辅导孩子作业最常用。开 DeepThink 让模型分步解题。

第九创意文案。小红书风格、抖音风格、公众号风格的标题文案,DeepSeek 比 GPT-4o 更符合中文社交媒体语感。

第十代码 Review。把一段代码贴上去问"有什么可以改进的",会指出 bug、性能问题、风格问题三类。

第十一商业策划。开 DeepThink 让模型分析"一个 2 万元启动资金的咖啡店能不能开",会给出市场调研、成本估算、风险分析、3 年财务模型。

第十二多轮 brainstorm。对一个开放性问题反复追问,模型会从不同角度提出新想法。比单次回答好用 5 倍。

DeepSeek 手机 App 上手

DeepSeek 官方 App 支持 iOS 和 Android。从 App Store 或安卓应用商店搜 DeepSeek 下载,体积约 80 MB。注册和网页端是同一个账号会自动同步对话历史。

移动端特色功能是语音输入和拍照解题。语音输入按住麦克风按钮说话支持中文英文混说,转写准确率 95% 以上。拍照解题对准课本题目拍一张,自动识别题干并解答,适合学生群体。

App 比网页端缺少 API 入口和模型版本切换。如果需要这两个功能还是要回到电脑端。聊天体验完全一致,响应速度甚至比网页快,因为 App 用了 WebSocket 长连接。

API 接入完整流程

进入 platform.deepseek.com 实名认证后充值 10 元起。点 API Keys 生成新密钥保存好只显示一次。

代码示例用 Python OpenAI SDK 调用即可,因为 DeepSeek API 完全兼容 OpenAI 格式。导入 openai 库,设置 base_url 为 https://api.deepseek.com,api_key 填刚才生成的。模型名 deepseek-chat 是 V3 默认版,deepseek-reasoner 是 R1 推理版。

实测一个常用脚本。批量翻译 1000 篇英文新闻摘要到中文,V3 模型耗时 6 分钟成本 0.8 元。同样的量用 GPT-4o 耗时 12 分钟成本 28 元。DeepSeek 在这种重复性高的任务上性价比拉满。

API 调用并发限制是每分钟 200 次单次最长输出 8K token。如果做大量批量任务建议加 sleep 0.3 秒间隔避免触发限流。

本地部署 DeepSeek R1 蒸馏版

不愿用云服务的用户可以本地跑。但完整的 R1 是 671B 参数 IP 重 1.3TB 普通电脑跑不动。官方释放了 6 个蒸馏版本从 1.5B 到 70B 适合不同硬件。

最适合个人用的是 7B 和 14B 版本。7B 占 4GB 显存或 8GB 内存。M1 MacBook Air 16GB 能流畅运行每秒输出 12 token。14B 占 8GB 显存 RTX 3060 12GB 卡能跑每秒 20 token。

部署最简单的方法是 Ollama。Mac 用 Homebrew 装,Windows 下载 .exe。安装完成在终端运行 ollama run deepseek-r1:7b 自动下载模型并启动。第一次下载约 4GB 5 到 10 分钟。下载完弹出对话框就能聊天。

本地部署的优势是数据隐私和离线可用。客户隐私合同代码不会上传服务器。劣势是模型小能力弱,7B 蒸馏版能力大约相当于 GPT-3.5 不如云端 R1 完整版。

价格和配额对比

云端 API 价格 V3 模型输入 0.5 元每百万 token 输出 8 元每百万 token,R1 推理模型输入 1 元每百万 token 输出 16 元每百万 token。

对比 OpenAI GPT-4o 输入 18 元每百万 token 输出 60 元每百万 token,Anthropic Claude Opus 4.7 输入 110 元每百万 token 输出 540 元每百万 token。DeepSeek 价格是 OpenAI 的 1/30 是 Anthropic 的 1/100。

充值满 100 元送 5% 充值 1000 元送 10%。新用户注册赠送 10 元额度足够普通用户用 1 个月。中小开发者完全可以用 100 元跑半年。

数据安全和合规

数据隐私方面 DeepSeek 不会用用户对话数据训练后续模型。用户在网页端的对话默认存 30 天 API 调用不记录任何对话内容。这点比 ChatGPT 早期严格因为 OpenAI 在 2023 年用过用户数据训练。

合规层面 DeepSeek 在中国境内有 ICP 备案数据存储在境内服务器。企业客户需要数据出境的可以选海外节点 deepseek-r1-instruct 在 huggingface 和 modelscope 上有公开镜像可商用。

国际出口管制方面美国 2025 年 1 月一度禁过 DeepSeek 后来解禁。2026 年 5 月在美国仍可正常访问网页和 API但 iOS App Store 美区下架。

常见使用问题排雷

第一卡顿。R1 推理模式偶尔卡 1 分钟没响应。建议刷新页面重发,DeepThink 模式 90% 的延迟在 1 分钟内属于正常。

第二输出截断。模型最长输出约 8K token 即 4000 中文字。如果让它写 1 万字论文会写到一半停住。解法是分多次让模型继续写。

第三网络问题。中国大陆访问偶尔被墙建议用电信或联通宽带,移动网络访问海外节点延迟较大。海外用户访问国内节点延迟 200 毫秒以上,建议切到 huggingface 镜像。

第四中英文混乱。让模型用英文回答时偶尔会中英夹杂。在 system prompt 里加 "Please respond in pure English only" 可解决。

第五幻觉。R1 推理时偶尔编造 API 文档和函数名。涉及具体技术细节务必交叉验证,不能完全相信。

适合什么人用 DeepSeek

学生群体最适合。拍照解题、数学辅导、论文摘要、英文翻译这四件事一个 App 全解决。一个月 0 成本网页端就够用。

中文内容创作者次适合。小红书博主、公众号作者、自媒体运营用 DeepSeek 写文案比 ChatGPT 更接地气。出稿速度比手写快 5 倍。

中小开发者非常适合。API 价格让中小项目从烧不起 OpenAI 转向能负担。批量翻译、客服 bot、代码助手这类应用直接用 DeepSeek 性价比最高。

不太适合非中文场景。给海外用户做英文产品,模型在英文领域不如 GPT-4o 自然。中文之外的小语种比如日语韩语德语,DeepSeek 输出质量也比 GPT 差一截。

常见问题 FAQ

DeepSeek 完全免费用够用吗

网页端完全免费没有调用次数限制每天可以聊几十轮甚至上百轮。R1 推理模式高峰期会有 1 分钟左右等待但不收费。99% 的普通用户用网页端足够包括学生、内容创作者、产品经理。只有当你需要 API 接入、批量自动化、长上下文 12 万字以上场景时才需要付费。API 充 10 元能用 2 到 3 个月,基本无门槛。

R1 和 V3 怎么选

V3 是默认模型适合普通对话写作翻译,响应快 1 到 3 秒,API 输出 8 元每百万 token。R1 是推理模型适合数学编程逻辑分析,响应慢 30 秒到 2 分钟,API 输出 16 元每百万 token 是 V3 的 2 倍。一般规则是 80% 的任务用 V3,涉及"想清楚怎么做"的 20% 任务用 R1。

本地部署 7B 模型够不够日常用

7B 蒸馏版能力大约相当于 GPT-3.5 写邮件润色翻译可以做但创意写作、复杂编程、深度分析会明显比云端差。如果只是离线场景比如出差飞机上用足够。要日常严肃使用建议 14B 起或者直接用云端。本地 70B 接近云端 R1 能力但需要 48GB 显存只有 RTX 5090 或 A100 能跑性价比不高。

DeepSeek 输出会不会被用来训练新模型

官方文档明确说 API 调用数据零保留不会用于训练。网页端对话默认存 30 天可在设置里关闭存储。但敏感数据比如商业合同、个人身份证号、银行卡号还是不建议输入任何 AI 服务。本地部署是数据零外传的唯一保险。

为什么 DeepSeek 比 ChatGPT 便宜这么多

三个原因。第一是中国团队人力成本和电力成本比硅谷低 50%。第二是 MoE 混合专家架构推理只激活部分参数计算开销小。第三是规模化收入策略,DeepSeek 不追求短期利润而是占领市场份额。预计 2027 年价格会上涨 30% 到 50% 但仍然会显著低于 OpenAI。

📝 本文来自抖文 www.douwen.me ，转载请保留出处。

原文链接：https://douwen.me/archives/1014/