|
- 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决? - 知乎
最近不少被Deepseek新闻吸引过来的AI新手用户发现,国内AI公司深度求索(DeepSeek)的线上服务频繁出现“服务器繁忙”提示,甚至影响正常使用。 这背后其实是一场持续近一个月、愈演愈烈的跨境网络攻击,而DeepSeek的爆火可能正是被盯上的原因。
- 普通人怎样用好Deepseek? - 知乎
1 DeepSeek目前广义来讲,主要分为V3和R1两种模型,其中V3为对话模型,R1为推理模型 DeepSeek-V3适用于通用知识问答、文本创作和学习辅助,覆盖面广泛,但专业性稍弱。 适用于学生查知识点、创作者(如自媒体)、日常需要信息检索的人群等。
- DeepSeek深度思考和联网搜索有什么区别? - 知乎
DeepSeek与其他大模型的协同操作 我们知道DeepSeek的优势是推理、决策,脑洞大,但劣势也很明显,她多模态能力较弱,且容易产生幻觉,此时我们就可以让DeepSeek给我们做军师,指挥:豆包,文心,通义,智谱,Kimi等大模型为我们做事。
- OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费后靠什么盈利呢? - 知乎
同样,DeepSeek也提供类似ChatGPT的网页版、App版,也是免费的,相信也有一定的额度限制,但是够用。 DeepSeek的API收费,但是真要比OpenAI的便宜太多。 DeepSeek的母公司幻方是量化投资公司,本身就有盈利能力,所以DeepSeek真的没有很大的盈利压力。
- 有必要自己将deepseek部署到本地吗? - 知乎
所以我认为,deepseek部署有可行性就够了,至于有没有必要性,很多人没那么重要。 大家听到openai训练ai需要几千亿美元,让ai推理需要十块H100(一块280万人民币),部署满血deepseekR1需要几十几百万,可能吓到了。 因为deepseek部署费用太吓人,所以才问是否必要。
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
对于流水线并行,DeepSeek-V3设计了类似于Chimera 中的双向流水来降低bubble,而没有采用更加常见的interleaved 1F1B(尽管interleaved 1F1B中的steady阶段同样可以将前向和反向的计算通信相互进行隐藏)。 推理优化 最后,DeepSeek-V3模型的部署同样十分挑战。
- 如何把 deepseek-R1 微调或蒸馏为某领域的一个专家? - 知乎
Deepseek-R1使用教师模型训练时的原始数据集或其子集作为蒸馏数据集。数据集的质量和多样性直接影响蒸馏效果。使用高质量、多样化的数据集可以确保学生模型学习到更全面和准确的推理模式。利用 DeepSeek-R1 生成了高达 80 万条的高质量训练数据。
- deepseek是可以免费使用的软件吗?如果收费,价格是多少? - 知乎
使用deepseek时,经常出现“服务器繁忙”的问题。 本文介绍2种新的方法:使用QQ浏览器的deepseek满血版,和腾讯元宝的deepseek。 手机端和电脑端,都能使用。 亲测效果不错。 正文: 最近,总有小伙伴反应:deepseek好用,但是总会显示“服务器繁忙”,很闹心。
|
|
|