|
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
DeepSeek-V3据我所知,是第一个(至少在开源社区内)成功使用FP8混合精度训练得到的大号MoE模型。 众所周知,FP8伴随着数值溢出的风险,而MoE的训练又非常不稳定,这导致实际大模型训练中BF16仍旧是主流选择。
- 普通人怎样用好Deepseek? - 知乎
DeepSeek-R1则专门是为了 代码生成+数学问题解决 而设计,整体速度极快,精确度实测后非常高,推理能力一流。 适合需要快速实现技术需求的场景,比如程序员、理工科学生等。
- 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决? - 知乎
随着DeepSeek的爆火,不少云服务商为了获取流量都提供了免费的DeepSeek-R1-满血版的API。 其中以硅基流动、腾讯云平台比较有代表性。
- 有必要自己将deepseek部署到本地吗? - 知乎
所以我认为,deepseek部署有可行性就够了,至于有没有必要性,很多人没那么重要。 大家听到openai训练ai需要几千亿美元,让ai推理需要十块H100 (一块280万人民币),部署满血deepseekR1需要几十几百万,可能吓到了。
- 怎么分辨在用的deepseek是不是满血版啊? - 知乎
现在很多的互联网大厂都开始接入DeepSeek-R1大模型了,每个公司都宣称自己接入的是DeepSeek-R1满血模型,那究竟怎么区分到底是不是满血模型呢?
- 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? - 知乎
都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? 接入DeepSeek的腾讯元宝,纳米,秘塔都说是满血版,但是同一个问题,我感觉解答总是不如官网细致合理,上下文联系也差点意思,就像少了点灵动,请问这是… 显示全部 关注者 409
- DeepSeek深度思考和联网搜索有什么区别? - 知乎
DeepSeek为大家提供了:深度思考R1和联网搜索,两个功能强悍的按钮,但,在和知乎网友的交流过程中,我发现有很多人,不知道这两个强悍的工具如何搭配使用。今天就好好聊聊这个问题。 深度思考模式详解 深度思考模式就像是一个“超级大脑”,当你遇到复杂问题时,它会帮你仔细分析、多角度
- 使用Deepseek需要付费的吗? - 知乎
使用Deepseek如何收费京ICP证110745号 · 京ICP备13052560号-1 · 京公网安备 11010802020088 号 · 互联网新闻信息服务许可证:11220250001 · 京网文 [2025]0422-132 号 · 药品医疗器械网络信息服务备案(京)网药械信息备字(2022)第00334号 · 广播电视节目制作经营许可证:(京)字第06591号 · 互联网宗教信息服务许可
|
|
|