|
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现上更加友好的量化方法对于训练稳定性的影响会有多大。
- Deepseek-R2什么时候可以上线? - 知乎
DeepSeek R2处于价格、创新和全球竞争力的交汇点。 通过整合先进的编码技术、扩展的语言支持和下一级别的成本节约,它可能会颠覆我们对人工智能性价比的认识。
- DeepSeek - 知乎
DeepSeek-V3 R1 推理系统的优化目标是:更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(Expert Parallelism EP)。
- 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?
看到一个很好用的测试案例,可以用来简单测试是不是DeepSeek满血版。 请用我给你的四个数字,通过加、减、乘、除、括号,组成一个运算,使得结果为24。注意:数字需要全部我提供的数字:4 4 6 8。 这是DeepSeek官方提供的回答,简洁明了,一次就答对了。
- 如何让deepseek做ppt?
DeepSeek和Kimi二者结合,利用DeepSeek协助做分析出代码, 然后让Kimi做它擅长的PPT设计与优化。 假设我们要做一个关于“DeepSeek介绍”的PPT,需要我们先输入指令,让DeepSeek给出大纲内容,并且最好是用Markdown格式输出; PPT大纲的输出速度还是很快的,
- DeepSeek 回答中的流程图代码怎么转成图片? - 知乎
DeepSeek生成流程图 具体如何做? 来看一下实操案例 1、写好提示词 用DeepSeek画流程图,写提示词是关键。 最关键的点,是你需要在告诉DeepSeek画什么流程图之后,加上一句,用mermaid格式生成。 比如,这里,我们想要画一张物理实验的流程图。 提示词可以这样写:
- deepseek R1 只支持文本,不支持多模态吗? - 知乎
原版 DeepSeek-R1 的核心能力聚焦于文本推理,但通过 ** Align-DS-V 扩展版本** 及与百度、腾讯等平台的合作,其已具备多模态功能。用户若需多模态支持,可通过特定接口或部署扩展版本实现图文协同推理。
- 基于vLLM、Ollama的DeepSeek R1全系列模型部署教程 . . .
基于DeepSeek-R1的推理能力,通过蒸馏技术将推理能力迁移到较小的模型上,在保持高效性能的同时,成功降低了计算成本,实现了“小身材、大智慧”的完美平衡!该镜像使用vLLM部署提供支持,适用于高性能大语言模型的推理和微调任务,
|
|
|