|
- 哪里可以快速找到自己想用的数据集? - 知乎
最好是用户流失预测的开源领域的 HuggingFace:主要包含大模型相关数据集。 Kaggle: 机器学习数据集。 Github: 需要花点时间找。 国内开源的 OpenDataLab: 上海人工智能实验室。 ModelScope: 国内的HuggingFace。 国内数据交易场所 上海数据交易所。 西部数据交易所。 浙江数据交易所。
- 都说DeepSeek是开源大模型,它开源了啥? - 知乎
这是开放权重的模型,不算开源软件意义上的开源。 真正的开源大模型要开放训练代码、数据集甚至要包括随机数种子以确保可以重现,但这是不现实的,现有的训练方法做不到reproducible build,自然也就丧失了一部分开源训练代码的意义,无论如何都不能100%精准复现。 DeepSeek还采用了编写PTX汇编的
- 目前,国内外都有哪些质量比较高的具身智能开源数据集? - 知乎
开源数据集转换: 选择了3个开源的具身数据集,将其转换为符合ARIO 格式标准的数据。 通过该方式获取的数据量最多,占比为62 4%,共转换成功有161个场景序列、319761个任务、2326438个轨迹片段。
- 深度学习顶会,为什么公开数据集,代码,也跑不出论文的结果? - 知乎
深度学习顶会,为什么公开数据集,代码,也跑不出论文的结果? 看了几篇深度学习的顶会论文,发现好多篇自己跑出来都达不到文章里面写的准确度或者AUROC等指标(有的跑出来和原文相差9%,最少的也差3%左右。
- 想问一下半导体晶圆缺陷检测的数据集去哪找呀? - 知乎
想问一下半导体晶圆缺陷检测的数据集去哪找呀? 做计算机视觉的缺陷检测 显示全部 关注者 20
- 请问哪里可以找到公开的中文文本大数据集? - 知乎
虽然这个问题比较冷清,但我们都明白充足的文本数据集对于自然语言处理领域的研究有多重要,因此我们从网络上收集了 20 个大型中文文本数据集或数据源,其中不少数据集相当给力,比如中华古诗词数据集、中文人名语料库和中文简称数据集等。希望对大家从事 NLP 相关项目时有所帮助。 中
- 学位论文可以用别人爬取的数据作为研究数据吗? - 知乎
开源数据作为研究数据是很正常也很普遍的一件事情。至少对于工科来说,在相同的 开源数据集 下,对不同的方法进行结果优劣比较,是一种最常见的实验方式。 在论文里直接说明数据来源就可以了。通常分享开源数据集的个人或是组织也会有声明,要求进行引用说明。正常在参考文献中引用即可
- 有没有PET CT医学图像开源数据集? - 知乎
CT数据集现在开源的很多了,深度学习分割分类检测的工作也很多,但是PET数据或者PET CT开源数据集很少,想问问哪里有开源的pet ct数据集 显示全部 关注者 8 被浏览
|
|
|