|
- 目前国内有哪些开源多模态大模型? - 知乎
大家好,我是 Ai 学习的老章 最近除了 阿里 Qwen3 模型更新了图片生成和处理能力,大家都可以玩转吉卜力风格 还有几个最近发布的大模型值得关注 • 1 是腾讯开源了 80B 混元 A13B 模型,亮点是精度无损的 int4 很能打 • 2 是谷歌开源的小参数 Gemma 3n 多模态大模型,亮点是可以在手机端运行 • 3 是我
- 多模态大模型的时代真的来了吗? - 知乎
在知乎撰文的时候通常我会把结论写在开头然后再慢慢陈述论证过程,但对于多模态大模型这个一直非常吸引我的人工智能细分领域,容许我留点悬念,逐步把结果抛出来。 多模态大模型的发展历史和现状 不知道各位第一次听说“ 多模态(Multimodal) ”这个名词是什么时候。 遥想国内第一款大模型
- 多模态大模型的时代真的来了吗? - 知乎
图1 现有研究与我们的UrbanLLaVA在城市研究中的对比。 UrbanLLaVA:首个“全栈型”城市智能模型 于是,论文作者团队推出了 UrbanLLaVA ——专为城市智能设计的多模态大模型。它的核心目标只有一个:让AI真正“打通”城市的四类核心数据,实现从 看懂局部 到 理解全局 的跨越。 为什么说它重要?举个
- 谷歌发布最新大模型 Gemini,包含多模态、三大版本,还有哪些特点?能力是否超越 GPT-4了? - 知乎
如果仔细分析技术报告,结论很可能是这样的:在数学逻辑等基础学科能力上来看,Gemini Ultra可能不如GPT 4,多模态能力上应该强于GPT 4V。 Google Gemini技术报告要点提炼如下: 1 技术报告60页,没有透漏具体技术细节,大部分是评测,技术报告作者列表包含9页内容,超过700人,应该接近OpenAI的员工
- 目前国内有哪些开源多模态大模型? - 知乎
在GPT-4发布之后,国内涌现出一大批多模态大模型,本节将重点介绍其中比较有代表性的3个模型,分别 为LLaMA-Adapter V2、VisualGLM-6B和mPLUG-Owl 模型,希望让读者对国内多模态大模型的最新进展有所了解。
- CVPR 2025有哪些值得关注的文章? - 知乎
据统计,CVPR 2025共收到13,008篇有效投稿,最终接收了2,878篇论文,接收率为 22 1%。 为了更好的搞好我的AI4Science研究(水文章),虽然不是科班出身,但每年还是要关注一下这场计算机视觉领域最受瞩目的会议。 不过将近3000篇论文,全都看一遍是不可能的。 我找到了一个report,据说是由IEEE计算机
- 继70亿参数大模型后,阿里云又开源通义千问「多模态大模型」,如何看待这一举措?将对行业产生哪些影响? - 知乎
继本月初魔搭社区宣布上架两款70亿参数开源模型QWen-7B和QWen-7B-Chat后,仅隔不到20天,阿里云再次宣布…
- 多模态大模型的应用场景有哪些? - 知乎
老师会告诉你怎样在没有研发人员帮助的前提下,利用大模型实现自己需要的一些功能。并且会讲解一些最新的落地应用,让你轻轻松松构建出各种能够落地的实用小程序,享受大模型带来的便利。 其实在一些我们普通人注意不到的领域,多模态大模型早已经偷偷投入使用了。 Ninety-eight percent of
|
|
|