GLM4模型开源 意料之中的尺寸 意料之外的效果

GLM4模型开源 意料之中的尺寸 意料之外的效果

今天智谱开了GLM49B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM49B,、Chat版本模型,GLM49BChat和GLM49BChat1M,和多模态模型,GLM4V9BChat,其中,模型为多语言模型除了支持中......
admigg 11-14
713 335 320
综述

综述

大家好,我是刘聪NLP,大模型已经展现出了较强的文本生成能力,但随着使用场景变得越加复杂和严格,除了避免生成误导或不当言论内容外,往往还希望可以满足用户的特殊需求,而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时,保证文本符......
admigg 11-14
926 303 644
LLM实践系列

LLM实践系列

经过了数据收集、筛选、去重,马上就可以开始训练实验了,但是在实验之前,我们还需要先获取一个语言模型的基石,分词器,Tokenizer,Tokenizer的作用是对一条文本数据进行切分、词表映射,得到这条文本的token序列,用开源Token......
admigg 11-14
166 676 381
将端侧大模型进行到底

将端侧大模型进行到底

面壁一直都在做端侧大模型,之前有文本系列MiniCPM2B模型,还有多模态系列的MiniCPMV系列模型,今天又开源了MiniCPM34B模型,真是端侧一路走到低,这次MiniCPM34B也是在效果上有了巨大的提升,超过Phi3.5mini......
admigg 11-14
387 138 254
小模型 VS 大模型

小模型 VS 大模型

首先,我们思考一个问题,为什么qwen2基本上是当下最受欢迎的开源模型,说实话,相比于deepseek、llama、minicpm这些诚意满满的技术报告,qwen2的技术报告稍显一些&amp,ldquo,小家子气&amp,r......
admigg 11-14
577 416 510
具有空间意识的文本 谷歌&amp Mistral AI发布TIPS

具有空间意识的文本 谷歌&amp Mistral AI发布TIPS

文章链接,https,arxiv.orgpdf2410.16512亮点直击通用图像表示模型,TIPS结合图像文本和自监督学习的优势,适用于密集和全局预测任务,实现了广泛的下游应用,增强的文本监督信号,利用合成生成的图像描述标签,提升了模型对......
admigg 11-14
741 205 236
2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向,前言纯属brainstorm,欢迎大家一起探讨,想到哪里说到哪里,有遗漏的点欢迎大家在评论区中指出,个人认为现在LLM能做的点还很多,这个行业距离饱和还有一段距离,这里通过&amp,ldq......
admigg 11-14
156 240 872
首次超越扩散模型和非自回归Transformer模型!字节开源RAR 自回归生成最新SOTA!

首次超越扩散模型和非自回归Transformer模型!字节开源RAR 自回归生成最新SOTA!

文章链接,https,arxiv.orgpdf2411.00776项目链接,https,yucornetto.github.ioprojectsrar.html代码&amp,amp,模型链接,https,github.combyte......
admigg 11-14
226 625 276
定制化视频生成新模范!零样本主体驱动 精确运动控制!复旦&amp 阿里等发布DreamVideo

定制化视频生成新模范!零样本主体驱动 精确运动控制!复旦&amp 阿里等发布DreamVideo

文章链接,https,arxiv.orgpdf2410.13830项目链接,https,dreamvideo2.github.io亮点直击DreamVideo2,首个无需微调,同时支持主体定制和运动控制的零样本视频定制框架,能够通过设计的参......
admigg 11-14
133 122 645
首个离散扩散模型精确反演方法! 灵活精确可控编辑!Dice

首个离散扩散模型精确反演方法! 灵活精确可控编辑!Dice

文章链接,https,arxiv.orgpdf2410.08207项目链接,https,hexiaoxiaocs.github.ioDICE亮点直击引入了DICE,一种用于离散扩散模型,包括多项扩散和mask生成模型,的反演算法,通过记录并......
admigg 11-14
292 445 361