清言_第79页_朵贝贝家具网

GLM4模型开源意料之中的尺寸意料之外的效果

今天智谱开了GLM49B的模型，不是6B，是9B，一共开源了四个模型，Base版本模型，GLM49B，、Chat版本模型，GLM49BChat和GLM49BChat1M，和多模态模型，GLM4V9BChat，其中，模型为多语言模型除了支持中......

生活杂谈

admigg 11-14

713 335 320

综述

大家好，我是刘聪NLP，大模型已经展现出了较强的文本生成能力，但随着使用场景变得越加复杂和严格，除了避免生成误导或不当言论内容外，往往还希望可以满足用户的特殊需求，而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时，保证文本符......

居家知识

admigg 11-14

926 303 644

LLM实践系列

经过了数据收集、筛选、去重，马上就可以开始训练实验了，但是在实验之前，我们还需要先获取一个语言模型的基石，分词器，Tokenizer，Tokenizer的作用是对一条文本数据进行切分、词表映射，得到这条文本的token序列，用开源Token......

生活常识

admigg 11-14

166 676 381

将端侧大模型进行到底

面壁一直都在做端侧大模型，之前有文本系列MiniCPM2B模型，还有多模态系列的MiniCPMV系列模型，今天又开源了MiniCPM34B模型，真是端侧一路走到低，这次MiniCPM34B也是在效果上有了巨大的提升，超过Phi3.5mini......

资讯

admigg 11-14

387 138 254

小模型 VS 大模型

首先，我们思考一个问题，为什么qwen2基本上是当下最受欢迎的开源模型，说实话，相比于deepseek、llama、minicpm这些诚意满满的技术报告，qwen2的技术报告稍显一些&amp，ldquo，小家子气&amp，r......

国内资讯

admigg 11-14

577 416 510

具有空间意识的文本谷歌&amp Mistral AI发布TIPS

文章链接，https，arxiv.orgpdf2410.16512亮点直击通用图像表示模型，TIPS结合图像文本和自监督学习的优势，适用于密集和全局预测任务，实现了广泛的下游应用，增强的文本监督信号，利用合成生成的图像描述标签，提升了模型对......

文化宣传

admigg 11-14

741 205 236

2024年大模型LLM还有哪些可研究的方向听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向，前言纯属brainstorm，欢迎大家一起探讨，想到哪里说到哪里，有遗漏的点欢迎大家在评论区中指出，个人认为现在LLM能做的点还很多，这个行业距离饱和还有一段距离，这里通过&amp，ldq......

产品服务

admigg 11-14

156 240 872

首次超越扩散模型和非自回归Transformer模型！字节开源RAR 自回归生成最新SOTA！

文章链接，https，arxiv.orgpdf2411.00776项目链接，https，yucornetto.github.ioprojectsrar.html代码&amp，amp，模型链接，https，github.combyte......

文化宣传

admigg 11-14

226 625 276

定制化视频生成新模范！零样本主体驱动精确运动控制！复旦&amp 阿里等发布DreamVideo

文章链接，https，arxiv.orgpdf2410.13830项目链接，https，dreamvideo2.github.io亮点直击DreamVideo2，首个无需微调，同时支持主体定制和运动控制的零样本视频定制框架，能够通过设计的参......

资讯

admigg 11-14

133 122 645

首个离散扩散模型精确反演方法！灵活精确可控编辑！Dice

文章链接，https，arxiv.orgpdf2410.08207项目链接，https，hexiaoxiaocs.github.ioDICE亮点直击引入了DICE，一种用于离散扩散模型，包括多项扩散和mask生成模型，的反演算法，通过记录并......

国内资讯

admigg 11-14

292 445 361

首页

末页