LLM实践系列

LLM实践系列

经过了数据收集、筛选、去重,马上就可以开始训练实验了,但是在实验之前,我们还需要先获取一个语言模型的基石,分词器,Tokenizer,Tokenizer的作用是对一条文本数据进行切分、词表映射,得到这条文本的token序列,用开源Token......
admigg 11-14
166 651 287
将端侧大模型进行到底

将端侧大模型进行到底

面壁一直都在做端侧大模型,之前有文本系列MiniCPM2B模型,还有多模态系列的MiniCPMV系列模型,今天又开源了MiniCPM34B模型,真是端侧一路走到低,这次MiniCPM34B也是在效果上有了巨大的提升,超过Phi3.5mini......
admigg 11-14
387 585 830
小模型 VS 大模型

小模型 VS 大模型

首先,我们思考一个问题,为什么qwen2基本上是当下最受欢迎的开源模型,说实话,相比于deepseek、llama、minicpm这些诚意满满的技术报告,qwen2的技术报告稍显一些&amp,ldquo,小家子气&amp,r......
admigg 11-14
577 629 467
具有空间意识的文本 谷歌&amp Mistral AI发布TIPS

具有空间意识的文本 谷歌&amp Mistral AI发布TIPS

文章链接,https,arxiv.orgpdf2410.16512亮点直击通用图像表示模型,TIPS结合图像文本和自监督学习的优势,适用于密集和全局预测任务,实现了广泛的下游应用,增强的文本监督信号,利用合成生成的图像描述标签,提升了模型对......
admigg 11-14
741 225 254
2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向,前言纯属brainstorm,欢迎大家一起探讨,想到哪里说到哪里,有遗漏的点欢迎大家在评论区中指出,个人认为现在LLM能做的点还很多,这个行业距离饱和还有一段距离,这里通过&amp,ldq......
admigg 11-14
156 484 242
首次超越扩散模型和非自回归Transformer模型!字节开源RAR 自回归生成最新SOTA!

首次超越扩散模型和非自回归Transformer模型!字节开源RAR 自回归生成最新SOTA!

文章链接,https,arxiv.orgpdf2411.00776项目链接,https,yucornetto.github.ioprojectsrar.html代码&amp,amp,模型链接,https,github.combyte......
admigg 11-14
226 143 338
定制化视频生成新模范!零样本主体驱动 精确运动控制!复旦&amp 阿里等发布DreamVideo

定制化视频生成新模范!零样本主体驱动 精确运动控制!复旦&amp 阿里等发布DreamVideo

文章链接,https,arxiv.orgpdf2410.13830项目链接,https,dreamvideo2.github.io亮点直击DreamVideo2,首个无需微调,同时支持主体定制和运动控制的零样本视频定制框架,能够通过设计的参......
admigg 11-14
133 290 666
首个离散扩散模型精确反演方法! 灵活精确可控编辑!Dice

首个离散扩散模型精确反演方法! 灵活精确可控编辑!Dice

文章链接,https,arxiv.orgpdf2410.08207项目链接,https,hexiaoxiaocs.github.ioDICE亮点直击引入了DICE,一种用于离散扩散模型,包括多项扩散和mask生成模型,的反演算法,通过记录并......
admigg 11-14
292 313 233
微软 罗切斯特大学&amp 图像编辑多任务一网打尽!PromptFix 大规模视觉指令数据集 新型扩散模型&amp

微软 罗切斯特大学&amp 图像编辑多任务一网打尽!PromptFix 大规模视觉指令数据集 新型扩散模型&amp

文章链接,https,arxiv.orgpdf2405.16785项目链接,https,www.yongshengyu.comPromptFixPage亮点直击提出了一个为七个图像处理任务量身定制的综合数据集,该数据集包含约101万对多样化......
admigg 11-14
722 198 494
条件生成和理解 统一多模态大模型!PUMA 着色 修复 编辑 多粒度策略笑傲生成

条件生成和理解 统一多模态大模型!PUMA 着色 修复 编辑 多粒度策略笑傲生成

文章链接,https,arxiv.orgpdf2410.13861项目链接,https,github.comrongyaofangPUMA亮点直击多粒度特征处理,PUMA能够同时处理粗粒度和细粒度的视觉特征,适应不同任务的需求,如文本到图像......
admigg 11-14
617 599 693