条件生成和理解 统一多模态大模型!PUMA 着色 修复 编辑 多粒度策略笑傲生成

条件生成和理解 统一多模态大模型!PUMA 着色 修复 编辑 多粒度策略笑傲生成

文章链接,https,arxiv.orgpdf2410.13861项目链接,https,github.comrongyaofangPUMA亮点直击多粒度特征处理,PUMA能够同时处理粗粒度和细粒度的视觉特征,适应不同任务的需求,如文本到图像......
admigg 11-14
617 638 215
​无需昂贵标注!大幅提升SDXL和SD3

​无需昂贵标注!大幅提升SDXL和SD3

文章链接,https,arxiv.orgpdf2410.18013亮点直击合成标注偏好数据集,SynPic,从不同的T2I模型生成图像,并通过多个预训练的奖励模型对其进行标注,这些模型可以估计人类偏好,因此,数据收集过程中无需人工标注,使得......
admigg 11-14
745 630 545
港理工&amp AI联合发布一致且高效的3D场景编辑方法 Stability OPPO&amp

港理工&amp AI联合发布一致且高效的3D场景编辑方法 Stability OPPO&amp

文章链接,https,arxiv.orgpdf2406.17396项目链接,https,lslrh.github.iosyncnoise.github.io一句话亮点直击SyncNoise能够实现一致且高效的3D编辑,符合文本指令并保留编辑......
admigg 11-14
668 572 363
你的LoRA需要更新了!科大讯飞等提出MiLoRA 新颖且高效的LoRA变体

你的LoRA需要更新了!科大讯飞等提出MiLoRA 新颖且高效的LoRA变体

论文链接,https,arxiv.orgpdf2410.18035低秩适应,LoRA,及其专家混合,MOE,变体是非常有效的参数高效微调,PEFT,方法,然而,由于在Transformer层中添加了LoRA模块和MOErouters,这些方......
admigg 11-14
676 633 699
英伟达&amp 从真实世界观测中生成机器人仿真任务 斯坦福大学发布GRS

英伟达&amp 从真实世界观测中生成机器人仿真任务 斯坦福大学发布GRS

文章链接,https,arxiv.orgpdf2410.15536亮点直击提出了一种实现真实到模拟仿真生成的新颖系统;在一系列真实和模拟测试中展示了该方法的高效性,总结速览解决的问题,GRS系统旨在解决机器人、计算机视觉和ARVR中的&am......
admigg 11-14
741 386 585
突破个性化图像生成局限!MagicTailor 组件可控个性化图像生成创新框架!

突破个性化图像生成局限!MagicTailor 组件可控个性化图像生成创新框架!

文章链接,https,arxiv.orgpdf2410.13370项目链接,https,correrzhou.github.ioMagicTailor亮点直击引入了一项名为组件可控个性化的新任务,使T2I模型在个性化过程中能够精确控制概念的......
admigg 11-14
216 176 310
让移动成像技术飞跃 AI手机迎来重大技术进展!Meissonic ​颜水成团队新作

让移动成像技术飞跃 AI手机迎来重大技术进展!Meissonic ​颜水成团队新作

文章链接,https,arxiv.orgpdf2410.08261模型链接,https,huggingface.coMeissonFlowMeissonic在线Demo链接,https,huggingface.cospacesMeisson......
admigg 11-14
964 188 362
LLM新巅峰

LLM新巅峰

本文提出了mllmNPU,这是第一个有效利用设备上神经处理单元,NPU,卸载的LLM推理系统,mllmNPU的主要设计目标是减少预填充延迟和能耗,它针对主流的仅解码器的变压器架构的LLM,例如LlaMA、GPT等,关键思想是最大限度地在移动......
admigg 11-14
337 469 335
字节跳动发布统一多模态大模型 Show

字节跳动发布统一多模态大模型 Show

引言,多模态理解与生成的新篇章在人工智能的发展历程中,多模态理解与生成一直是研究的热点领域,随着技术的进步,从单一模态到多模态的转变,使得机器能够更全面地理解和生成信息,极大地拓宽了人工智能的应用范围,本文介绍的研究成果,展示了如何通过一个......
admigg 11-14
399 200 652
阿里巴巴提出CODEXGRAPH 引领软件工程新革命 打破大模型与代码库的壁垒

阿里巴巴提出CODEXGRAPH 引领软件工程新革命 打破大模型与代码库的壁垒

在现代软件工程中,大型语言模型,LLMs,在处理独立的代码任务方面表现出色,例如HumanEval和MBPP,但在处理整个代码库时却遇到了困难,这一挑战促使研究人员探索在代码库规模上增强LLM与代码库的交互,目前的解决方案依赖于基于相似性的......
admigg 11-14
372 220 582