微软 罗切斯特大学&amp 图像编辑多任务一网打尽!PromptFix 大规模视觉指令数据集 新型扩散模型&amp

微软 罗切斯特大学&amp 图像编辑多任务一网打尽!PromptFix 大规模视觉指令数据集 新型扩散模型&amp

文章链接,https,arxiv.orgpdf2405.16785项目链接,https,www.yongshengyu.comPromptFixPage亮点直击提出了一个为七个图像处理任务量身定制的综合数据集,该数据集包含约101万对多样化......
admigg 11-14
722 431 651
条件生成和理解 统一多模态大模型!PUMA 着色 修复 编辑 多粒度策略笑傲生成

条件生成和理解 统一多模态大模型!PUMA 着色 修复 编辑 多粒度策略笑傲生成

文章链接,https,arxiv.orgpdf2410.13861项目链接,https,github.comrongyaofangPUMA亮点直击多粒度特征处理,PUMA能够同时处理粗粒度和细粒度的视觉特征,适应不同任务的需求,如文本到图像......
admigg 11-14
617 665 339
​无需昂贵标注!大幅提升SDXL和SD3

​无需昂贵标注!大幅提升SDXL和SD3

文章链接,https,arxiv.orgpdf2410.18013亮点直击合成标注偏好数据集,SynPic,从不同的T2I模型生成图像,并通过多个预训练的奖励模型对其进行标注,这些模型可以估计人类偏好,因此,数据收集过程中无需人工标注,使得......
admigg 11-14
745 346 875
港理工&amp AI联合发布一致且高效的3D场景编辑方法 Stability OPPO&amp

港理工&amp AI联合发布一致且高效的3D场景编辑方法 Stability OPPO&amp

文章链接,https,arxiv.orgpdf2406.17396项目链接,https,lslrh.github.iosyncnoise.github.io一句话亮点直击SyncNoise能够实现一致且高效的3D编辑,符合文本指令并保留编辑......
admigg 11-14
668 470 598
你的LoRA需要更新了!科大讯飞等提出MiLoRA 新颖且高效的LoRA变体

你的LoRA需要更新了!科大讯飞等提出MiLoRA 新颖且高效的LoRA变体

论文链接,https,arxiv.orgpdf2410.18035低秩适应,LoRA,及其专家混合,MOE,变体是非常有效的参数高效微调,PEFT,方法,然而,由于在Transformer层中添加了LoRA模块和MOErouters,这些方......
admigg 11-14
676 363 634
英伟达&amp 从真实世界观测中生成机器人仿真任务 斯坦福大学发布GRS

英伟达&amp 从真实世界观测中生成机器人仿真任务 斯坦福大学发布GRS

文章链接,https,arxiv.orgpdf2410.15536亮点直击提出了一种实现真实到模拟仿真生成的新颖系统;在一系列真实和模拟测试中展示了该方法的高效性,总结速览解决的问题,GRS系统旨在解决机器人、计算机视觉和ARVR中的&am......
admigg 11-14
741 535 771
突破个性化图像生成局限!MagicTailor 组件可控个性化图像生成创新框架!

突破个性化图像生成局限!MagicTailor 组件可控个性化图像生成创新框架!

文章链接,https,arxiv.orgpdf2410.13370项目链接,https,correrzhou.github.ioMagicTailor亮点直击引入了一项名为组件可控个性化的新任务,使T2I模型在个性化过程中能够精确控制概念的......
admigg 11-14
216 245 833
让移动成像技术飞跃 AI手机迎来重大技术进展!Meissonic ​颜水成团队新作

让移动成像技术飞跃 AI手机迎来重大技术进展!Meissonic ​颜水成团队新作

文章链接,https,arxiv.orgpdf2410.08261模型链接,https,huggingface.coMeissonFlowMeissonic在线Demo链接,https,huggingface.cospacesMeisson......
admigg 11-14
964 365 576
LLM新巅峰

LLM新巅峰

本文提出了mllmNPU,这是第一个有效利用设备上神经处理单元,NPU,卸载的LLM推理系统,mllmNPU的主要设计目标是减少预填充延迟和能耗,它针对主流的仅解码器的变压器架构的LLM,例如LlaMA、GPT等,关键思想是最大限度地在移动......
admigg 11-14
337 245 581
字节跳动发布统一多模态大模型 Show

字节跳动发布统一多模态大模型 Show

引言,多模态理解与生成的新篇章在人工智能的发展历程中,多模态理解与生成一直是研究的热点领域,随着技术的进步,从单一模态到多模态的转变,使得机器能够更全面地理解和生成信息,极大地拓宽了人工智能的应用范围,本文介绍的研究成果,展示了如何通过一个......
admigg 11-14
399 644 608