清言_第80页_朵贝贝家具网

微软罗切斯特大学&amp 图像编辑多任务一网打尽！PromptFix 大规模视觉指令数据集新型扩散模型&amp

文章链接，https，arxiv.orgpdf2405.16785项目链接，https，www.yongshengyu.comPromptFixPage亮点直击提出了一个为七个图像处理任务量身定制的综合数据集，该数据集包含约101万对多样化......

企业

admigg 11-14

722 431 651

条件生成和理解统一多模态大模型！PUMA 着色修复编辑多粒度策略笑傲生成

文章链接，https，arxiv.orgpdf2410.13861项目链接，https，github.comrongyaofangPUMA亮点直击多粒度特征处理，PUMA能够同时处理粗粒度和细粒度的视觉特征，适应不同任务的需求，如文本到图像......

生活杂谈

admigg 11-14

617 665 339

无需昂贵标注！大幅提升SDXL和SD3

文章链接，https，arxiv.orgpdf2410.18013亮点直击合成标注偏好数据集，SynPic，从不同的T2I模型生成图像，并通过多个预训练的奖励模型对其进行标注，这些模型可以估计人类偏好，因此，数据收集过程中无需人工标注，使得......

维修知识

admigg 11-14

745 346 875

港理工&amp AI联合发布一致且高效的3D场景编辑方法 Stability OPPO&amp

文章链接，https，arxiv.orgpdf2406.17396项目链接，https，lslrh.github.iosyncnoise.github.io一句话亮点直击SyncNoise能够实现一致且高效的3D编辑，符合文本指令并保留编辑......

艺术宣传

admigg 11-14

668 470 598

你的LoRA需要更新了！科大讯飞等提出MiLoRA 新颖且高效的LoRA变体

论文链接，https，arxiv.orgpdf2410.18035低秩适应，LoRA，及其专家混合，MOE，变体是非常有效的参数高效微调，PEFT，方法，然而，由于在Transformer层中添加了LoRA模块和MOErouters，这些方......

居家知识

admigg 11-14

676 363 634

英伟达&amp 从真实世界观测中生成机器人仿真任务斯坦福大学发布GRS

文章链接，https，arxiv.orgpdf2410.15536亮点直击提出了一种实现真实到模拟仿真生成的新颖系统；在一系列真实和模拟测试中展示了该方法的高效性，总结速览解决的问题，GRS系统旨在解决机器人、计算机视觉和ARVR中的&am......

文化宣传

admigg 11-14

741 535 771

突破个性化图像生成局限！MagicTailor 组件可控个性化图像生成创新框架！

文章链接，https，arxiv.orgpdf2410.13370项目链接，https，correrzhou.github.ioMagicTailor亮点直击引入了一项名为组件可控个性化的新任务，使T2I模型在个性化过程中能够精确控制概念的......

生活常识

admigg 11-14

216 245 833

让移动成像技术飞跃 AI手机迎来重大技术进展！Meissonic 颜水成团队新作

文章链接，https，arxiv.orgpdf2410.08261模型链接，https，huggingface.coMeissonFlowMeissonic在线Demo链接，https，huggingface.cospacesMeisson......

企业

admigg 11-14

964 365 576

LLM新巅峰

本文提出了mllmNPU，这是第一个有效利用设备上神经处理单元，NPU，卸载的LLM推理系统，mllmNPU的主要设计目标是减少预填充延迟和能耗，它针对主流的仅解码器的变压器架构的LLM，例如LlaMA、GPT等，关键思想是最大限度地在移动......

产品服务

admigg 11-14

337 245 581

字节跳动发布统一多模态大模型 Show

引言，多模态理解与生成的新篇章在人工智能的发展历程中，多模态理解与生成一直是研究的热点领域，随着技术的进步，从单一模态到多模态的转变，使得机器能够更全面地理解和生成信息，极大地拓宽了人工智能的应用范围，本文介绍的研究成果，展示了如何通过一个......

生活娱乐

admigg 11-14

399 644 608

首页

末页