一文详解视觉Transformer模型压缩和加速策略 量化
论文链接,https,arxiv.orgpdf2404.10407视觉Transformer,ViT,在计算机视觉领域标志性地实现了一次革命,超越了各种任务的最先进模型,然而,它们的实际应用受到高计算和内存需求的限制,本研究通过评估......
最新进展 LMAs 一文详解多模态智能体 核心组件
文章链接,https,arxiv.orgpdf2402.15116github地址,https,github.comjun0wananawesomelargemultimodalagents大语言模型,LLMs,在为基于文本的AI智能体提供......
贝多芬的第九交响曲竟然跟材料结构有相似性 活久见 一幅艺术画作让大模型诞生新生物材料!
出品技术栈,微信号,blog51cto,太酷了,12日消息,麻省理工大学研究团队发表了一篇新的研究结果,研究发现,通过大模型的加持,科学和艺术竟然存在某种隐藏联系,进而可以生成新的生物材料,图片基于图形的人工智能模型,中,建议创建一种新的基......
NeurIPS`24
文章链接,https,arxiv.orgpdf2409.02389项目链接,https,msr3d.github.io亮点直击引入了MSQA,这是一个大规模的3D情境推理数据集,包括251K个情境问答对,利用可扩展的自动化数据生成流程,在多......
生成任意3D和4D场景!GenXD 通用3D
文章链接,https,arxiv.orgpdf2411.02319项目链接,https,genxd.github.io亮点直击设计了一个数据整理流程,从视频中获取包含可移动物体的高质量4D数据,并为30,000个视频标注了相机姿态,这个大规......
优雅谈大模型 一文读懂LoRA
Microsoft于2021年推出的LoRA是一种经济型微调模型参数的方法,现在大模型的参数规模动不动都在10亿级别以上,微调大模型,微调这里代表着SFT,例如读者将某个大模型拿到自身领域,想使用自身领域的知识再次训练和精校大模型,就属于模......
通义千问成功案例分享 HuggingFace模型转一键llamafile包完整教程
随着通义千问开源版的发布,越来越多的用户希望能在本地部署这款优秀的中文大模型,然而,传统的部署方式往往需要复杂的环境配置,让很多非技术背景的用户望而却步,今天,我要向大家介绍一个革命性的方案,将通义千问转换为Llamafile格式,实现真正......
3 迄今为止最强的开源大型语言模型! 探索Llama
在AI领在Meta的最新发布会上,公司官方宣布推出两个版本的Llama3模型,具体为80亿和700亿参数版本,这一举动不仅标志着Llama3成为目前全球最强大的开源大模型,同时也预示着人工智能技术向更高层次的跃进,Llama3的发布,是对A......
如何将模型微调效率提升2 Unsloth揭秘
在当今人工智能快速发展的时代,语言模型的应用越来越广泛,然而,要将预训练的语言模型应用到具体的任务中,往往需要进行微调,Unsloth作为一个预训练模型微调框架,因其出色的性能和独特的技术特点,受到了众多开发者的关注,本文将深入探讨Unsl......