液态智能的新篇章 AI发布液态基础模型 Liquid
01概述在人工智能的世界里,每一轮技术革新都可能颠覆我们对未来的认知,今天,我们要探讨的正是液态智能,LiquidAI,公司带来的全新系列&,mdash,&,mdash,液态基础模型,LiquidFoundati......
北大联合MSRA提出PoSE 用短输入模拟长样本 高效拓展LLM上下文窗口
论文题目,PoSE,EfficientContextWindowExtensionofLLMsviaPositionalSkipwiseTraining论文链接,https,arxiv.orgabs2309.10代码链接,https,git......
最强GPT 长上下文能力只是吹牛
大数字一向吸引眼球,千亿参数、万卡集群,&,mdash,&,mdash,还有各大厂商一直在卷的超长上下文,从一开始的几K几十K,发展到了如今的百万token级别,Gemini的最新版本可以接收200万个token......
复杂微调 LLM上下文窗口突破200万!无需架构变化 轻松扩展8倍
大型语言模型,LLM,往往会追求更长的,上下文窗口,,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值,catastrophicvalues,等问题,目前模型的上下文窗口大多不超过128k个token最近,MicrosoftRe......
为消除幻觉 Amazon Bedrock开大招! RAG 推出上下文基础和 连接器!
本周三,亚马逊网络服务,AWS,宣布更新其生成式AI开发服务AmazonBedrock,增加了新的上下文基础功能、检索增强生成,RAG,的连接器以及其他大型语言模型,LLM,据亚马逊生成式人工智能副总裁瓦西&,middot,菲......
3.2 Molmo Llama Vision & 多模态开源生态系统基础
编者按,视觉功能的融入对模型能力和推理方式的影响如何,当我们需要一个既能看懂图像、又能生成文本的AI助手时,是否只能依赖于GPT4V这样的闭源解决方案,我们今天为大家分享的这篇文章,作者的核心观点是,多模态语言模型领域正处于快速发展阶段,L......
具备自我学习 Agent 评估的智能体 Q
GPT4、Gemini等大模型在自然语言处理任务中取得了进步,但在交互式、多步骤环境中的泛化能力仍有欠缺,例如,当我们在网上购买一件特定的商品时,需要在众多网页中进行搜索、比较和选择,AGI平台MultiOn和斯坦福的研究人员联合开发了一种......
多智能体 Multi
嘿,大家好!这里是一个专注于AI智能体的频道!今天来简单聊聊Multiagent系统,明天会分享一个简单的多智能体系统实战~,MultiAgent系统到底是啥,想象一下,如果有一个团队,每个成员都有自己的角色和任务,但又能互相协作,共同完成......
AI大模型时代 Agent智能体开发的三重境界
一、第一重境界,当作能理解语义的API使用Agent智能体第一重境界,可以把大型语言模型看成一个特别的API,它能读懂人类语言,就像我们平时调用其他API那样,我们向智能体提问,它就能给出经过自己思考的答案,这个阶段的智能体,通常是把这种读......
LLM原生开发路线图指南
译者朱先忠审校重楼引言大型语言模型,LLM,正在迅速成为现代人工智能的基石,然而,目前还没有出现公认的最佳实践,而且先驱们往往没有明确的开发路线图,因此,这种状况急需要有人重新发明有关轮子;否则,将会使人陷入困境,在过去的两年里,我帮助一些......