排序
免费获取试用API方法 大模型 LLM 付费API计费方式 API的使用
API,应用程序编程接口,ApplicationProgrammingInterface,是一组定义和协议,用于构建和集成应用程序软件,API允许不同的软件系统之间进行通信和数据交换,大模型API是大模型应用开发的基础,API的使用不需要......
清华大学提出1
在深度神经网络的训练过程中,全量化训练,FullyQuantizedTraining,FQT,通过将激活值、权重和梯度量化到较低的精度,显著加速了训练过程,随着对训练数值精度的不断压缩,一个自然而然的问题浮现出来,全量化训练的极限是什么,即......
速度秒杀GPT
真正Open的AI公司Mistral又低调上新了,这次,他们发布了首款代码生成模型Codestral,支持80多种编程语言以及32K长上下文窗口,不仅在基准测试上取得了惊艳的表现,而且代码生成的速度也让试用的网友非常满意,目前,Codest......
大模型训练的难点在哪里 关于大模型微调与训练的问题
&,ldquo,大模型训练的难点不在于大模型本身,而在于训练数据&,rdquo,这两天公众号上有一个小兄弟问我关于大模型训练的问题,然后他想自己训练一个小模型,但又不知道该怎么操作;所以,今天就再来讨论一下大模......
彻底革新了人工智能音乐创作 Suno 一个眨眼间的歌曲 v3
想象一下,在几秒钟内就能创作出一首完整、专业听起来的歌曲,不需要多年磨练音乐技艺,也不需要掌握复杂的音乐制作软件&,mdash,&,mdash,只需要用几个词描述你的想法,这就是SunoAI提供的东西,这是一款开......
智能体的社会进化 人工智能利维坦 从霍布斯社会契约论视角探索LLM
随着人工智能在解决复杂问题的深入,我们急需探索LLM智能体在模拟环境中的社会行为,特别是它们如何从自然状态过渡到建立社会契约的联邦状态,核心问题包括LLM智能体是否能够展现出类似人类的社会契约形成过程,不同的环境和智能体参数如何影响这一过程......
Agent也有快慢脑了!这次真的不一样
在与用户进行自然对话交互时,智能体需要完成两个核心任务,一是进行对话交流,二是执行推理与规划,智能体在对话过程中,需要综合利用所有可获取的信息来做出回应,同时其行为要始终围绕目标展开,这种对话交互与多步推理规划的双重模式,与卡尼曼所描述的人......
RAG高级优化 基于问题生成的文档检索增强
我们将在本文中介绍一种文本增强技术,该技术利用额外的问题生成来改进矢量数据库中的文档检索,通过生成和合并与每个文本片段相关的问题,增强系统标准检索过程,从而增加了找到相关文档的可能性,这些文档可以用作生成式问答的上下文,实现步骤通过用相关问......
StaR 用少量推理数据让模型学会通用推理能力 显著提升模型复杂推理
今天分享GoogleResearch的一篇文章,可能OpenAIo1也采用了类似的技术,标题是STaR,BootstrappingReasoningWithReasoning,这篇文章提出了一种利用语言模型自我生成推理的技术,称为&......
如何改良基于Basis的时间序列预测模型
今天介绍一篇NIPS2023中上海交大和蚂蚁集团联合发表的时间序列预测文章,基于basis的时间序列建模,目前代码已经开源,论文的详细信息如下,论文标题,BasisFormer,AttentionbasedTimeSeriesForecas......