成年人当然是全都要 小孩子才做选择 大模型微调哪家好

成年人当然是全都要 小孩子才做选择 大模型微调哪家好

一、概述title,UNIPELT,AUnifiedFrameworkforParameterEfficientLanguageModelTuning论文地址,https,arxiv.orgabs2110.07577代码,https,git......
admigg 11-14
930 320 304
Step by Let Verify s OpenAI Step详细解读

Step by Let Verify s OpenAI Step详细解读

一、概述title,Let,sVerifyStepbyStep论文地址,https,arxiv.orgabs2305.20050代码,https,github.comopenaiprm800k1.1Motivation近期大模型的出现极大的......
admigg 11-14
639 688 890
embedding模型 Microsoft 利用LLM本身训练SoTA

embedding模型 Microsoft 利用LLM本身训练SoTA

大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做......
admigg 11-14
265 272 290
Thought Tree TOT of

Thought Tree TOT of

今天分享一篇普林斯顿大学的一篇文章,TreeofThoughts,DeliberateProblemSolvingwithLargeLanguageModels[1],思维之树,用大型语言模型解决复杂问题,这篇工作还是非常有借鉴意义的,Op......
admigg 11-14
929 403 497
再也不用担心做科研没有思路了 ResearchAgent 利用agent自动生成论文idea

再也不用担心做科研没有思路了 ResearchAgent 利用agent自动生成论文idea

大家好,我是HxShine今天分享微软的一篇文章,ResearchAgent,IterativeResearchIdeaGenerationoverScientificLiteraturewithLargeLanguageModels,传统......
admigg 11-14
923 104 563
2023 EMNLP

2023 EMNLP

一、概述Title,PromptMix,AClassBoundaryAugmentationMethodforLargeLanguageModelDistillationURL,​​https,arxiv.orgabs2310.14192​......
admigg 11-14
663 695 522
LLama2详细解读

LLama2详细解读

一、概述Title,Llama2,OpenFoundationandFineTunedChatModels论文地址,Llama2,OpenFoundationandFineTunedChatModels代码,​​https,github.c......
admigg 11-14
611 169 707
EMNLP 利用LLM合成数据训练模型有哪些坑 2023

EMNLP 利用LLM合成数据训练模型有哪些坑 2023

大家好,我是HxShine今天我们将介绍EMNLP2023的一篇大模型,LLMs,生成文本分类任务合成数据的文章,标题是,SyntheticDataGenerationwithLargeLanguageModelsforTextClassi......
admigg 11-14
121 533 808
一种利用LLM提升多轮会话检索的效果的方案 LLM4CS

一种利用LLM提升多轮会话检索的效果的方案 LLM4CS

大家好,我是HxShine今天分享一篇人大的文章,大型语言模型知道您的会话上下文搜索意图,LargeLanguageModelsKnowYourContextualSearchIntent,APromptingFrameworkforCon......
admigg 11-14
534 551 225
embedding模型 利用LLM本身训练SoTA

embedding模型 利用LLM本身训练SoTA

大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做......
admigg 11-14
322 245 807