从零实现大模型

从零实现大模型

传统RAGLLM预训练和微调一般都是基于公开的互联网数据,不可能包含公司内部私有数据,如果你问有关某公司的运营情况,直接基于模型参数生成的回答可能和胡说八道没什么两样,RAG,RetrievalAugmentedGeneration,的思想......
admigg 11-14
103 217 400
如何选择适合企业需求的大语言模型

如何选择适合企业需求的大语言模型

LLM正在推动各行各业的突破和效率,在选择一种模型时,企业应该考虑预期的应用、速度、安全、成本、语言和易用性,虽然与其他人工智能,AI,技术相比,生成式AI比较新,但它已经被用于支持从审查求职者到诊断和推荐疾病治疗的一系列任务,IDC预测,......
admigg 11-14
879 426 602
embedding模型 Microsoft 利用LLM本身训练SoTA

embedding模型 Microsoft 利用LLM本身训练SoTA

大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做......
admigg 11-14
265 488 876
2023 EMNLP

2023 EMNLP

一、概述Title,PromptMix,AClassBoundaryAugmentationMethodforLargeLanguageModelDistillationURL,​​https,arxiv.orgabs2310.14192​......
admigg 11-14
663 118 546
EMNLP 利用LLM合成数据训练模型有哪些坑 2023

EMNLP 利用LLM合成数据训练模型有哪些坑 2023

大家好,我是HxShine今天我们将介绍EMNLP2023的一篇大模型,LLMs,生成文本分类任务合成数据的文章,标题是,SyntheticDataGenerationwithLargeLanguageModelsforTextClassi......
admigg 11-14
121 390 222
一种利用LLM提升多轮会话检索的效果的方案 LLM4CS

一种利用LLM提升多轮会话检索的效果的方案 LLM4CS

大家好,我是HxShine今天分享一篇人大的文章,大型语言模型知道您的会话上下文搜索意图,LargeLanguageModelsKnowYourContextualSearchIntent,APromptingFrameworkforCon......
admigg 11-14
534 695 240
embedding模型 利用LLM本身训练SoTA

embedding模型 利用LLM本身训练SoTA

大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做......
admigg 11-14
322 387 612
综述

综述

大家好,我是刘聪NLP,大模型已经展现出了较强的文本生成能力,但随着使用场景变得越加复杂和严格,除了避免生成误导或不当言论内容外,往往还希望可以满足用户的特殊需求,而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时,保证文本符......
admigg 11-14
926 556 742
LLM实践系列

LLM实践系列

经过了数据收集、筛选、去重,马上就可以开始训练实验了,但是在实验之前,我们还需要先获取一个语言模型的基石,分词器,Tokenizer,Tokenizer的作用是对一条文本数据进行切分、词表映射,得到这条文本的token序列,用开源Token......
admigg 11-14
166 221 560
2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说

2024年大模型LLM还有哪些可研究的方向,前言纯属brainstorm,欢迎大家一起探讨,想到哪里说到哪里,有遗漏的点欢迎大家在评论区中指出,个人认为现在LLM能做的点还很多,这个行业距离饱和还有一段距离,这里通过&amp,ldq......
admigg 11-14
156 585 343