什么是大语言模型?
大语言模型是一种人工智能模型,通常使用深度学习技术(如神经网络)来理解和生成人类语言。这些模型拥有非常多的参数,可以达到数十亿甚至更多,使得它们能够处理高度复杂的语言模式。
我们可以将大语言模型视为一个巨大的预测机器,其训练过程基于“猜词”任务:给定一段文本的开头,模型需要预测下一个词是什么。通过大量的训练数据(如互联网上的文本),模型试图理解词语和词组的用法和含义,以及它们如何组合形成意义。通过不断学习和调整参数,模型的预测能力变得越来越准确。
发展历程
LLM 生态
基座大模型
参考:大模型综合能力评测对比表
热门开发框架/平台
Langchain :是一个基于语言模型开发应用程序的框架
https://github.com/langchain-ai/langchain
LlamaIndex:是一个旨在促进私有或领域特定数据与大语言模型集成的数据框架。
https://github.com/run-llama/llama_index
Dify:是一款开源的大语言模型(LLM) 应用开发平台。
https://github.com/langgenius/dify
AutoGen:提供了一个作为高级抽象的多智能体对话框架。
https://github.com/microsoft/autogen
LangChain导言
**LangChain **是一个用于开发由大型语言模型(LLM)提供支持的应用程序的框架。
LangChain 是一个开源框架,旨在帮助开发人员构建端到端的应用程序,利用大型语言模型作为核心驱动力。它提供了一系列工具、组件和接口,简化了使用语言模型和聊天模型构建支持应用程序的过程。
LangChain 简化了 LLM 应用程序生命周期的每个阶段:
整体架构图
具体来说,该框架由以下开源库组成:
- langchain-core:基础抽象和LangChain表达式语言。
- langchain-community:第三方集成。
- 合作伙伴包(例如 langchain-openai、langchain-anthropic 等等):一些集成已进一步拆分为它们自己的轻量级包,这些包仅仅依赖于 langchain-core。
- langchain:构成应用程序认知架构的链、代理和检索策略。
- langgraph:通过将步骤建模为图中的边和节点,使用LLM构建健壮且有状态的多参与者应用程序(agent)。
- langserver:将LangChain链部署为REST API。
- LangSmith:一个开发人员平台,可让我们调试、测试、评估和监控LLM应用程序。
创始人
LangChain 是由 Harrison Chase 和 Ankush Gola 在 2023 年在美国加利福尼亚州创建的人工智能公司。Harrison Chase 担任首席执行官。
LangChain 框架 是由 Harrison Chase 在 2022 年 10 月作为开源软件项目推出的,旨在将大型语言模型(比如 GPT-4)与外部计算和数据源结合起来。
解决的问题
LangChain 主要解决以下问题:
- 数据感知:将语言模型与其他数据源相连接,使其具备对数据的感知能力。
- 主动性:允许语言模型与其环境进行交互,具备主动响应和推理的能力。
LangChain 旨在提供上下文感知和推理能力,使应用程序更智能和灵活。
生态系统
跟踪和评估您的语言模型应用程序和智能代理,以帮助您从原型转向生产。
使用LLM构建有状态的多参与者应用程序,构建在(并打算与)LangChain原语一起使用。
将LangChain可运行文件和链部署为REST API。
安装LangChain
LangChain 支持 Python 和 JavaScript 两个开发版本,我们这个分享使用 python3.11 版本进行讲解。
安装 Python 参考文档:python安装
安装 langchain (版本 v0.2):
pip install langchain
更多详情信息参考文档:langchain安装
小结
本文介绍了什么是大语言模型,LangChain 基本信息、LangChain 生态系统以及 LangChain 安装。
接下来,笔者将逐步深入介绍 LangChain 的入门开发,为您揭开人工智能世界的新篇章!敬请期待,探索LangChain的无限可能!
《构建一个简单的LLM应用程序》
《构建聊天机器人》
《向量存储和检索》
《构建代理》
…
欢迎关注微信公众号【千练极客】,尽享更多干货文章!
本文由博客一文多发平台 OpenWrite 发布!
共同学习,写下你的评论
评论加载中...
作者其他优质文章