首页手记使用DeepSeek...

使用DeepSeek R1和Ollama构建检索增强生成系统指南

标签：

机器学习人工智能自然语言处理

使用您的数据构建本地RAG系统

使用DeepSeek R1和Ollama来构建稳健的RAG系统。了解设置流程、最佳实践及开发智能解决方案的技巧。

DeepSeek R1 和 Ollama 提供了创建 检索增强生成 (RAG) 这类系统的强大工具。本指南将介绍使用这些工具进行 RAG 应用开发的设置方法、实现步骤和最佳实践。

为什么RAG系统改变了游戏规则？

检索增强生成模型（RAG） 系统结合了搜索和 生成式人工智能 的优势，能够提供上下文相关的响应，这些响应精准且准确。借助工具如DeepSeek R1 和 Ollama，现在构建RAG系统已不再那么令人畏惧。无论是聊天机器人、知识助手还是AI驱动的搜索引擎的构建，本指南将为您提供所需的所有信息和工具。

先决条件

Python 3.10+（介绍了如何在Windows 11上安装Python）

如何在Windows 11上安装Python？如何在Windows电脑上安装Python？来源: bhavikjikadara.medium.com

如何在本地安装Ollama

LLama 3.1：如何离线安装和使用AI能力本文将指导您如何下载并使用Ollama，这是一个与开源AI交互的强大工具：点击这里阅读更多

你会学到什么

设置 DeepSeek R1 和 Ollama 来进行 RAG。
实现文档处理、向量存储和查询管道的功能。
优化性能、相关性以及用户体验。

构建RAG管道的步骤如下：

1. 搭建环境和导入库函数

请确保你已经安装了所需的Python包，并可以使用pip等工具来安装它们。

    pip install langchain-core langchain-community langchain-ollama langchain-huggingface faiss-cpu psutil

安装语言链核心、社区版、ollama、huggingface、faiss-cpu和psutil的pip命令

导入所需的库

    from typing import List  
    from langchain_core.documents import Document  
    from langchain_core.output_parsers import StrOutputParser  
    from langchain_core.runnables import RunnablePassthrough  
    from langchain_core.prompts import ChatPromptTemplate  
    from langchain_community.document_loaders import TextLoader  
    from langchain_text_splitters import RecursiveCharacterTextSplitter  
    from langchain_huggingface import HuggingFaceEmbeddings  
    from langchain_ollama.llms import OllamaLLM  
    from langchain_community.vectorstores import FAISS  
    import logging  
    import psutil  
    import os

2. 初始化RAGPipeline类实例

整个流程由RAGPipeline类管理，包括内存监控、文档加载、生成嵌入以及查询模型。

    class RAGPipeline:
        def __init__(self, model_name: str = "llama2:7b-chat-q4", max_memory_gb: float = 3.0):
            self.setup_logging()
            self.check_system_memory(max_memory_gb)

            # 加载语言模型（LLM）
            self.llm = OllamaLLM(model="deepseek-r1:8b")

            # 使用轻量级模型初始化嵌入
            self.embeddings = HuggingFaceEmbeddings(
                model_name="sentence-transformers/all-mpnet-base-v2",
                model_kwargs={'device': 'cpu'}  # 使用CPU以提升效率
            )

            # 定义提示模板
            self.prompt = ChatPromptTemplate.from_template("""
            请根据以下上下文简洁作答。如果在提供的信息中找不到答案，请回答“无法根据提供的信息回答此问题。”

            上下文: {context}
            问题: {question}
            回答: """)

3. 内存管理及日志记录

为了防止在内存较低的环境中崩溃，我们在执行之前记录和检查可用内存。

定义一个名为setup_logging的方法，该方法用于设置日志。
设置基本的logging配置，日志级别为INFO。
将logger设置为当前模块的日志记录器。

    def check_system_memory(self, max_memory_gb: float):  
        available_memory = psutil.virtual_memory().available / (1024 ** 3)  
        self.logger.info(f"系统当前可用内存为：{available_memory:.1f} GB")  
        if available_memory < max_memory_gb:  
            self.logger.warning("内存不足，低于推荐值。")

4. 加载并拆分文档

我们利用 TextLoader 和 RecursiveCharacterTextSplitter 来高效处理这些文档。

    def 读取并拆分文档(self, file_path: str) -> List[Document]:  
        加载器 = TextLoader(file_path)  
        文档 = 加载器.load()  

        文本拆分器 = RecursiveCharacterTextSplitter(  
            chunk_size=500,  
            chunk_overlap=50,  
            length_function=len,  
            add_start_index=True,  
        )  
        拆分结果 = 文本拆分器.split_documents(文档)  
        self.logger.info(f"生成了 {len(拆分结果)} 个文档片段")  
        return 拆分结果

5. 使用FAISS创建向量数据库

我们用FAISS来高效检索文档，并以小批量来处理文档。

    定义 create_vectorstore(self, documents: List[Document]) -> FAISS:  
        batch_size = 32  
        vectorstore = FAISS.from_documents(documents[:batch_size], self.embeddings)  

        for i in range(batch_size, len(documents), batch_size):  
            batch = documents[i:i + batch_size]  
            vectorstore.add_documents(batch)  
            self.logger.info(f"已处理批次 {i//batch_size + 1}")  
        return vectorstore

6: 搭建 RAG 链

我们定义的检索机制是为了高效获取相关文档。

    def setup_rag_chain(self, vectorstore: FAISS):  
        retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 2, "fetch_k": 3})  

        def format_docs(docs):  
            return "\n\n".join(doc.page_content for doc in docs)  

        rag_chain = (  
            {"context": retriever | format_docs, "question": RunnablePassthrough()}  
            | self.prompt  
            | self.llm  
            | StrOutputParser()  
        )  
        return rag_chain

7. 带有内存监控功能的模型查询

在带有内存监控功能的情况下查询模型。

在执行查询请求之前，系统记录内存使用情况。

    def query(self, chain, question: str) -> str:  
        内存用量 = psutil.Process(os.getpid()).memory_info().rss / 1024 / 1024  
        self.logger.info(f"内存用量: {内存用量:.1f} MB")  
        return chain.invoke(question)

8. 把一切都放在一起

我们先初始化RAG流程，处理文档，然后运行一个测试查询。

    def main():  
        rag = RAGPipeline(model_name="deepseek-r1:8b", max_memory_gb=3.0)  

        doc_list = rag.load_and_split_documents("data/knowledge.txt")  
        vectorstore = rag.create_vectorstore(doc_list)  
        链 = rag.setup_rag_chain(vectorstore)  

        问题 = "AI是什么？"  
        回答 = rag.query(链, 问题)  
        print(f"问题：{问题}\n回答：{回答}")

    if __name__ == "__main__":
        # 如果该脚本被直接运行，将调用main()函数
        main()

结论：

这篇博客详细介绍了如何使用LangChain、Ollama、FAISS和Hugging Face embeddings构建一个内存高效的RAG管道系统。通过对文档分块、向量存储和内存监控的优化，这种方法确保即使在资源有限的情况下也能高效地进行AI驱动的文档检索。用你的数据集试试这个管道，并告诉我们你的想法吧！

参考文献

使用网站内容构建RAG应用的全面指南：网页抓取技术、切片和向量嵌入bhavikjikadara.medium.com

混合搜索：使用LanceDB实现RAG，使其适用于可扩展、生产级应用

bhavikjikadara.medium.com

[LlamaIndex & Chroma：构建一个简单的RAG管道来回答你所有招聘问题！bhavikjikadara.medium.com]

使用LangChain构建对话检索链 | 在这篇博客里，我们将探索如何使用LangChain构建对话检索链（CRC）。CRC利用上下文信息…bhavikjikadara.medium.com

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

侃侃无极

手记
篇

粉丝

7

获赞与收藏

25

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 31437 350

网络编程入门教程

20个小节 12893 243

Pandas 入门教程

25个小节 18782 352

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

使用DeepSeek R1和Ollama构建检索增强生成系统指南

阅读免费教程