标签：本地部署 - www.guozipai.com

#用Ollama在NAS上部署Qwen2.5，打造私有AI助手与文件管理联动

本文分享在群晖DS923+上使用Ollama部署Qwen2.5-7B的实战经验，包括硬件门槛、内存要求、CPU性能、存储规划及安装避坑。无需高端显卡，16GB内存即可流畅运行7B量化模型，让NAS成为私有AI底座，实现本地文件摘要、标签生成等功能，数据不出内网。

阿牛 2026-06-01 152

AI

git checkout

#用Ollama部署Llama 3，再通过Nginx让全家设备共享离线大模型

手头那台32G内存、RTX 4090的主机装了Ollama 0.3.10，拉了llama3:8b和70b。手机、MacBook、iPad全跑来要接口。每台设备都pull一遍5GB起步的模型？脑子进水。核心就三点：一台机器扛模型，其他设备当哑终端直连调用。所有prompt和响应全程不离内网。运维从五台设备各自更新缩成只改host服务器上一个systemd进程和Nginx配置。

阿牛 2026-05-31 16

AI

git checkout

#Ollama本地部署DeepSeek-Coder：VS Code离线代码补全与智能审查全攻略

写代码最烦网络中断导致Copilot转圈圈？金融、医疗项目代码不敢过云端？本文教你用Ollama本地部署DeepSeek-Coder，在VS Code中实现离线代码补全与智能审查。从安装Ollama、拉取模型到配置插件，半小时内搞定。支持7B/14B模型，普通笔记本也能流畅运行，代码完全本地化，无需外部API。

阿牛 2026-05-30 33

AI

git checkout

#用Ollama本地部署Embedding模型，构建全离线语义搜索与智能问答系统

本文详细讲解如何使用Ollama在本地部署Embedding模型，结合向量数据库构建完全离线的语义搜索与智能问答系统。从环境配置、模型拉取到API调用，全程无云端依赖，确保数据隐私安全。适合企业内部知识库、个人笔记库等场景，告别传统关键词搜索的痛点。

阿牛 2026-05-30 37

AI

git checkout

#Ollama本地部署Function Calling：让AI自主调用API实现日程、文件与系统操作

本文详细讲解如何在Ollama中启用Function Calling功能，让本地大模型从被动聊天变为主动执行。通过自定义工具描述，模型可调用日程创建、文件读写、系统命令等API，实现自动化工作流。涵盖环境配置、模型选择、Modelfile编写及实际案例，适合希望将本地AI转化为自动化引擎的开发者。

阿牛 2026-05-29 163

AI

git checkout

#用Ollama本地部署Rerank模型：给RAG检索结果做二次精排

大多数RAG管线第一层用向量相似度做粗筛，速度快但常把“字面接近、语义偏题”的段落推到前面。Rerank（重排序）借助CrossEncoder对查询和候选段落做细粒度相关性判断，是粗筛之后、生成之前的第二道关卡。Ollama从0.4.10起正式支持Reranking模型，可拉取Qwen3-Reranker等专用模型，在本地实现企业级精排能力。本文介绍安装步骤、模型拉取、API调用，以及如何将Rerank嵌入现有RAG pipeline，让检索结果更精准。

阿牛 2026-05-28 224

AI

git checkout