半年前我还在为公众号的事发愁。不是写不出来,是写出来的东西风格天天跑偏——今天读着像个老教授在讲课,明天又变成脱口秀演员在抖包袱。最折磨人的是每次要发十篇产品介绍,我得一个字一个字地调语气、换案例,整个人被钉在电脑前。后来一个朋友甩给我一句话:“你去试试Ollama,再搞一套Prompt模板。”

说实话,那会儿我连Ollama是干啥的都不知道。但试了三天之后,我就把之前用的所有在线AI写作工具全卸了。

数据安全与成本:为什么我劝你别把文章交给云端

先讲个让我后背发凉的事。去年接了个活儿,给一个客户写一批行业分析文章。素材里全是内部数据和没公开的调研结果。用在线AI工具?我根本不敢。那些平台说得再好听,数据也是要上传到人家服务器上的。客户要是知道我拿他们的商业机密去“喂”大模型,估计当场就翻脸了。

数据隐私是第一道坎。本地化AI写作系统最大的好处就是——你的文章、你的数据、你的prompt,全在你自己的电脑里。Ollama官网说得挺直白:这是用开源模型自动化工作的最简单方式,同时保证数据安全。翻译成人话就是:你写的东西只有你自己知道。

第二是成本。在线AI工具按token收费,写得多了,一个月上千块很常见。Ollama是一次部署,之后调模型全是本地跑。我用的是一台2022年的笔记本,装了个Qwen2.5 7B的量化版,跑一篇文章的成本差不多就是电费。而且没网的时候照样写——高铁上、飞机上、信号差的小旅馆,打开终端就能干活。

prompt template design on screen

装个Ollama比装微信还简单

安装过程真的没什么门槛。去ollama.com下载对应的系统版本,双击安装,完事。然后打开终端(Windows用户用PowerShell),敲一行命令:

ollama pull qwen2.5:7b

这行命令的意思是把阿里开源的Qwen2.5 7B模型拉到本地。为什么选它?因为中文写作能力在开源模型里算第一梯队,而且7B的参数规模对笔记本很友好。要是你电脑配置好点,可以试试DeepSeek的模型,推理深度更强,但写普通文章有点大材小用。

下载完怎么用?最简单的是直接在终端里对话:

ollama run qwen2.5:7b

然后等几秒,出现提示符,你就可以打字跟它聊天了。但这种方式不适合批量写作,我们要的是API调用。Ollama自带一个轻量级API服务器,启动方式也很简单:

ollama serve

之后你在任何编程语言里发HTTP请求到 http://localhost:11434/api/generate ,就能调用模型。我用Python写了个脚本,几十行代码就搞定了批量生成。

这里有个坑要特别注意:默认的7B模型在4G显存的显卡上跑,生成速度大概每秒几个字,慢得像蜗牛。解决办法是下量化版,比如 qwen2.5:7b-q4_K_M,体积缩小一半,速度翻倍,质量损失几乎感觉不到。要是你用纯CPU跑,建议选3B或1.5B的模型,虽然文采差一点,但胜在快。

Python script for batch generation

Prompt模板设计:让AI输出风格统一的关键

很多人用AI写作翻车,问题不在模型,在prompt。你给它一句“写一篇关于咖啡的文章”,它当然不知道你要科普还是推销,也不知道你语气该俏皮还是专业。

我的做法是设计一套模板。模板长这样:

你是一个有10年经验的咖啡行业编辑,文风偏口语化但信息密度高。请写一篇800字左右的文章,主题是{主题}。文章结构:先用一个具体场景开头,然后分3个要点展开,每个要点配一个真实案例或数据,最后用一句话收尾。输出格式:纯文字,不要Markdown,段落之间空一行。

看到没?我把角色设定、任务描述、输出格式、示例参考全塞进去了。最关键的变量是{主题}——每次生成时替换成不同的词,比如“手冲咖啡水温控制”或“意式浓缩的油脂秘密”,就能批量产出同一风格的文章。

我建了一个模板库,分三类:博客文章、产品文案、社交媒体帖子。博客文章模板强调场景感和深度,产品文案模板突出痛点与解决方案,社交媒体帖子模板控制在200字内,带话题标签。三个模板的语气差别很大,但每个模板内部的输出高度一致。

举个例子,我用博客模板写了十篇关于咖啡豆产地的文章,每篇开头都是“我第一次喝到{产地}的豆子是在……”,读者根本看不出是AI写的,因为场景细节都是我手动填的。模板管结构,细节管真实感。

批量生成实战:15分钟搞定十篇文章

模板有了,怎么批量跑?我写了一个Python脚本,核心逻辑就三步:

  1. 读一个关键词列表,比如[“埃塞俄比亚”,“哥伦比亚”,“云南”]
  2. 把每个关键词填入模板的{主题}位置,组装成完整的prompt
  3. 依次调用Ollama的API,把结果保存到不同的Markdown文件里

跑一次大概15分钟,十篇文章就出来了。以前我手动写这些,一天都搞不定。而且脚本里我还加了自动摘要功能——每篇文章生成后,再调一次模型,让它用一句话概括核心观点,方便我后面做目录。

质量怎么把控?我设了一个“三明治规则”:AI写初稿,我改中间段,再让AI润色结尾。这样既保留了人的判断力,又利用了AI的效率。查重我也做了,用Python的difflib库对比新文章和语料库的相似度,超过70%的就标记出来,人工重写。

千万别完全信任AI的输出。有一次它把云南咖啡的产地写成了“普洱市”,但实际是“保山市”,这种细节错误如果不人工纠正,发出去就是事故。

从模板到品牌语料库:让AI学会你的腔调

模板只能保证结构统一,但语气和用词的微妙差异,需要更细致的控制。我的做法是搞了一个“品牌语料库”——把之前写过的、觉得风格对的文章收集起来,大概20篇,每篇都拆解成:高频词、句式偏好、语气标志(比如是不是喜欢用“说实话”、“讲真”这种词)。

然后把拆解结果做成Few-Shot示例,塞进prompt里。比如:

参考以下文章的语气和用词:[示例1][示例2]。请用同样的风格写一篇关于{主题}的文章。

这招非常管用。我帮一个科技博客做内容代运营,对方要求文章有“极客感但不要太高冷”。我先拿他们之前的文章训练了几个Few-Shot示例,然后让模型模仿,出来的东西连编辑都分不清是真人还是AI写的。

动态调整语气也很简单。在prompt里加一个参数{正式度},取值范围1到10。1对应“像朋友聊天”,10对应“像学术论文”。我写产品介绍时设7,写公众号时设3。同一个模板,改一个数字,语气就变了。

持续迭代是关键。每生成一批文章,我都会把反馈记下来——哪些词用多了,哪些句式读着别扭。然后每月更新一次模板,把踩过的坑写成规则。比如我加了一条:“禁止在文章中出现‘在这个快节奏的时代’这种烂大街的开头。”现在模板里直接写死了这条规则。

SEO与内容策略:让AI写的文章被搜索到

文章写出来没人看,等于白写。SEO这件事,本地AI写作有个天然优势:你可以针对关键词做“语义优化”,而不是机械地堆词。模型理解上下文,知道怎么把“Ollama本地部署”这个词自然地嵌进句子里,而不会让读者觉得突兀。

我的做法是:先列一个长尾词表,比如“Ollama中文写作”、“Prompt模板写作”、“AI写作风格统一”,然后每个词对应一个文章主题。生成时,在prompt里指定“请在正文中自然出现以下关键词:……”。模型会自动安排位置,而且不会超过合理的密度。

批量生成专题内容这块,我试过最爽的一次是做一个“咖啡知识图谱”:从种植、烘焙、冲煮到品鉴,每个环节写5篇文章,总共20篇。所有文章的风格一致、互相关联,站内链接一打,搜索引擎直接把我网站当该领域的权威来源。流量涨了不止一倍。

但别指望AI帮你搞定所有SEO。AI生成的文字再流畅,也有一种“平滑感”——读起来太顺了,反而不像人写的。我的秘诀是:每篇文章生成后,手动改两处——一个句子故意写短一点,一个段落故意写跑题一点。这种“不完美”反而让文章更真实,搜索引擎也喜欢原创性高的内容。

最后说一点。本地AI写作系统不是神器,它更像一个手艺工具箱。你花时间打磨模板、积累语料、调教模型,它才能产出靠谱的东西。但一旦跑顺了,那种“喂一个关键词出来一篇好文章”的感觉,是真的爽。

现在每次打开终端,敲下那行熟悉的命令,我都觉得前半年踩的那些坑,值了。