

Hello,大家好,我是人月聊IT。
今天继续分享AI辅助工具使用方面的一些研究和实践,在今年的6月份我当时分享过一篇文章,对个人使用的AI工具进行了详细说明,当时输出了一张思维导图具体如下:

具体可以参考历史文章:
今天继续对最近研究和使用过的AI辅助工具进行新的补充说明。
AI辅助编程和AI辅助写作
在我前面分享AI辅助编程的时候基本都是以AI-IDE为主,包括Cursor,Trae,CodeBuddy这个几个我个人用的比较多。国内的两个需要用国际版本,好处就是可以使用国外的最新大模型。整体来看还是Cursor胜出。
而现在随着VibeCoding氛围编程,上下文工程概念的进一步兴起,以ClaudeCode为首的CLI工具相继推出。包括Gemini CLI,CodeBuddy,iFlow等。由于Gemini CLI可以免费使用Gemini Pro 2.5,所以有一段时间这个成了我个人主要生产力工具。对于国内的个人推荐iFlow。
iFlow CLI 提供了非常便捷的安装方式:
npm i -g @iflow-ai/iflow-cli 安装
在安装完成后,创建一个项目目录,运行iflow进入如下:

当前iFlow对国内主流的几个最新大模型,包括QWen Coder,Deepseek V3.2,GLM4.6,Kimi2都提供了完整的支持。个人强烈推荐使用这个。
当然不差钱还是建议大家使用ClaudeCode,当前已经升级到了Claude4.5大模型,提供了很好的能力支持。包括前面我也谈到,在8月份,我们已经基于ClaudeCode完成了一个小型商业级别的项目交付。在前面我也分享了详细的工程级实践可以参考。

当然通过ClaudeCode进行AI辅助写作也没有任何问题,写作前需要通过claude mcp add sequential-thinking来增加这个规划分解任务的MCP工具。这个也是我最常用的一个MCP工具。当前ClaudeCode已经挂接4.5的大模型,整个作图和编程,写作能力都大幅度提升。
还有一个团队当前使用Cursor,也成为了主流的生产率工具。重点不是全新项目开发,而是历史项目的日常变更和运维处理。整体使用下看对整个大项目完整上下文的理解能力依然相当优秀。除了本身的大模型能力外,和Cursor本身的提示词,Rules优化关系仍然很大。包括Cursor最新推出了Cursor2.0,又进一步提升了核心的研发模型和编程能力。
另外还有一个关键点需要注意的就是实际当前的AI编程工具已经和MCP做了完整的集成。极大了扩展了大模型外部资源,实时资源的访问能力。
一个新的AI辅助写作场景
大家都知道,我在前面讲过我的AI辅助写作场景,实际更多是AI辅助归纳糅合,而不是凭空写作。即基于问题或主题,检索我个人已有历史文章资料库,然后基于我提供的要求逻辑进一步组装,形成一篇新文章。也就是说AI的核心能力是可复用知识库识别提取+按逻辑组装,最终形成新文章。
那么如何让AI基于全新热点事件进行分析输出文章呢?
在这里给出几个关键点,供大家参考,自己已经完整验证通过,整体文章输出效果还不错。我实际是让AI基于完整上下文工程的思路,帮我输出一个热点事件写作顾问的Claude Skills,然后基于这个来完成文章写作,具体:
条目化提供我要表达的核心观点
包括前面,在10.27日,我提供了一个SBR基于对象行为关系的建模提示语,基于这个我们可以对核心事物,核心概念进行可视化系统建模。这个不仅仅是可以输出SVG模型图,重点是模型图本身就是核心概念的高度抽象,我们完全可以基于模型图让AI基于输出对模型图的解释和说明,这个稍微再加工下就可以转化为一篇通俗易懂的文章。
包括前面我输出的第一性原理核心逻辑的文章,就参考了上面的思路进行。具体参考的输出如下:

所以再次回到AI辅助写作来看。里面的关键点就是一定要对你历史的知识库通过Markdown方式进行结构化,不用怕费事,这个本身也是可以借助工具或AI编程来完成的。其次就是一定要有自己的核心观点,AI更多的是搜索资料进一步的帮你分析和论证观点。最后就是文章一定要有自己的写作风格,这个需要你有历史的知识库让AI进行学习,方便全面理解你的写作风格。
AI多模态辅助创作
最近几个月在前期的基础上试验了几个AI多模态方面的能力。
先来说下语音和播客方面,在前面我实际分享过当时扣子空间的双人播客功能,实际这个功能已经完全内置到了豆包APP里面。

这个播客功能相当强大,最好的地方就是你的问题,你希望了解的热点事件,你希望看到AI对某些事件的看法,都可以让AI帮我生成一段播客。这个相当适合在上下班途中听,非常方便,强烈推荐。这个我个人感觉下来就是比你看文章更加容易理解一些关键点和基础概念和核心观点。特别是双人对话的方式,更加具备有带入感。

在前段时间看到minMax做了开放和升级。原来实际我们用过minMax的通用智能体和深度研究功能。现在minMax又推出了完整的文本转语音功能。你只需要准备完整的文字稿即可,minMax完全转为语音并且可以下载。
这个输出的内容完全可以应用到自己的个人播客里面。
类似的功能当前混元大模型也提供了播客功能。目前微信公众号、腾讯新闻、ima、腾讯文档PDF已经接入该能力,「让用户可以收听到由内容转化成的AI播客」,在财研报解读、新闻速递、知识教育等场景得到广泛应用。
👉🏻体验入口:https://hunyuan.tencent.com/agent?skill=aiPodcast
大家可以关注下我B站发布的消失的数据中台视频,即基于混元大模型来输出和生成。但是PC端当前没有提供两个关键功能。其一就是生成的mp3语音文件可以下载,其二就是语音播客内容可以提供完整的文字稿的稿件,方便我后续转为视频。

所以在这里可以使用剪映提供的AI文字成品功能来基于文字稿输出完整的视频,你既可以选择数字人,可以选择在线的素材库来进行生成。

大家可以参考下我B站10月29日的视频,既语音由MinMax生成,而视频则由剪映的文章生成视频来完成,整体效果还是不错。
接着我们再来讲下Google NotebookLM,这个Google提供的基于大模型的可视化笔记记录功能相当强大。即可以基于你提供的文章帮你输出音频,视频,思维导图,学习测验等多种形式。

因此我也拿我原来公众号写过的一篇文章进行验证。
我讲这篇文章上传给Google,然后让AI帮我生成完整的讲解视频,这个讲解视频相当牛,完全理解了我文章的核心观点,而是基于讲解呈现的需要,对内容完全进行了重新梳理和重排,然后输出了完整的讲解视频+PPT。
地址:https://notebooklm.google.com/

AI基于我的文章进行了详细的语音讲解,主要还是针对关键点都进行了可视化的配图,配图也和语音文字内容完全匹配。
大家都知道,在前面我曾经分享过密塔AI的今天学点啥功能,这个也是可以上传文档资料,让AI输出完整的讲解视频。个人使用下来后,感觉NotebookLM能力进一步增强,特别适合用于你拿到的新资料,新文档的个人自我学习。所以在这里再次推荐NotebookLM作为你个人学习强大助手。
办公辅助和PPT制作等
最后还是回来谈下办公辅助和PPT制作。
对于PPT制作实际我个人推荐两个,一个是genSpark,一个是天工AI。整体来看genSpark略强,但是天工AI本身能力也不弱。大部分的需求场景,天工AI基本都可以很好的完成。
实际你观察下现在的PPT制作通用智能体,核心思路基本为:
1互联网搜索相关的文章素材+大模型自由知识库素材
2基于目标分解PPT目录纲要
3准备PPT制作的格式模板样式文件,制作规范提示模板
4按目录纲要逐页生成html网页文件
5对生成的所有html网页文件进行合并整合输出ppt
当前基本都采用了上面的思路进行。
当然除了做PPT,类似天工AI还提供很好的文章辅助,方案写作能力。我最近重点验证了两个关键点。里面有一个就是基于甲方的招标技术规范要求,来撰写对应的技术建议书方案。但是方案编写又必须要参考我当前已有的标准产品方案材料。因此实际我需要同时上传两个pdf给AI,然后让AI输出完整的建议书方案文档。

大家注意天工AI输出方案可以直接是word文档,也提供下载,而且你提供的标准材料里面的参考图,架构图也会根据新方案的编写直接引用过来。是真正意义上的要给多模态word文档,基本不可需要任何的后期进一步加工整合。
所以我在前期也分析了又专门提供AI标书制作智能体服务的产品和公司,实际对这种简单的AI辅助应标,基本用AI辅助就能完全搞定。整体效果比直接用DeepSeek还是会好很多。
今天分享就到这里,希望对大家有所启发。