2025-09-11

大模型相关经验

记录一些围绕大模型展开研发积累的经验。

大模型作为工具辅助研发

阅读开源代码

快速读懂开源框架，能够迅速上手好用的第三方库是重要的工作能力。这方面，DeepWiki可以迅速弥补各个工程师之间阅读代码的能力差距。下面是我使用DeepWiki辅助研发的一些姿势：

快速弄懂框架的具体设计理念。假设今天公司决定使用model-scope-swift(后面称为ms-swift)来组织继续预训练、监督微调和强化学习。那么我们可以在DeepWiki中询问ms-swift这样一种问题：
- “我现在想要借助ms-swift来快速地组织大模型的继续预训练、监督微调和强化学习，请你帮我理清这个框架能够如何帮助我完成这些目标？这个框架中有什么核心的概念需要我提前了解以达到know what I am doing的效果？最后最快捷的上手开发方式有没有什么建议？”
快速了解如何对已有框架做二次开发。假设今天公司决定使用VLMEvalKit这个框架来组织不同业务的同事合作建立垂直领域大模型的领域数据评测集。那么我们可以在DeepWiki中询问VLMEvalKit这样一些问题：
- “我们现在有几个人需要利用这个框架合作开发。其中业务A同事的评测过程需要用到LLM_as_judge，它的LLM是以公司内网的delta服务的形式使用的；业务B同事的推理过程需要用到本地vllm服务以加速推理过程；业务C同事需要跳过推理过程，直接使用LLM_as_judge直接把已有的推理结果同标注结果比对相似性。请问我们这些同事之间应该以什么设计模式相互合作开发？VLMEvalKit是如何抽象不同数据集不同模型的推理和评测过程的？是否有关键地共享的接口？我们的二次开发涉及到修改哪些具体文件？能不能为三个同事分别生成一个Sequence Diagram？”
快速查询使用框架时遇到bug的含义以及如何改正。假设公司今天要求使用（今天等机器的摸鱼时间结束了，后面继续写）

大模型节目观看记录

世界发展的太快了，爱看YouTube上的技术内容。

2025.09.14：一边加班一边听了YouTuber”最佳拍档”的三个节目，分别讲了OpenAI关于为什么大模型会有幻觉的研究；Codex的采访播客；李飞飞CS231N课程的计算机视觉概述。看完想说三句屁话：
- 解决大模型的幻觉问题技术怎么才能在自己的工作中用到呢？或者说，需要用吗？打工真的是拿钱办事，还是要借助公司平台完成事业探索呢？我同意来支付宝做视频理解，就是觉得视频理解是AI-PC的核心基础。我想不管怎么样，拿实验和数据说话才是最终准绳，只是公司没有那么多时间留给我呀。
- 大模型作为辅助工具的姿势真多啊。什么时候能算力共产？就脑洞方面，我认为人人平等。
- 没心思再慢慢听课了。