有钱真好啊!一年内买了Mac-mini和MetaQuest3用来办公感觉是真香,头显一戴谁都不爱,Mini在兜天下我走。下面还想买Rokid的眼镜,方便在公司用。在公司用Quest3还是太显眼包了。还想再攒一台主机,方便在家玩SteamVR。还想买一个JoyStick,配合头显还有SteamVR一起食用。祈祷明天大A喂我涨停板。
打工游戏
游戏背景
公司的目的只有赚钱。为了赚钱,需要组织很多人做事。因为赚钱的具体方案通常是不清楚的,所以需要让员工主动去琢磨具体方案。因为实际情况下大部分员工不愿意主动琢磨具体方案,所以需要及时地识别这些不是很志同道合想要一起赚钱的员工并分手。因为员工的客观能力和主观意愿都会对实际表现有干扰,所以需要放长时间来做培养和考察。
游戏规则
培养和考察是一体两面的,最后都会落实成三条规则:
- 员工需要用“职级”来标记其培养进度;
- 员工需要用“年龄”来标记其落后程度;
- 如果“年龄”到了,但是“职级”没到,那么就可以考虑分手了。
我的进度条
入职12级(原P6),30岁,资深工程师。下一个节点16级(原P7),35岁,专家。
玩家留言
- 规则说了很多,没人说怎么做。我想根源性原因是一般的事情不存在做好的可能。
- 为了抢能做好的事情,拼命卷、拼命争只会让我想要换条赛道。
- I’m a mess, but I’ve got big ambitions。
- 故人在Meta,就算拿E4年包,那也有大约17万美刀,直接年薪百万;
- 老乡在通义千问都被猎头问VP了,直接年薪百万;
- 老同学在智谱已经参与前沿大模型研发了。
- 我确实是mess,我想我需要深刻地认知并接受这个事实。
- 我确实不知道怎么躺平享受,尽力而为打打这把游戏吧。
- Ambitions说出来就不灵了,不足为外人道也。
大模型相关经验
记录一些围绕大模型展开研发积累的经验。
大模型作为工具辅助研发
阅读开源代码
快速读懂开源框架,能够迅速上手好用的第三方库是重要的工作能力。这方面,DeepWiki可以迅速弥补各个工程师之间阅读代码的能力差距。下面是我使用DeepWiki辅助研发的一些姿势:
- 快速弄懂框架的具体设计理念。假设今天公司决定使用model-scope-swift(后面称为ms-swift)来组织继续预训练、监督微调和强化学习。那么我们可以在DeepWiki中询问ms-swift这样一种问题:
- “我现在想要借助ms-swift来快速地组织大模型的继续预训练、监督微调和强化学习,请你帮我理清这个框架能够如何帮助我完成这些目标?这个框架中有什么核心的概念需要我提前了解以达到know what I am doing的效果?最后最快捷的上手开发方式有没有什么建议?”
- 快速了解如何对已有框架做二次开发。假设今天公司决定使用VLMEvalKit这个框架来组织不同业务的同事合作建立垂直领域大模型的领域数据评测集。那么我们可以在DeepWiki中询问VLMEvalKit这样一些问题:
- “我们现在有几个人需要利用这个框架合作开发。其中业务A同事的评测过程需要用到LLM_as_judge,它的LLM是以公司内网的delta服务的形式使用的;业务B同事的推理过程需要用到本地vllm服务以加速推理过程;业务C同事需要跳过推理过程,直接使用LLM_as_judge直接把已有的推理结果同标注结果比对相似性。请问我们这些同事之间应该以什么设计模式相互合作开发?VLMEvalKit是如何抽象不同数据集不同模型的推理和评测过程的?是否有关键地共享的接口?我们的二次开发涉及到修改哪些具体文件?能不能为三个同事分别生成一个Sequence Diagram?”
- 快速查询使用框架时遇到bug的含义以及如何改正。假设公司今天要求使用(今天等机器的摸鱼时间结束了,后面继续写)
大模型节目观看记录
世界发展的太快了,爱看YouTube上的技术内容。
- 2025.09.14:一边加班一边听了YouTuber”最佳拍档”的三个节目,分别讲了OpenAI关于为什么大模型会有幻觉的研究;Codex的采访播客;李飞飞CS231N课程的计算机视觉概述。看完想说三句屁话:
- 解决大模型的幻觉问题技术怎么才能在自己的工作中用到呢?或者说,需要用吗?打工真的是拿钱办事,还是要借助公司平台完成事业探索呢?我同意来支付宝做视频理解,就是觉得视频理解是AI-PC的核心基础。我想不管怎么样,拿实验和数据说话才是最终准绳,只是公司没有那么多时间留给我呀。
- 大模型作为辅助工具的姿势真多啊。什么时候能算力共产?就脑洞方面,我认为人人平等。
- 没心思再慢慢听课了。
没用的数学
矩阵保序低秩近似(by 李奥迪 & 姚命宏)
背景
首先简单交代一下要研究的具体矩阵分析问题是怎样抽象出来的。对称(半)正定矩阵是我们的研究对象,它会在非常多的应用场景中出现。在推荐系统这种工业场景中,通常会组织许多人力来标注偏序数据集(用户-物品;用户-用户;物品-物品)。这种偏序数据集存在两个关键特征:
- 第一,因为人类只能够相对准确地判断相似性之间的相对大小,所以任意两个概念之间的具体相似性得分不重要,但是两个相似性得分之间的相对大小关系很重要;
- 第二,如果用具体的打分数据来量化任意两个概念之间的相似性,那么所有的打分数据构成的矩阵是一个对称矩阵,但是以概率1不是(半)正定或负定矩阵,而只是不定矩阵。也就是这个对称矩阵的所有特征值都是实数,且几乎一定有一些特征值是正的,有一些是负的。
N个版本之前的研究热点是对比学习。对比学习在如何学习偏序矩阵这个问题上的解决思路是利用各种局部性地、概率性地方式从偏序矩阵中采样得到所谓正负样本对,然后以随机梯度下降的方式调整表征,使得表征之间的向量相似性基本符合偏序矩阵中刻画的相似性排序。最后,在召回和精排阶段复用学习得到的相似性排序结果。
站在一个更高的角度来总结形形色色对比学习算法做的事情,可以发现它们都是尝试用一个对称半正定矩阵(即所有表征之间的内积矩阵,后面称为gram矩阵)来近似人工标注的偏序矩阵,并且一定要做到:保持gram矩阵中元素的相对大小排序同人工标注的偏序矩阵中元素的相对大小排序一致(后面简称这种性质为保序);保持gram矩阵是一个低秩矩阵,即每个表征的向量维度要远小于被表征对象的集合大小。综上所述,我们抽象出了下面这个矩阵分析问题:
如果上面这个矩阵分析问题有解,并且存在高效地求解算法,那么就可以直接对矩阵B做特征值分解,从而获得d维的表征。这种做法的优点是直观的:元素间的相对大小关系完全得到保留,而不是近似保留。
先不考虑秩约束
定理1. 若矩阵A满足原问题中的条件,那么至少存在满秩正定矩阵B完全保序。
证明1. 采用构造性的证明。不失一般性地假设矩阵A的对角线元素单调递增:
对于不符合这个假设的矩阵,我们总是可以同时交换行和列使得该条件成立。记录交换过程后,构造结束后反交换过来即可。
结合条件中的,不难发现。
焦散线
奇形怪状的扩散模型
2023-2025近况
今夜做梦想起了故人,写一点内容纪念一下。以前故人教我折腾电脑,现在AI教我折腾电脑。
- 2023年,我的抑郁症终于在老婆的照顾和坚持服药下基本痊愈了。副作用就是长胖了20斤。
- 2024年,年头打通见家长-领证-女方婚宴副本;年中打通备孕-剖腹产-给女宝起名字的副本;年末打通找工作副本,最后去了支付宝。
- 2025年,年头打通男方婚宴副本;紧接着突然阑尾炎且刀口发生脂肪液化,卧床一个月;然后妈妈突然查出降结肠癌,中分化,找医院找医生组织家庭人力,及时切除肿瘤并出院做后续化疗;期间顺利熬过博士论文校内答辩-外送盲审-博士毕业答辩;年中带着老婆孩子爸爸妈妈参加毕业典礼离校,然后一家五口人打通杭州定居副本;最近发现工作压力大,抑郁症有复发倾向,同时左耳突发性耳聋,听不到高音。
天有不测风云,人有旦夕祸福,希望故人都好。