大脑的「偏好」:节能、新奇怪异、即时反馈、认可、规律、预测成功、确定

发布时间:2026/6/25 18:52:39
大脑的「偏好」:节能、新奇怪异、即时反馈、认可、规律、预测成功、确定 这是个非常好的问题。如果把学习、工作、赚钱、成长都看成和大脑合作那么了解大脑的「偏好」几乎相当于掌握了一部分人生操作系统。大脑喜欢什么1. 喜欢节能大脑天然倾向于走熟悉路线使用习惯动作套用已有经验例如开车熟练后不用思考经常写的代码自动就能敲出来熟悉的工作越来越轻松因为自动化 节能2. 喜欢新奇看到新技术新工具新环境新发现大脑会释放更多多巴胺。这也是为什么AI突然爆火短视频让人停不下来新闻总喜欢写重大突破因为它们利用了大脑的猎奇机制。3. 喜欢规律这是很多人没意识到的。你为什么喜欢研究神经网络Transformer智能产生原理因为大脑本质上就是规律发现机器。发现规律时混乱 ↓ 理解 ↓ 掌控会产生强烈满足感。例如突然理解Attention 动态查找信息那种啊哈时刻特别爽。4. 喜欢预测成功大脑最重要功能之一预测未来例如看到for(inti0;in;i)老程序员已经知道后面大概会发生什么。预测越准确越有安全感。5. 喜欢即时反馈为什么游戏容易上瘾因为操作 ↓ 立即反馈例如打怪掉装备升级获得积分而学习学习 ↓ 1个月后见效果反馈太慢。所以容易坚持不下去。6. 喜欢故事你会发现历史故事比历史年代容易记。原因是大脑对人物 冲突 目标 结果特别敏感。这是远古狩猎时代留下的机制。7. 喜欢社会认同获得赞扬尊重地位时大脑奖励系统会被激活。很多人以为自己喜欢钱。实际上很多时候喜欢的是钱 ↓ 代表能力 ↓ 代表认可大脑不喜欢什么1. 不喜欢不确定性例如裁员消息婚姻危机公司缩编会让人焦虑。因为大脑无法预测未来。这类情况之所以消耗人不一定因为事情本身而是因为未来不可预测2. 不喜欢长期无反馈例如学英语半年。感觉没进步大脑会判断投入 收益然后开始放弃。3. 不喜欢复杂面对Transformer论文数学公式大型代码库第一反应往往是好复杂因为复杂意味着能耗增加。4. 不喜欢失败失败在远古时代可能意味着受伤饥饿死亡所以即使今天面试失败项目失败创业失败仍然会引发强烈负面情绪。5. 不喜欢失去心理学有个著名现象损失厌恶Loss Aversion失去100元的痛苦通常大于获得100元的快乐。这个现象来自著名的 Daniel Kahneman 和 Amos Tversky 的研究。6. 不喜欢认知冲突例如你坚信努力一定成功突然看到有人运气好赚了很多钱大脑会难受。因为旧模型被挑战了。从AI角度看大脑你最近一直在研究大模型智能产生规律压缩有一个很有意思的类比人脑和大模型都在做一件事世界 ↓ 寻找规律 ↓ 压缩规律 ↓ 预测未来所以大脑最喜欢的其实不是快乐也不是偷懒。更准确地说大脑最喜欢的是“用尽可能少的能量获得尽可能准确的预测能力”。节能、新奇、规律、反馈、认同本质上都在服务这个目标。这也是为什么很多顶尖科学家、程序员、创业者会对普通人觉得枯燥的东西上瘾——因为当他们发现一个更深层规律时大脑获得的是一种比娱乐更强的奖励我看懂了这个世界的一小部分。而这种感觉恰恰是驱动人类文明发展的核心动力之一。你观察到的是很多人学习失败的真正原因。问题往往不是学不会而是学习过程的痛苦超过了获得成长的快乐。所以大脑开始抗拒。为什么会越来越抗拒因为大脑本质上是一个节能系统。从生物学角度大脑只占体重约2%却消耗约20%的能量。对于大脑来说刷短视频 → 低消耗高奖励打游戏 → 中等消耗高奖励学习Transformer → 高消耗低即时奖励于是大脑会自动判断学习 亏本买卖然后产生拖延走神犯困想看手机这些其实都是大脑的节能策略。重复学习为什么特别痛苦因为大脑喜欢新奇不喜欢重复例如第一次看到GPT原理哇多巴胺上升。第三次知道了多巴胺下降。第十次又来了开始烦躁。但遗憾的是真正的掌握恰恰发生在后面几次。专家和普通人的区别在哪里很多人以为专家喜欢学习。实际上很多专家也觉得枯燥。区别在于普通人关注这次学习爽不爽专家关注这次学习有没有进步1%例如程序员第一次学指针痛苦第五次还是痛苦第十次终于懂了突然发现很多东西都串起来了。这种顿悟会产生巨大的满足感。如何降低抗拒不要重复知识。重复思考。很多人复习看一遍 再看一遍 再看一遍当然会烦。更好的方式第一次这是什么第二次为什么这样设计第三次如果我来设计会怎样第四次它有什么缺陷第五次能不能用代码实现知识没变。但思考角度变了。大脑会觉得是新的挑战。为什么你学AI会比别人更容易坚持根据你过去长期关注的内容神经网络TransformerAttention智能产生机制AI时代程序员成长路径你其实不是单纯在背知识。你在寻找智能的底层规律这类问题天然具有探索性。探索比记忆更容易长期坚持。一个有趣的现象很多顶级研究者后来发现真正让人上瘾的不是答案。而是差一点想明白的感觉比如你最近问大模型为什么会智能规律是无限的吗人如何学习这些问题都没有简单标准答案。每次理解深入一点点大脑都会获得一种“发现新大陆”的奖励。这种奖励比死记硬背强得多。所以如果你发现自己越来越抗拒重复学习不一定是意志力差。更可能是学习方式出了问题。与其反复记忆知识 → 知识 → 知识不如转变成问题 → 思考 → 发现规律对于像你这样喜欢研究 AI、本质原理和系统规律的人来说最能长期坚持的学习模式通常不是“背会”而是把每个知识点都当成一个待破解的谜题而不是一段待记忆的文字。这是一个比“如何学习”更重要的问题。很多人学习十几年实际上从来没有建立过学习效果评价体系于是只能凭感觉今天学了3小时 ≈ 我进步了很多实际上学习时间 ≠ 学习效果学习的5个层次我把学习效果分成5层。第1层见过最低层例如你看了一遍《Attention is All You Need》。感觉我看过了实际上几乎不会用特点看的时候懂合上就忘无法解释这是大多数人的状态。第2层记住例如你能说出Q Query K Key V Value或者int是引用特点能复述能背诵能选择题但还不会应用。很多考试停留在这里。第3层理解例如你能解释Attention为什么有效并且用自己的语言说出来。甚至能给别人举例Q 问题 K 目录 V 内容特点能解释能举例能类比这时候知识开始真正进入大脑网络。第4层应用例如你不仅知道Transformer。还能自己写代码实现Attention调试模型分析性能问题特点能解决问题能创造价值能落地这是程序员最重要的一层。第5层创造最高层例如不是学Transformer。而是发现Transformer缺陷改进Transformer提出新架构像 Geoffrey Hinton、Yann LeCun、Andrej Karpathy 这样的研究者更多处于这一层。特点学习 → 创新最好的评估方式输出测试不要问我学了吗而要问我能输出什么测试1复述测试关闭资料。尝试讲给别人听。如果讲不出来说明没学会测试2白纸测试拿张纸写Attention是什么能写多少写多少。如果只能写两三句说明理解不深。测试3应用测试例如学了RSA。问自己我能写出来吗学了OpenSSL。问我能独立完成加密流程吗你最近经常研究RSAOpenSSLAndroid逆向这种领域特别适合用应用测试。测试4迁移测试非常重要真正理解后知识可以迁移。例如学会Attention后。你能发现搜索引擎 数据库索引 人类注意力本质上都有相似思想。这说明知识已经变成规律。程序员最实用的学习评价指标对于你这样的程序员我建议看4个指标。① 一周后记得多少不是当天。而是7天后还能说出来多少② 遇到问题能否想到它例如遇到RSA加密能否想到OpenSSL EVP接口 Padding如果能想到。说明已经进入知识网络。③ 能否独立实现例如不看资料。自己写SHA256 RSA JSON转义能写多少④ 能否教别人著名物理学家 Richard Feynman 有一个观点如果你不能简单解释它你还没有真正理解它。很多人背会了。但讲不明白。说明只是记忆。一个简单的学习评分表每学完一个知识点。给自己打分指标分数能复述20能解释20能举例20能应用20能教别人20总分80分以上 ≈ 基本掌握 90分以上 ≈ 熟练掌握 100分 ≈ 接近专家对于你未来想走的方向AI、自动化、程序开发我认为最重要的评估标准其实只有一句话学习效果好不是因为你记住了多少知识而是因为你获得了多少新的解决问题能力。如果一个知识点让你以后能独立解决过去解决不了的问题那么即使半年后忘了部分细节这次学习依然是成功的。因为细节可以查能力会留下。