NOTE
本书介绍了作者多年来对大脑和智能的研究,包括:
- 新皮质、世界模型和千脑智能理论。
- 当今并不智能的人工智能。
- 智能和人类未来。
其中世界模型理论很有趣,当今业界的 AI 通常被称为人工智障,即便是最新 LLM 技术为基础的 ChatGPT 也只是参数巨量的数学概率带来的结果。业界领袖 Yann Lecun 一直炮轰 ChatGPT 并推崇的世界模型理论或许才是 AGI 的真正解决方案。
- 作者履历
- Jeff Hawkins:第一份在英特尔的工作中决定转行研究大脑;加入 UCB 的神经科学博士研究生项目,选了这个可能无法毕业的课题;自学了两年神经科学领域论文后决定先回到工业界;创立 Palm 获得成功后退出,回归学术;创立红木神经科学研究所专注研究大脑,但难以主导研究,退出;创立 Numenta 公司,继续研究大脑,并探索和人工智能的结合。
- 了解大脑
- 达尔文时代:进化论显示,大脑的进化是在旧的部分之上叠加了新东西。即旧脑和新脑。例如先有脊髓负责运动、再进化出脑干负责消化呼吸、再往后继续进化。
- 新皮质和旧脑
- 新皮质是人类大脑最新进化出的部分。占 70% 体积,负责智能:视觉、语言、数学、工程等。
- 新皮质包裹旧脑,两者神经纤维连接,通过给旧脑发指令来控制身体。
- 新脑和旧脑的斗争是本书核心主题。例如新脑可以发出憋气指令,但到极限时旧脑的本能会忽略指令。
- 旧脑上多种器官独立工作,新脑都长一样的褶皱,但按区域划分工作,区域之间通过极其复杂的方式连接处理信息。
- 新皮质极其复杂
- 局部回路复杂:每平方毫米 10 万神经元和 5 亿连接。
- 不同功能的区域几乎都长一样。
- 所有区域都能接收体感输入并输出运动指令:即没有单独的感觉区和运动区。
- 新皮质智能算法
- 神经科学大师 Mountcastle 在《The Mindful Brain》中的观点
- 新皮质与进化论
- 新皮质的进化过程是对一个简单回路的反复复制,所以长得都一样,所有智能行为都基于同一原则(算法)工作。
- 达尔文:生命的多样性是基于一种基本算法(DNA 为基础的随机变异和自然选择)。
- Mountcastle:智能的多样性也是基于一种基本算法。
- 新皮质基本单位
- 皮质柱,负责执行基本智能算法。
- 新皮质 = 几十个区域 = 每个区域有成千上万的皮质柱 = 每个皮质柱有上百个迷你皮质柱 = 每个迷你皮质柱有上百个细胞。
- 了解皮质柱的工作原理,就破解了大脑和智能。
- 新皮质与进化论
- 神经科学大师 Mountcastle 在《The Mindful Brain》中的观点
- 大脑中的世界模型
- 新皮质并不是接受输入、黑盒处理、输出指令的系统,而是接受输入、存储并做预测、在合适的时候行动。关键在于这个预测模型,即世界模型。
- 学习世界预测模型
- 输入不断变化:世界在变动 or 我们在移动。
- 大脑通过观察信息(感觉)输入随时间变化规律来学习世界模型。
- 输入的同时,大脑也在做预测。当预测和输入有偏差,大脑意识到需要更新这部分模型了。
- 神经元工作方式
- 树状结构:电脉冲信号从树突输入、轴突输出、通过突触再输入到下一个树突。
- 学习 = 新突触产生连接神经元;遗忘 = 旧突触不活跃被移除。
- 两个原则:人类的想法和感知本质上都是神经元在活动;人类所有的记忆都存在神经元连接关系中。
- 大脑新皮质的新发现
- 发现 1:新皮质学习世界预测模型。
- 发现 2:预测发生在神经元内部:树突脉冲就是预测。
- 发现 3:新皮质的关键是参考系:神经元可以处理参考系,以追踪位置、预测结果。
- 大脑中的地图
- 旧脑:内嗅皮质中存在网格细胞和位置细胞,网格细胞建立参考系,位置细胞确定坐标;哺乳动物公有,记录空间位置。
- 新脑:更细化的相对坐标系;每个皮质柱都存在网格细胞和位置细胞。
- 大脑中的参考系
- 空间位置信息容易建立参考系,但考虑到所有智能都是一套基本算法,抽象的知识如何建立参考系?
- 参考系管理知识
- 大脑也会为抽象的知识建模,形成参考系。
- 思考也是一种移动:思考的时候激活特定坐标的神经元。
- 位点法 / 记忆宫殿:想象物品放在家中不同房间不同位置,回忆的时候就像在家里移动找东西。
- 大脑的两个视觉通路
- where:以自身为基础的参考系,用来触达目标物体。
- what:以目标物体为基础的参考系,用来了解和使用物体。
- 案例
- 数学:将所学过的所有方程式放在参考系中,数学证明就是移动到不同区域取方程式,并在新区域产生新的方程。
- 政治:将采取不同的政治行动可能导致的后果放在参考系中,在脑海中预测一连串行动的后果,做出决策。
- 语言:字母组成单词、单词组成短语、短语组成句子、句子组成段落,语言知识是嵌套和递归的。
- 成为专家的关键是建立好的参考系。
- 千脑智能
- 现有理论:新皮质是个特征检测器 + 流程处理器,中心化决策。
- 千脑智能理论:每个皮质柱独立工作,接收不同触觉输入并建立对应模型,多个皮质柱模型互补产生对目标的认知,分布式记忆 + 投票决策。
- 人工智能现状
- 两条方向:只能在单一任务上远超人类水平;可学习复杂任务但性能很差。
- AGI 的难点在于知识表征:如何将人类常识用计算机能理解的方式表达。当前的神经网络和深度学习技术都无法做到。
- 人工智能现状
- 智能的判断标准
- 持续学习:智能体的世界模型需要持续学习,应对不断变化的世界。大脑通过神经元实现。
- 运动学习:触觉只能对有限区域建模,因此需要通过运动来学习。大脑通过皮质柱的感觉 - 运动系统实现。
- 多重模型:多传感器为基础的建模能力,多种互补模型更能描述世界。大脑存在投票机制。
- 使用参考系:作为知识的骨架,为世界模型提供信息表征的能力。皮质柱使用网格细胞和位置细胞来实现。
- 智能来自于机器如何学习和存储世界知识。人类之所以聪明在于几乎能学会做任何事。
- 智能的判断标准
- 机器与意识
- 存在感是意识的核心,即感受到自己是正在活动的智能体。
- 感受质
- 感觉输入被感知的方式,以及带来的感觉;偏主观,每个人的感受可能都不同;本质上是世界模型的属性。
- 也有非后天习得的感受质,比如疼痛感。
- 哲学困境:关掉有意识的机器算不算谋杀?
- 机器智能的未来
- 三部分待实现:具身、旧脑(人类情感)、新皮层(人类智能)。
- 具身:各种传感器和移动传感器的能力。
- 旧脑:直接控制具身的运动,产生目标和动机,以及情感、价值、本能等。
- 新皮层:实现通用学习系统。速度和容量是优势。
- 三部分待实现:具身、旧脑(人类情感)、新皮层(人类智能)。
- 机器智能的风险
- 公认风险
- 智能爆炸:人类生产出比自己更智能的智能体,智能体进一步生产比自己更智能的智能体。
- 目标失调:人类对机器失控,且智能体和人类目标不一致。
- 作者反驳
- 智能爆炸:智能体也是基于皮质柱小模型以及参考系来构建知识的,也需要经过学习过程,不会凭空创造知识。
- 目标失调:智能是学习世界模型的能力,没有动机,且人类制度会限制小部分人或机器拥有过多资源。
- 作者认为
- 任何有大规模复制能力的都是危险的,不管是机器还是病毒。
- 其次是动机,动机是进化的结果,不进化不会产生反人类动机。
- 智能程度是最温和的。
- 公认风险
- 大脑错误观念
- 模型错误:大脑构建的但不符合事实的模型。例如截肢了的人感受到幻肢。
- 病毒式传播模型:能二次传播影响其他人大脑的模型。
- 错误的病毒式传播模型:不正确且能到处传播的模型。
- 信徒之间 meme 的传播,会产生更多信徒。进化论角度正确,生命并不是为了模型正确,生命是为了复制。
- 主动为自己的世界模型纠错
- 大部分对世界的了解是通过语言完成的。比如天天看美国的新闻和文章,但没亲身去过,“美国”真的存在吗?
- 主动寻找自身观念相反的证据,才能意识到自己的模型偏差需要修复,离真实世界更进一步。
- 人类智能的风险
- 旧脑风险
- 依照进化论,唯一目标是增加自身存活概率、繁衍并将基因传递下去。
- 但带来了人口过剩、战争、资源过度开采等风险,需要新脑压制,比如发明绝育技术。
- 新皮层风险
- 容易被愚弄从而构建错误的世界模型;无视相反证据并努力维持自身信念;并把错误观念传播出去。
- 知识高于基因。
- 旧脑风险
- 脑机结合
- 上传大脑理论上可行,但实际上会有很多问题。大脑涉及到全身大量感官,且有复杂的连接交互关系,只传大脑会影响整体协同稳定性。
- 脑机结合也都无法做到永生。
- 人类遗产保存
- 把时间线拉长的话,人类终将灭绝,如何规划人类的知识遗产。SETI 和 METI 计划。
- 人类灭绝阻止
- 脱离地球成为星际物种;DNA 编辑;制造有着人类智能但不依赖人类的机器。