向DeepSeek学深度思考,打造组织护城河
深度思考不是天才专利,而是可复制的系统方法。
3月24日晚,比亚迪交出历史最强成绩单,2024年营收7771亿元,同比增长29%;归母净利润402.5亿元,同比增长34%。营收首次突破千亿美元,超越特斯拉,成为全球第一大新能源车企。
这家曾被人嘲笑“土味造车”的企业,在2019年的至暗时刻,利润同比下降40%,扣非净利润仅2.3亿元,汽车、光伏、储能等产业均陷入困境,月销量长期徘徊在3万至4万辆,被戏称为“比三万”,但现在应该称呼其为“迪王”了。
其实在发布会之后,我就通过 DeepSeek用巴菲特“护城河理论”梳理了比亚迪和特斯拉,那哪个公司的护城河更深,更有投资价值呢?
DeepSeek按照我的护城河四个问题的框架回答得非常好,不亚于一个商业分析师。但是,前提条件是你要理解巴菲特护城河理论。那么,AI(人工智能)可以模仿人类思考,人类是不是也可以反向学习 AI?就像2016年阿尔法狗在围棋战胜人类之后,人类通过向 AI学习,围棋水平提升到一个新的高度。
所以,今天和大家分享我最近在和 AI协作投资、研究的过程中,如何将投资研究的工作效率提升了4倍以及如何向 DeepSeek学习深度思考。
什么是深度思考?
特斯拉创始人兼首席执行官马斯克说,深度思考对于解决问题和创造新事物非常重要,你需要深入研究一个问题,理解其本质和根源,然后提出创新解决方案。
心理学家、诺贝尔经济学奖得主丹尼尔·卡尼曼说,深度思考是一种对信息进行批判性分析的能力,它涉及对信息的综合、评估和推理。这种思考方式可以帮助我们避免被表象所迷惑,作出更明智的决策。
在 AI身上,就是体现在 DeepSeek让人惊叹的思维链,它通过分步推理、动态修正、多模态整合模拟人类的思考过程,将复杂问题分解为多个中间步骤,并逐步推导得出结论,从而提升模型在逻辑推理、数学计算、代码生成等任务中的准确性与透明度。
也就是把 Open AI等 AI大模型的“黑箱决策”转化为可追溯、可验证的逻辑链条,也给了我们向 AI学习的机会。
这样的训练和技术分为三个阶段,也可以迁移到企业和投资中。
第一,预训练(Pre-training)。
构建知识的底层操作系统,也是构建思维链里面的底层逻辑基础。它的核心逻辑是让 AI像人类幼童般“博览群书”。通过海量文本数据(书籍、网页、代码、对话记录等)来训练模型,使其掌握语言规律和基础知识。
这个过程如同给 AI装了一套“底层操作系统”,决定了它的知识广度和基础能力。预训练阶段特点是无须监督学习,无须人工标注,模型通过预测“下一个词”来自我进化。这个过程中要特别注意数据库的偏向性。
我在看到比亚迪的年报之后,让 DeepSeek帮我统计比亚迪和特斯拉两家公司从2020年到2024年的营收、研发费用/研发费用率、销售费用/销售费用率。结果,出现了两个问题:
1. DeepSeek没有使用刚刚发布的比亚迪2024年年报的营收数据,只是用比亚迪2024年前三季度的数据来推算,特斯拉也是这样的情况,导致计算结果错误。然后,我就给它投喂了比亚迪和特斯拉最新的年报,数据才会修改。
2.在看到2024年数据错误后,我在想其他数据是不是也会出现错误?我马上就用专业股票软件数据核对,结果营收数据对了,但是中间的研发费用、销售费用出现了错误。由于数据更新速度和语料库的原因,会导致大模型出来的结果出现重大失误,行业简称为数据幻觉。
这里我给大家一个警示,再好的大模型,进去的是精华,出来的就是精华,进去的是垃圾,出来的就是垃圾。
这也是为什么这么多中国企业宁肯自己耗资几十万元,买英伟达50、90GPU(中央处理器),本地部署 DeepSeek,用自己的公司和行业数据投喂,问答就更有确定性和专业性,同时能够保证数据的隐私安全。
像比亚迪电池实验室就是类似的思维,将2000份专利浓缩成“技术要素矩阵表”,形成研发人员理解和运用的结构化知识体系。
华为海思芯片团队要求工程师阅读全球3000多篇顶级论文建立知识图谱,美的集团在工业互联网平台预训练阶段,就投喂了亚马逊、西门子等50家企业数字化转型案例,构建出制造业知识库。
第二,监督微调(SFT, Supervised Fine-tuning)。
打造专业领域的行为规范,定向训练思维链生成规则。
核心逻辑:像培训新员工一样“手把手教学”,用高质量经过标注的数据(问答对、操作指南等)调整模型行为,使其输出符合人类需求。
这个过程如同给 AI编写“岗位说明书”,规范专业技能。像宁德时代质检系统用5万张电池缺陷图片做监督微调训练,将误检率从12%降至0.7%。大疆农业无人机监督学习3000种农田作业轨迹,实现果树环绕喷洒等高难度动作。
第三,强化学习(RL, Reinforcement Learning)。
在实战中修炼顶级高手,精细化调整思维链质量。
就像奥运会选手模拟的“以赛代练”,通过实时反馈机制(用户点击、评分、对比选择等),让 AI自主优化决策路径。这个过程如同给 AI安装“进化引擎”,使它在复杂环境中持续突破极限。强化学习阶段的精髓,就是设计奖励机制,定义清晰的评估标准,如对话质量评分,类似我们给团队发奖励和奖状一样。
更高级的是采用多维度博弈:让多个 AI智能体相互竞争、协作,像 Alpha Go 1.0是投喂了人类历史的百万围棋棋谱,到了 Alpha Go 2.0阶段,就是自我对弈模式,不需要棋谱。
那我们如何才能像 AI一样深度思考和学习?记住三个要点:
第一,建立“行动—反馈—调整”的正循环,就像打游戏升级一样,每完成学习任务立刻检验效果,用他人评价修正自我认知。
第二,深度拆解顶尖案例,看书的时候,边读边画知识图谱,把复杂信息提炼成可复用的思维模型。
这也是我2024年做得最多的研究,将过去腾讯、美的、华为、小米等公司做了深度分析,梳理成长模型,同时对过去20年,5次牛市进行了深度复盘。
第三,用头脑风暴对抗思维惯性。
遇到问题同时想出3种解决方案,就像下棋推演一样比较优劣,日常可以安排15%的陌生领域挑战,睡前花10分钟回顾当天所学,这样大脑会像 AI训练神经网络一样,在不知不觉中提升举一反三的能力。
深度思考不是天才专利,而是可复制的系统方法。
当我们拆解 AI和中国企业的进化密码时,就会发现“预训练—监督学习—强化学习”的思维链三阶进化,正在塑造中国制造的思维基因。
假如每个岗位都能像 AI模型那样持续学习、规范输出、快速进化,组织的思维链就会成为企业坚固的护城河。毕竟,连机器都知道深耕胜过乱撞,人类又怎么总做思维上的“机会主义者”?