第七章 解问题前先谈分类¶
现在这个时代, AI 这个议题很夯。但是,我个人虽然是资讯工程师,但是我并不太相信现在 AI 科学的水平。甚至认为觉得很多市面上 AI 所号称的成就是吹嘘。
怎麽说呢?现在绝大多数领域所称的 AI,我认为只能称上大数据。透过足够够大的历史数据,观察到数据一定的 pattern,从而进一步穷举未来的发展,进而对做出相对胜率高的决策。
以前我们所知的下棋机器人,多是类似的设计机制。输入大量棋谱,找到模式。或者是自我对下个几千万局,找到新解法。
理论上,我们希望AI 的终极完成品。发展出与人类相当,对任何环境变化皆能灵巧应变的通用人工智能 (Artificial General Intelligence,AGI),而不再侷限于特定的应用范围。
这点,未来机器能做到吗?我不敢打包票。
不过,我认为也无需慌张。因为现今的人类与 AI 都有同样的致命侷限上的问题。我的观点主要有二:
一、人类自我学习演化的演算法是 match 过去记忆,参考其他人答案,上网搜索,找到类似模式的答案。当今的 AI 也是类似如此,大量输入过去资料,然后预测未来。
而因为机器的算力与资料库远远大上人类。所以人类惧怕 AI 真能取代自己的岗位。
但是,我在书的前半章,已经解释这个资料库竞赛的问题。资料酷竞赛很有可能只会找到死胡同。真正解法根本不在同一个维度裡面。而是一个全新的解法。
二、资料库搜寻法还有一个真正最致命的问题,就是原始资料分类错误。
为什麽股市 AI 难以预测股价?¶
我朋友知道我在研究价值投资,精通拆解财报。也投资了一个财报分析网站。一直很希望我给网站加个功能,希望我去研究当今技术分析相关的技术。并且还给我推荐了一本用数学破解股市的书,给我参考。
我看了却很不高兴。认为这本书是胡扯。当然,如果你有研究股市,就会觉得我发这个飙莫名其妙,股市分析有分两派学说,一派分析财报经营数据推测股价(称财报数据),一派分析股市股价涨跌数据推测股价(称技术分析)。
江湖觉得这两派各有优胜劣弊。我却完全不这麽认为,甚至在我认真研究过后,我甚至觉得技术分析派很大部分的一帮人,是在胡扯。
为什麽我是念数学的,还觉得技术分析派用过去股价数据分析找出股价趋势是胡扯呢?
这要扯到股价是怎麽计算出来的。因为这本书不是股票书,我在书中尽量不用高深字眼,以免读者陷入五里雾,我会尝试用国中数学解释这个理论。
在财务理论裡面,有一个大家公认的股价推算法,叫做 DCF(现金流折算法)。具体公式我们这裡不展示,你只要理解这 F(x) = y。x 可能基于过去的营收、利润、现金流,透过一些微积分公式,最后会产称出 y 的股价。
假设所有公司都是用 F(x) 去估价,那理论上我们当然可以收集一大堆公司的 y 去跑大数据与统计,去逆推算 F(x) 的公式,然后再针对现在的营收、利润,看看 y 是否显然被低估。
但是,市面上所有的公司,并不是只有 F(x) = y 型。
更有
- G(A) = W
- H(B) = M
- J( Q) = R
- K( R) = S
- ....
(以上的英文代号是我随便诌的,只是让各位读者知道“每种”不同公司有不同类型,并不是同一个公式)
但是,如果我们把所有公司历史上的股价,都倒入 F(x) = y 的模型,去跑 AI 去逆推股价,那这不就是张飞打岳飞的好笑局面。
所以我认为现在号称 AI 算牌的,最好笑就是这样的设计。因为几千间公司怎麽可能都是用一个 F(X) = y 可以解释。
如果我们要预测数据。起码要分群才对。
比如说我们至少得将
- G(A) = W
- H(B) = M
- J( Q) = R
- K( R) = S
- ....
不同类型的公司,先分群然后再去看他们的特徵才对。
而且,当今现在不论是财报分析派又或者是技术分析派,对于公司的分类一开始就分错。比如说一个经典的错误,就是拿台积电与鸿海分在同一类,因为他们看起来“都是电子类”。
实际上台积电是 F(X) = Y,而鸿海是 G(Y) = Z。鸿海在财务结构上,其实跟 COSTO 这间公司更像才是。
而跑数据分析最致命的问题是。
如果一开始数据不分类,或分错类。就会是 Garbage in Garbage Out,用 AI 再算一百年都算不出来。
股票要如何分类¶
每种股票,背后其实都代表的是一间公司。其实股价的方程式远不止
- G(A) = W
- H(B) = M
- J( Q) = R
- K( R) = S
- ....
更精确的拆分下去。公司大体上还分成三种类型:
- 利润型
- 周转型
- 槓杆型
利润型的公司,主要人拼技术竞争力,赚智商税,而智商税就显示在高毛利上,有一定的技术领先力,才能赚取超级高的利润。
周转型的公司,如 COSTCO、Amazon,就是跟人拼渠道与资金谈判、周转力。这一类的公司淨利薄,但是可以一年做很多趟生意。鸿海为什麽跟 COSTCO 更像,因为鸿海本身做的是苹果的统包整合组装厂商生意,鸿海本质的生意模型是跟各上游厂商进货,组装成手机出货买给苹果。所以本质是批发商的生意。
然而 Amazon 为什麽可以节节增长,鸿海却不行这几年节节败退呢?这是因为 Amazon 卖的是杂货,面对的是广大消费者。而鸿海的出货对象却只有苹果而已,当苹果出货衰退,鸿海的业绩就自然也跟著衰退了。
而槓杆型公司,代表如地产公司、航空业公司。这一类公司的具体特徵,就是资本大、重资产。利润则可能大可能小。但是相同特徵都是需要拼资产抵押借贷、拼银行交情,开槓杆玩超大资本游戏挤利润。
而这类型的公司,就是受景气影响很大。当景气好时,能赚很多钱。当景气低迷时,赔破裤杈都很有可能。比如说 COVID-19。就几乎搞死航空业。因为这类型行业,槓杆都开得太大了。
当你打开这三类型的公司的 ROE 的结构组成( ROE = 淨利率x周转率x槓杆倍数)。就会发现这三类型的数据起伏形状,是差别很大的。
因为利润组成非常不一样。为什麽又可以拿 F(x) = y 去逆推算呢?
再来。这三种是有存货类型的公司。
接下来我们要谈的是两类特殊公司。前者是网路业,没有存货,几乎大部分的支出都是营业费用。后者是银行、保险、金融特殊产业,这类公司的存货就是现金。
前者没有存货,所以只能看收款天数与毛利率去推估竞争力。后者的公司,因为法规的关係,大多数利润有法令上限,利润多半跟规模有关係。
这两类公司的行为与前面三种又是不一样的。
再来,还有公司的战法,不是用利润扩张的,而是用现金流扩张的,如 Amazon。Amazon 的战法并不是尽量赚取利润,而是尽量投资到能够快收客户现金,慢付给供应商的新生意模型裡面,利用中间付款的时间差与现金,扩大生意规模的玩法。
我可以再继续讲下去。不过这裡花了这麽多篇幅去叙述,只是为了让读者知道,股价与利润产生模式可以很不一样,我在这裡举例的,甚至是很粗的分类。
更不用说股市裡面,还有一堆垃圾公司。而且大公司中公司小公司(比如说千亿、百亿、十亿三种不同规模)的成长曲线为很不一样。所以怎麽可以用同一种模型去推算。
听到这裡你可能会觉得好像超複杂。
但其实也没有那麽複杂。
其实,在实务上,某些经营一定年限、并且一定规模的某些类型的公司,股价函数真的是可以逆向预测的。而且可以测到非常准。
只是这些公司的名字,一般投机者都会觉得无法在几天内致富,不想投资而已。
在我研究财报时,我发现因为股市牵涉到大量的数据资料,而且这个领域的人,在过去没有太强的计算机,而且切入角度错误,连正确的分类都做不到。所以反而这个领域大部分的资料,都长期处于张飞打岳飞的状态。如果在这个领域裡面死瞌,简直是死胡同一条。
反而是跳脱财报书籍,重新对资料分类,反而能看出很多有意思的产业趋势以及在数学上“证明常识”。(比如说我在用大数据研究相同类型公司股价时,反而发现利润与存货天数、收现天数有非常大的正相关。但在财报书上,这两个数据却常被人忽视,甚至觉得不重要。大家反而觉得毛利率、淨利率比较重要。但试问如果货卖不出去,钱收不回来。货卖不出去,于是把货卖成三倍价钱。卖一个顶以前三个。那麽毛利率其实是不变的。淨利率甚至也可不变的。在财报上看不出来,但是生意却是变烂了。这就解释你明明开始觉得某些公司的产品变烂没人买了,但是财报上数据依旧亮丽。)
从李约瑟问题谈分类的重要性¶
我在 Bilibili 上非常喜欢一个经济学家。陈平老师。他本身是物理学家背景出身的经济学家。
陈平老师的特点,在于近年来预言中美关係以及外交、经济进展,屡讲屡中。其实以一般观点来说,他的影片非常政治不正确,经常在Youtube 上得到红叉(限流)。但是屡讲屡中的背后,却往往扎实的理论。
最近几个月的更新,他提了一个很有意思的问题:“科学与资本主义为什麽诞生于西欧而非中国?”这个问题,俗称李约瑟问题。
一直以来。学界对这个问题非常疑惑。照理来说,中国是五千年的古国,人口数量又多于欧美国家数倍,人才倍出。加上语言文字又统一,国力相对强大。为何偏偏在明清时代停滞、科技落后,反而败给了欧美诸国。直至最近,才勉强赶上。
坊间很多有很多理论,却都无法好好解释这个问题。
为什麽欧美重科技与资本发展,还有专业分工。然而中国却多年以来,重点在于自给自足。
他从战争型态找到了答案。
欧美与中国的战争型态自古以来是非常不同的。欧美的战争,规模更是比中国小了许多。
其中最值得一提的是,如果你近距离观看,你会发现两者本质战争型态的不同。中国的战争本身是围绕著亚洲大陆的佔地。欧美多数的战争是围绕著佔交通要道。
古代战略有“兵马未到,粮草先行”。为什麽?因为中国实在太大了,人也太多了。所以战争本身打的是补给线战争。甚至有屯田策略,派兵过去,无战时耕田,战争时是士兵。中国围绕著是佔地。本身是农业民族VS 游牧民族的内战。
但欧美因为人少,不是玩佔地的战争。所以它们主要是控制交通枢纽,打下来做生意。因为人少,要以少击多,拼的就是科技,拼的就是资本操作。
所以欧美国家要维持自己国家的优势,必定是提高自己国家的科技水平,进行槓杆操作。而中国因为本身地够大,资源也多,但几千年以来,目光锁在内部的资源攻防消长,而完全无视拓展广阔的海外资源。
当这样一分类后。你会发现,其实就国家发展与战略方向,欧美与中国是非常不同的。
当然,你会觉得废话,“不同”是当然的。但是“有那麽当然吗?”
很多时候,我们会认为“民主”会带来“富足”。但是这句话是真的吗?我们看看“南非”的例子,菲律宾的例子,好像不是这样。我们再看看新加坡的例子,又发现又再反了一次,说不太通。其实,就连美国本身的强大也不是民主所带来的。而是美国的战略位置与国家资源太好,加上诞生在一个特殊的时代,才有现在的局面。
但是我们却会因为美国当今的强大,以为“民主”等于“强大”等于“富足”等于“现代化”。
但美国是因为地太大,玩不来,所以才搞的民主。中国是因为人太多,如果搞民主太容易因为一个动乱,搞到灭国大爆炸,才搞的专制。每种国家,因为地形与交通,都有自己适合的政治制度。并不是大家都适合同一政体政治制度。这次 COVID-19,就让我们看到极端状况下,不同政体与政府,控制疫情调度的手段与结果。
为什麽我们遇到大问题时,得先分类?¶
人世间有很多问题,为什麽看似无解。而是我们人在思考问题时,有个很严重的缺陷盲点,叫“一元思维”。指的是人类盲目认为总有一个强大原则与公式,能贯穿所有不同个体,解释所有事情。
所以多半的战略目标,就是穷一切资源,逆推出一个终极公式,追求领域最强者的攻略。带入各种情况,就能得到最终想要的结果。
但事实上这个理论是不存在的。不但不存在,可能还会把你绕进死胡同裡。
比如说计算机现在还有一个圣杯,是研究写作机器人。但是写作机器人根本写不出能用的散文、小说、广告词、等等等等。
我最新的研究成果是极速写作法。一天写完一本书。在研究这个议题过程与发明全新的写作流程中。我得出一个是全新但也是废话的结论。就是写作虽然可以有模版,有结构。但是不同的文体,其实写作流程、模版,甚至与分类切入结构是非常不一样的。
而当今的写作机器人却很笨的把一堆张飞岳飞的文都倒在一起,难怪最后的写作机器人文章写出来的文章是那个熊样。
所以,当今的坏消息虽然是 AI 的算力远超过人类。但是,好消息却是当今的 AI 算法与人类算法,都有致命性的分类盲点。
而你只要知道,在解决千古难题时,试著先把你遇到的问题或局面,分类一遍。搞不好你就可以更快找到关键的切入点。