
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、金融科技、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业50W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。 骐骥驰骋,业绩长虹
卖方股票研究的基础运作逻辑
关于一个关于卖方分析师的工作可能是这样的:
1、有很多买方投资公司公募、资管等——每家公司都可以投资于由数千家公司组成的同一个庞大市场。
2、它们都试图做研究,了解这些公司,并投资于好公司。
3、一个人很难真正深入了解超过一两个行业,以及超过几十家公司。
4、一个典型的中型资产管理公司不可能真的雇佣数百名分析师来详细了解每一家公司。
5、所以就有了某种资源共享:不是每个基金经理都了解每一家公司,而是出现了"卖方研究分析师",他们受雇于大型券商、投行或小而精的研究机构,每个人都深入了解十几家公司,熟悉他们的管理层、供应商和客户,跟踪他们的盈利,建立详细的财务模型来预测未来盈利,撰写有洞察力的报告来解释这些公司,并在这些报告上加上一个词的推荐——“买入”、“卖出”或“持有”——这样你就知道是该买入、卖出还是持有这些股票。
6、这些研究分析师(或者更确切地说,他们所在的公司)将他们的研究——推荐意见、详细报告、财务模型,以及最重要的,能够打电话给分析师询问关于其所覆盖公司和行业的详细问题的能力。分析师的成本不是由一家投资公司支付,而是在许多订阅同一家卖方公司研究的公司之间分摊。
7、投资公司能够雇佣更少的自己的分析师,每个分析师可以覆盖更多的行业和公司,因为他们可以依靠卖方研究来获取专业知识。
所以,卖方研究是许多买方投资经理分担深入了解他们可能投资的每一家公司成本的一种方式。
一种解释:大多数卖方研究由投资银行和经纪公司提供,他们的业务是为买方客户进行交易并赚取佣金。客户交易越多,经纪公司赚的钱就越多。不断发布“买入!”和“卖出!”的报告流能带来业务。
另外一种解释:分析师的工作(不仅仅)是撰写报告和推荐股票,而且(主要)是让买方投资者接触到公司管理层。在这个理论中,买方投资者希望与他们可能投资的公司管理层会面,但管理层有时间限制,不能与每个投资者会面。但研究分析师与管理层有良好的接触渠道,因此他们可以利用这种渠道为卖方客户安排与管理层的会面。这与其说“卖方研究是买方投资者分担了解公司工作的方式”,不如说"卖方研究是公司分担让投资者了解自己的工作的方式"。
这些标签都有一定道理,但我们今天只关注一点:卖方研究公司向买方出售他们的研究,是因为这些研究作为"研究"对买方有价值。
虽然买方投资公司从卖方研究分析师那里“购买”研究,但这过于简化了。事实上,很多卖方研究分析师受雇于券商和经纪公司,他们免费向资产管理客户提供研究。作为免费研究的交换,经纪公司期望客户通过他们进行交易,并支付佣金;一部分佣金会被用来支付研究费用。但这个模式存在利益冲突:
研究成本实际由买方的客户承担,而非买方自身。
近5-10年卖方研究行业的冲击
1、指数基金崛起:指数基金仅按市值配比持仓,无需任何企业研究,而传统主动管理型基金持续萎缩,直接导致卖方研究的核心客户减少;
2、对冲基金自研能力强化:大型多策略对冲基金要么采用量化投资,无需人工基本面研究;要么高薪雇佣分析师开展自研,将深度基本面分析作为核心竞争力,极少依赖卖方研究;
3、散户投资常态化:很多散户秉持“自己做研究”的理念,对卖方研究的付费和使用意愿极低;
4、人工智能的替代威胁:一些大型机构已试水 AI 分析师聊天机器人,市场对人工基本面分析的价值产生深层质疑。
行业不景气的具体表现
1、人员大幅裁减
2、薪资停滞/递减
3、研究支出暴跌
如果投资者集中资源为每家公司付费研究,那么每家公司都会被覆盖,投资者就可以获得研究来帮助他们了解并可能投资于每家公司。如果没有这些,小公司可能会变得不可投资:如果你无法通过阅读卖方报告快速了解情况,又不能证明投入几十个小时自己了解每家小公司以便挑选几个好的,你可能就会忽略这些小公司。
根据相关学术论文显示,投资者会持续高估或低估那些被较少分析师覆盖的公司。另一项研究发现,覆盖率下降的公司,其投资者认知度显著下降,从而增加了其资本成本。第三项研究显示,覆盖率低的股票交易量更少,买卖价差更大,而"被遗弃"的公司退市的可能性要大得多。
不过,回到上面提到的最后因素,即散户投资者的崛起。散户投资者历来是卖方研究的客户——如果你在大型经纪公司开户,该经纪公司可能会让你访问一些研究报告——但不是特别重要的客户(他们可能不为研究付费,也不太可能直接与分析师通电话)。但当代散户投资的兴起带有一种“自己研究”的色彩(个个都是股神),他们花大量时间在各种股吧、炒股软件、社交媒体网站上,而不是阅读卖方研究。
但是,如果卖方研究正在衰落,而社交媒体驱动的研究正在兴起,那么资源就会出现明显的重新分配!
例如,最近一些私募管理人和相关买方\卖方在微信和知识星球上进行公开课、私享课售卖,其数百名\千名订阅者带来的盈利远超自己的收入。
现在的行业现状就是:自媒体成为新的赛道,但仅有少数分析师实现成功转型,多数人仍处于小众运营状态!
做一个全职的自媒体会是什么样子?
让我们来聊聊埃隆·马斯克。
埃隆·马斯克的人设就是:他超级投入,牺牲一切,每天工作24小时,睡在工厂地板上,只为经营好特斯拉公司。还有SpaceX:也是每天24小时,睡在地板上,造火箭。还有,自从他买了Twitter并改名为X,每天花24小时在X上发帖。他还从X发展出了一项AI业务,叫做xAI,并且非常投入地做很多AI相关的事情。而且,通过X,他进入了政界,每天24小时,睡在地板上,致力于政府效率或其他什么等等。
关键是,马斯克不仅有很多相互竞争的爱好,而且他对所有这些爱好都是百分之百地硬核投入、全天候不停歇。他不是把一半时间花在特斯拉上,四分之一时间花在SpaceX 上,5%的时间经营X,10%的时间在X上发帖,5%的时间搞AI,4.99%的时间搞政治,0.01%的时间给无聊公司;而是,他是把200%的时间花在特斯拉上,200%的时间花在SpaceX上,200%的时间花在经营X上,200%的时间花在政治上,200%的时间花在AI上,还有 0.01% 的时间给其他。
而且,马斯克还称自己是《暗黑破坏神》的世界顶级玩家之一。一位《暗黑破坏神》的忠实粉丝说他在1个月花了大约80个小时才打到深渊层的第129层。而马斯克声称在1个月通关第150层!
可能有人会说“马斯克付钱让别人代练”,也许吧,但在我们的结论是:在那月段时间,他每天坐在电脑前玩《暗黑破坏神 IV》,同时在那月段时间里,也每天在竞选路上,也在特斯拉工厂车间,也在SpaceX,也在发X。这在物理逻辑上是不可能的!但这正是重点所在。
他是怎么做到的?
理论1:他非常擅长授权和赋能下属,所以很多事情即使没有他也能完成,但他同时也对一切了如指掌,能够将所有帝国的事务记在脑中,这样他就可以不断地在一家公司进行两分钟的干预,然后切换到另一家公司的两分钟干预,再到政治领域的五分钟干预,同时还能发大概12条推文,所以从非常真实的意义上说,他可以整晚在特斯拉工作,同时整晚SpaceX工作,同时整晚发推。
理论2:我们活在一个模拟世界里,由于某种原因,马斯克能够在模拟软件中运行他自己的多个副本。
理论3:他在夸大其词,可能是为了博取同情,也可能是为了让自己看起来更令人印象深刻。
如果这是你的拿手好戏,你总是可以试着再多加一件事来超级投入:你还没达到极限,而且你每天24小时做的事情越多,每件事就越显得令人印象深刻。
量化投资
量化投资研究员,在对冲基金或学术界的基本工作是使用机器学习技术来发现预测未来股价收益的信号。在对冲基金,当你发现一个信号,你就用它来交易:买入你的信号预测会上涨的股票。在学术界,当你发现一个信号,你就写一篇关于它的论文。
两者实施方式的不同导致了对信号类型重视程度的差异:
而两者的重点只是工作成果有差异:
在学术界,一旦你找到信号,你还没完,你得去把它写成论文!论文应该说明“这是能预测股价收益的东西”,还要说明“这个东西如何融入现有文献”,也许还要说“你可能认为这个东西会因为……而有较好预测收益的能力,或者你可能认为它会因为……而预测糟收益,但事实上它预测了良好收益,这为……模型提供了支持”,等等,你懂的!这可能有点公式化。你已经用机器学习技术找到了信号。你能……也许……你知道的……
举个例子(作者 Robert Novy-Marx、Mihail Velikov):本文描述了一种使用大语言模型自动生成金融学术论文的流程。它通过生成数百篇关于股票收益可预测性的完整论文来证明该流程的有效性,这个主题特别适合我们的例子:
我们首先从财务数据中挖掘出超过30000个潜在的股票收益预测信号,并应用Novy-Marx和Velikov(2024)的"异常检验"框架,为通过该框架的96个信号生成标准化的“模板报告”。每份报告都详细说明了该信号在通过各种测试预测股票收益方面的表现,并将其与200多个其他已知异常进行比较。最后,我们使用前沿的大语言模型为每个信号生成三个不同完整版本的学术论文。不同的版本包括为信号创造性的命名、包含定制的引言等,并引用现有(甚至虚构文献)文献来支持各自的主张。这个实验说明了AI在提高金融研究效率方面的潜力,但也作为一个警示故事,说明了它如何可能被滥用来HARKing。
如果把会计数据的所有组合可能都筛一遍(靠计算机实现海量运算),总能找到一些回测表现极佳的指标组合:比如在历史数据中,当财务比率 X>2.0、利润表科目 X 占资产负债表科目 Z 的比例≥8% 时,股票下一季度的收益率,平均比 “比率 X<0.8 且利润表科目 X 占科目 Z 比例>12%” 的情况高出 110 个基点(1.1%)。这类规律在数据层面看似成立,但本质是计算机从海量数据中筛出的偶然关联,而非真正的商业规律。金融学术论文要求 “假说先行,验证在后”,而纯数据挖掘是“结果先行,假说在后”。
所以,这只是数据挖掘,只是运气。你不能发表这个!
要解释清楚「为什么这个特定的会计指标组合,能反映出市场尚未发现的企业经营真相」,且这套理论最好能得到过往学术研究/行业实践的佐证。
简单说:数据是结果,逻辑才是根基——哪怕数据回测再完美,没有合理的商业逻辑支撑,就是空中楼阁。
幸运的是,大语言模型擅长为你塞给它们的任何东西。它会生成听起来合理的解释,所以你的论文就搞定了!
如果你在一家量化对冲基金工作,发现了一个好的信号,你的老板说“是的,统计上没问题,但如果我们没有一个合理的解释,我感觉不太放心用它来交易。”
你可以说“稍等,我十分钟后回来”,然后让 ChatGPT 生成解释。
结语
从信息不对称到信息过载,从主动管理到被动投资,从人工研究到 AI 赋能,卖方研究行业的萎缩并非单纯的行业问题,而是资本市场发展到新阶段的必然结果。
行业的未来,不在于对抗这些变革,而在于适应变革、重构价值——无论是卖方机构向高附加值服务转型,还是分析师向个性化研究赛道迁移,核心都是让研究重新匹配资本市场的真实需求。而对于资本市场而言,如何在变革中保持信息效率,避免中小企因研究覆盖缺失而被边缘化,将成为市场参与者面临的长期课题。