将数据放在角落里:LLM 和金融服务数据

没有人会把 “宝贝 “放在角落里,尤其是当 “宝贝 “是零散的金融服务数据时。从历史上看,建立一家成功的金融服务数据公司的关键在于提取和分析有价值但难以获取的资源,如公开文件、尽职调查材料、研究报告、电话会议记录和新闻。现在,随着大型语言模型的出现,这些以前被束缚的信息可能很快就会被每个人轻松、广泛地获取,从而开创一个由 LLM 驱动的新时代,改变金融服务的格局。

尽管如此,金融服务数据市场目前仍被几家市值数十亿美元的公司所垄断,这些公司凭借其规模和其他优势护城河,地位极为稳固。但是,彭博、晨星和 Verisk 这三家著名公司并不是凭空成为市场领导者的。在数字时代来临之际,它们最初都遵循了特定的三步玩法:1)在有价值的市场中发现大量零散的数据;2)找到将这些数据导入关系数据库的方法;3)对这些信息的访问进行收费。在这样做的过程中,他们各自都建立了现在已成为定义类别业务的开端。

对于希望利用 LLM 的出现并通过进入这些现有企业的上游来破坏现状的新进入者,我们深入研究了彭博社、晨星和 Verisk 的故事。在这里,我们为初创公司提供了一些教学课程,并提出了一些关于您应该考虑的问题的问题。让我们开始吧:

迈克尔·布隆伯格(Michael Bloomberg)在1981年被所罗门兄弟(Salomon Brothers)解雇后创立了彭博社(Bloomberg L.P.),在那里他负责销售和交易的分析工具。在看到投资银行更新日常交易和价格的大量文件后,彭博社用他的 1000 万美元遣散费构建了一个独立的 IT 解决方案,最初称为创新市场系统,为需要它的公司提供相同类型的数据和简单的分析工具。

在彭博社(Bloomberg)及其汇总的财务数据进入现场之前,公司必须独立收集数据,通常依赖于计算器。通过成为第一个以数字格式准确快速地捕获这些数据的人,彭博社能够以一种允许他的企业添加其他产品和功能的方式收集用户,其中最重要的是通信。

尽管布隆伯格能够通过收购约翰·奥伯特(John Aubert)的Sinkers等线下业务来继续发展自己的业务,该公司在一本参考书中公布了公司债券价格,但当该公司将美林证券(Merrill Lynch)作为他们的第一个设计合作伙伴时,最大的解锁就来了。这种关联不仅对品牌信任和认可至关重要,而且通过为美林不断增长的债券交易业务提供动力,彭博社能够从市场领导者那里获得实时数据。由于这些数据最终比当时所有其他平台的数据都要好,彭博社最终为《华尔街日报》的每日债券价格提供了动力,尽管《华尔街日报》的母公司道琼斯提供了有竞争力的产品。

彭博社意识到,以及它与Datastream(现为Refinitiv)等竞争对手的不同之处在于,建立在无法走投无路的信息基础上的数据优势不会永远持续下去。因此,该公司迅速将其早期领先优势与新闻和通信工具等其他服务相结合。如果没有终端提供的数据和分布,彭博社将永远无法与当时最大的两家现有公司道琼斯和路透社竞争。

尽管有非常丰富的数据馈送、分析模型和实时新闻,但彭博社最有价值的方面是社交方面。数据和新闻将所有合适的用户带到终端上,并创造了与任何其他社交网络相媲美的网络效应锁定。

初创企业的经验教训
彭博社最初的见解是将难以访问的数据转入角落,并以可用的格式提供给客户。为此,它收购了一家传统的线下业务,并利用该业务与一家大型公司合作,以进一步扩大其数据优势。然而,彭博社最大的见解是,除了继续在金融数据方面进行创新之外,其最重要的价值来自拥有工作流程和创造由其通信工具驱动的网络效应。

给初创公司的问题:
彭博社今天没有正确捕获哪些数据?
是否有彭博社没有很好地捕捉到的工作流程?
您的产品所服务的群体是否可能受益于封闭的网络通信中心?

晨星由乔·曼苏托(Joe Mansueto)于1984年创立,当时他意识到共同基金正在崛起,但没有良好的系统来评估它们的质量。准确评估共同基金质量所需的持股和报告数据存在于各种招股说明书、股东报告和价格历史中,但获取这些数据是痛苦的;分析师必须亲自写信给每只基金的经理才能访问他们的报告。在Mansueto意识到每个想要投资共同基金的人——从散户投资者到代表许多小投资者资本的大型有限合伙人(LP)——都必须经历同样的过程后,晨星诞生了。

Mansueto 最初的想法是意识到,将所有这些数据聚合到一个可搜索的地方本身就是一种产品,他的第一个产品是一本在《巴伦周刊》上销售的书,每年发行 4 次;最终,该数据库成为晨星的数字产品。随着时间的流逝,晨星已经利用其在数据聚合方面的初始优势,并进入了其他垂直领域。这主要是通过收购实现的,晨星可以立即增加这些业务的价值,因为它拥有成熟的销售渠道和行业领先的品牌。

晨星成功的一个早期驱动力是共同基金有限合伙人坚持他们的基金使用晨星进行分析和报告。这些有限合伙人需要一种简单的方法来向投资者解释他们正在投资什么以及为什么投资,而且他们知道,由于晨星早期的专业知识和声誉,他们可以信任晨星的研究和数据。一旦LP开始推动这一要求,行业就围绕它进行了标准化,晨星的品牌定位得到了巩固。

尽管没有任何核心工作流程或协作元素,但晨星在基金特征方面几乎垄断了市场,它利用来自强大品牌的更高利润率继续收购其他业务,这些业务垄断了有趣的财务数据池。也许这些收购中最有趣的是Pitchbook,它既有独特的数据,又是一个工作流程工具,可以帮助晨星与客户建立更像彭博社的关系。

初创企业的经验教训
晨星(Morningstar)是另一个典型的例子,早期的金融服务业者了解汇总具有挑战性的金融数据并实时提供的价值。

他们战略的独特之处在于他们如何利用有限合伙人来推动行业采用他们的产品。归根结底,共同基金为有限合伙人服务。当足够多的大型机构有限合伙人推动一定的报告要求时,它就会发生,基金就会标准化,从而形成品牌护城河。

给初创公司的问题:
是否有“为什么是现在”的顺风时刻,让您捕获的数据变得更有价值?
您所在行业中是否有参与者(客户、监管机构)希望帮助推动您的产品的采用?
你所提供的产品周围是否有品牌的空白?

1971 年,由 7 家大型财产和意外伤害保险公司组成的非营利性财团成立了保险服务办公室 (ISO),作为一个中立的第三方,可以帮助提供统计和精算服务、保险计划和州监管要求。意识到标准化和汇总大量保险评级机构的重要价值,ISO 现在是 Verisk 的子公司,能够整合大量数据。在定价和承保风险方面,这为访问它的运营商提供了更大的规模经济,这是Verisk数据飞轮的开始。

为了进一步巩固和扩大其数据优势,ISO扩展到评级机构之外,并开始标准化评级和表格。在火灾风险等难以投保的类别中,修改评级表尤为重要,ISO 创建了一个至今仍在使用的全国性火灾评级表。同时,ISO创建了一个大大简化的个人保险(家庭和汽车)保险单文件,使投保人更容易理解保单所涵盖的内容。这种标准化提高了品牌知名度和信任度,并赋予了 Verisk 对数据摄取格式的所有权。

除了明显的经济激励之外,互联网的出现和在线共享信息的能力是将ISO从非营利组织转变为目前以营利为目的的Verisk Analytics的主要驱动力。在 1990 年代后期,ISO 推出了 ClaimSearch,并将其他索赔数据集与已有的数据集相结合,成为业界最大的索赔数据库。在成为第一家在线理赔和定价信息提供商的过程中,ISO继续获得更多的用户和数据,进一步巩固了其作为保险数据解决方案领先提供商的地位。

初创企业的经验教训
Verisk是独一无二的,因为它最初是一家非营利组织,致力于帮助保险公司更好地了解风险和索赔数据。当时,监管环境造成了数据的碎片化,而建立新业务是解决这个问题的最佳方法。通过创建强大的“给予获取”数据交换模型,提供更好的索赔和风险数据,解决了获取对运营商和监管机构有价值的数据的冷启动问题。反过来,运营商和监管机构帮助推动该行业走向Verisk并巩固其规模优势。

给初创公司的问题:
您所在的领域是否存在需要行业协作但需要中立第三方的重大数据问题?
监管机构是否希望推动您所在行业的重大变革?您如何定位您的公司成为推动这一变革的工具?
有没有办法推动碎片化工作流程的标准化,从而导致有趣的数据耗尽?

结论
占主导地位的市场领导者彭博社(Bloomberg)、晨星(Morningstar)和Verisk的崛起,其特点是制定了一套以识别大型、分散的数据池为中心,并利用技术提供有价值的见解和解决方案。

这些公司通过捕获历史数据、对其进行标准化并以简化、可访问的格式将其提供给客户,并通过推动家庭防御性的附加服务和功能来增强,从而建立了类别定义业务。LLM的出现预示着数据分析和金融服务的新时代。由于有可能解锁以前无法访问的数据源,LLM 可能会为新参与者创造机会,通过进入这些现有参与者的上游来破坏现状。