由ChatGPT引发的大模型热已一年有余,围绕大模型创业的公司也如雨后春笋,技术最终要为产业所用才能创造价值,当大模型落地千行百业,能够发挥怎样的价值?澎湃科技走进产业一线,访谈创始人、专家、投资人,调研大模型落地产业现状。本文为c访谈。
·大模型在金融领域成功落地的关键是选择合适的应用场景,打通大模型、垂域AI “小”模型、传统金融工程模型、行业内外部知识库和应用系统。轻量化模型的出现降低了大模型应用门槛,促进了AI平权和知识平权。选择一个适合自己的基座模型,模型不一定越大就越强,数据是决定模型效果的关键因素。
恒生聚源CEO吴震操。
大模型进入金融领域,能更顺利找到市场的“阿尔法”(超额收益)投资机遇吗?金融、产业数据资讯服务提供商恒生聚源CEO吴震操日前对澎湃科技(www.thepaper.cn)表示,不要认为大模型来了就可以直接用来做投资或者交易决策,这样是走不通的。
数据是决定大模型效果的关键因素
“金融行业最大愿望就是使用AI做投资决策,找出好的标的,寻找自己的 ‘阿尔法’(超额收益)。”但吴震操表示,不要认为大模型来了就可以直接用来做投资或者交易决策。
成立于2000年的恒生聚源是恒生电子(600570.SH)旗下子公司,拥有金融数据库、智能投研、金融市场终端等产品线。吴震操希望未来能发挥生成式大模型更快、更强、更高效处理信息的优势,与现有金融工程模型结合,“大模型成功落地,关键是打通大模型、垂域AI小模型、传统金融工程模型、行业内外部知识库和应用系统。其中,数据是决定大模型效果的关键因素。”
“金融数据行业靠信息、知识和生态连接赚钱。大模型出现后,对信息的抽取、整合以及知识的生成范式产生极大改变。”吴震操表示。
恒生聚源有大量的员工在负责数据采集、数据清洗、数据治理等技术和分析工作。在内部,利用AI提升数据自动化处理能力是最基本的诉求。对外销售数据和知识,让客户更精准地发现其所需的知识和信息是首要目标。
海外金融大模型兴起后,恒生聚源在2023年中旬,基于自己训练的垂域金融大模型升级了新一代的智能投研平台WarrenQ,面对金融行业的研究、投资、交易、风控、合规场景,把投资研究作为大模型的第一个落地场景,通过WarrenQ上的Chat、ChatMiner等智能产品服务买方和卖方的研究团队。
金融机构长期以来积累的业务文档、投教文案、法律法规政策文档、研究报告、投行底稿等是机构内部大模型落地的理想语料。通过“大语言模型+搜索+向量数据库”的方式将私域知识数据与大模型结合,做到私有知识库问答。举个例子:在动辄数百页的招股书、年报、半年报中,干货藏于大量模板套话和风险免责提示中。WarrenQ可以基于大语言模型+向量库的定向文档问答检索和定位溯源,从海量文档中挖掘重点信息,同时利用研究员高频重点关注的内容优化提示工程,进一步优化推荐“猜你想要”功能。
“大模型工具化越来越明显。”吴震操说,从问答工具到Copilot(辅助工具)再到智能体(Agent),大模型对于生产力的效率提升幅度越来越高。过去基于自然语言处理(NLP)等技术将研报财报分词、语义分析,但效率低下,准确率不高,仍然需要大量人工干预。基于知识图谱开展智能投研可以做到信息精准,缺点在于有多少人工就有多少智能,需要持续投入大量资源维系不停生长的图谱。大模型出现后,这些工作的效率和效果突飞猛进。“以‘AI智能客服’为例,我们用这个工具准确并高效地对各类数据产品进行解读和答疑解惑,全面提升了服务效率,让智能客服能够精准识别用户意图,从而实现金融数据的端到端实时查询。”
关键是数据和Know-How
“在金融行业,对大模型响应最快的是彭博,彭博利用自己的内部语料训练模型,在ChatGPT出现没多久就推出了BloombergGPT。行业第二大厂商伦交所走了另一条路,他们和微软合作,微软又是OpenAI的最大股东。”
大模型迭代速度快,训练成本高。“上述金融机构的大模型之路也说明脱离场景讲大模型,商业模式很难长久。”吴震操表示,自研基座大模型本身不是一条宽广的赛道,很多机构一没有充足的算力,二没有充足的算法人才,此外缺乏足够的领域数据支撑大模型业务生态。在他看来,未来大模型一定要和应用场景紧密结合。基座大模型的玩家有限,但把大模型应用在垂直场景中,市场将是无限的。
进入垂直行业解决实际问题时,必须提高大模型的可控性、可靠性、可解释、可追溯,这是吴震操最深刻的体会。金融等强监管行业对可靠性和合规性要求极高,幻觉是大模型落地面临的挑战。恒生聚源解决这个问题的方式是把大模型当作知识入口,相当于搜索引擎或图书管理员,让大模型的生成可回溯。
“我们没有用大模型本身来做知识生成,因为它是基于概率的算法,不可能百分百准确。金融行业有很多复杂金融工程模型,现在的大模型还无法超越当前所学的复杂统计学知识,生成复杂的金融工程模型,计算出一个复杂衍生品的价格波动。以现在的模型情况,再给它三五年,它也做不到,海外的模型也一样。”在吴震操看来,大模型成功落地的关键是选择合适的应用场景,打通大模型、垂域AI“小”模型、传统金融工程模型、现有知识库和应用系统。轻量级模型的出现降低了大模型应用门槛,促进了AI平权和知识平权。“没有场景的支撑都是在浪费资源。其次,选择一个适合自己的基座模型,模型不一定越大就越强。更大模型需要更多的算力,也需要算法和技术团队维系。”
吴震操认为,大模型继续往前发展,一定会改变企业内外部的知识交互,未来也一定会改变人机交互方式,Agent+知识管理是大模型赋能的最佳组合。但在金融领域,银行、交易所的历史长达四百多年,从工业时代到信息时代、人工智能时代,银行、交易所的商业模式本质上都没有发生任何改变。“大模型彻底颠覆金融机构的商业模式很难发生,但当大模型改变一些场景中的范式,就会带来新的业态,这一点在C端应用中将更加突出。”吴震操说,这就像移动支付实际上并没有改变买卖和支付这件事的本质,但给整个市场带来了新的红利和便利,创造了新生态。“大模型同样如此,大模型短期内不会彻底改变金融机构的商业模式。在B端应用当中,大模型的作用仍是降本增效;而在C端应用中,倒是可以期待大模型带来的生态变革。”