我的位置: 经济 > 产业观察 > 文章详情
让金融大模型超越“实习生”?不透隐私算出张三李四谁更有钱?上海数商出圈了
分享至:
 (32)
 (0)
 收藏
来源:上观新闻 作者:李晔 2023-06-01 06:28
摘要:2021年上海首提“数商”概念,而今“上海籍”数商花开四方。

日前在贵阳开幕的2023中国国际大数据产业博览会上,透出“上海军团”的低调实力——贵州当地许多银行成熟的对公数字化转型解决方案,多来自“上海籍”数商手笔。

一年半前,上海数据交易所揭牌,首提“数商”概念。一年半后,上海数商花开四方,已在贵阳、深圳、北京等多家数交所频频挂牌数据产品,凭硬核实力出圈。

今年以来,以ChatGPT为代表的大模型火速蹿红,各行各业都在推各自领域的专业大模型。作为上海数交所首批数商的星环科技,近期也推出了金融行业大模型“无涯”,以及数据查询和分析智能助手“求索”,旨在解决大模型在金融等特定领域只是一“实习生”的痛点。

星环科技创始人兼CEO孙元浩解释,造成“实习生”专业知识储备不足的客观原因,一在于训练大模型至少需半年至一年时间,而实时新闻资讯、市场行情等快速的变化信息难以内置到模型中。第二,无论通用还是行业大模型的输入均有字数限制,若将上市公司年报全部放入即可能超限,导致大模型“罢工”。

星环科技的解决方案是用一个向量(指具有大小和方向的量)数据库,承担中间存储的角色,将最新的、经常变化的信息放入向量数据库。当提问大模型时,先把问题转成高维向量,进行语义搜索,找到相关信息,再把它拼接成提示词发给大语言模型,由大模型生成答案。

当提问一个拥有70亿个参数的开源大模型时,通过“外挂”一个农业知识图谱后,大模型便不再“一本正经胡说八道”。孙元浩现场演示,当提问某粮食集团的玉米最新收储价时,大模型立刻回答3元,并指出该价格所形成的影响。同样,在金融量化领域,“无涯”可回答研报分析,能对个股、债券、基金等各类市场事件进行复盘和推演。“求索”大模型也是同理,数据工程师、数据科学及业务人员可以用自然语言按需查询数据,让每个人都能拥有“虚拟业务助手”。

孙元浩感慨,互联网团购市场“百团大战”犹在昨日,而今又现“千模大战”。“但产品是否管用准确,尤其在专业金融领域,市场终会检验。”

在今年贵阳数博会上,同为上海首批数商的数库科技,达成了全国首个经数交所的“产业+电力”数据赋能金融科技创新案例——由贵阳大数据交易所、南方电网贵州电网公司及数库科技三方达成合作,通过电力大数据与产业数据的融合、打通和应用,来精准滴灌金融机构及企业。数库科技CEO沈鑫介绍,企业用电及电费缴纳等数据,是最客观反映企业经营活动的核心数据之一,产业关系则能高度拟合实体经济运转规律。“单一电力指标,与数库科技积累十余年的工商、投融资、舆情、专利、科技认定、供应链、招投标、财税、社保、司法等公开的产融大数据深度结合,可科学精准构建制造企业的评价模型。”

这些“产业+电力”数据,让金融机构拓客及授信的准入参考标准跃然纸上。同样,“全球商船+港口”数据,可赋能企业供应链方案优化,甚至实现苏伊士运河堵塞突发事件中的供应链网络迅速切换。数据融合的价值已无需赘言,但如何确保融合之下的数据安全且不泄露隐私?上海数商也已拿出优解。

在近期由上海智慧城市发展研究院和上海市数商协会主办的“数据要素十节课”中,蚂蚁集团就分享了实操案例。蚂蚁集团隐私计算部技术总监袁鹏程介绍,早在1982年,图灵奖获得者姚期智就抛出经典的“百万富翁”问题——张三和李四都是富翁,如何在保护好双方隐私情况下,计算出谁更有钱?姚期智提出了“多方安全计算”即隐私计算概念,现已大量应用于金融行业的获客与风控。

蚂蚁集团就深耕隐私计算,其隐私计算技术品牌“隐语”,以开源和商业化形式,已输出到银行、电信、政务等数十个场景的数百家用户。比如,各地医院的信息系统独立且分散,且绝不允许病情与病例数据的离院共享。2018年,蚂蚁集团尝试为保险公司接入一些数据接口,通过设定数据逻辑查询,利用多方安全计算等隐私计算技术,使保险公司只获得“是否理赔”的查询结果,但不会获得各种原始数据,实现数据“可用不可见”。又如,浦发银行已同“隐语”合作,基于多方安全计算的风险模型进行信用风险管理,识别出超过14.5万名高风险用户,阻止了数十亿元的高风险贷款的发放。据悉,近年来,各地政府部门已认识到政务数据的挖掘价值,但急需隐私计算的加持,目前隐私计算已被多地政府纳入数字化发展规划,成为促进数据经济发展、实现城市智慧治理的突破口。

在此过程中,上海数商的数据产品和解决方案尤其吃香,仅在上海数交所,自2021年11月25日揭牌以来,已挂牌数据产品超过1200个,今年场内交易有望突破10亿元。上海市经信委信息化推进处副处长山栋明告诉记者,上海还归纳出了15种细分数商,主要分三大类,一是与数据资源供给强相关,如掌握大量数据的互联网企业、地铁公司、电力公司等;二是技术驱动型,如在交付侧,高安全等级的数据交付需启用隐私计算、联邦学习等技术,目前蚂蚁集团、富数科技、星环科技等均已涉足;三是第三方服务机构,如数据产品合规评估、数字资产铸造、数字资产评估、数据产品经纪人等。


上一篇: 没有了
下一篇: 没有了
  相关文章
评论(0)
我也说两句
×
发表
最新评论
快来抢沙发吧~ 加载更多… 已显示全部内容
上海辟谣平台
上海2021年第46届世界技能大赛
上海市政府服务企业官方平台
上海对口援疆20年
举报中心
网上有害信息举报专区
关注我们
客户端下载