21世紀(jì)經(jīng)濟(jì)報(bào)道記者 陳植 上海報(bào)道
AI大模型技術(shù)正應(yīng)用在越來(lái)越多金融場(chǎng)景。
僅僅在投研提效領(lǐng)域,多個(gè)大模型產(chǎn)品悄然面世。
(資料圖片)
近日,恒生聚源推出基于大模型技術(shù)的投研工具平臺(tái)WarrenQ,致力于重新賦能“搜、讀、算、寫”的投研全流程場(chǎng)景,進(jìn)一步提升投研效率。
與此同時(shí),多家金融科技平臺(tái)也推出基于大模型的投研提效工具,即在通用大模型基礎(chǔ)上引入指令微調(diào)或提示工程,自動(dòng)生成各類報(bào)告與圖表摘要,提升投研人員的信息獲取效率。
一位券商投研人員向記者透露,目前他們正在測(cè)試多款大模型投研工具的性能。
“整體而言,這類產(chǎn)品若要顯著提升投研效率,還需解決諸多實(shí)際操作瓶頸,比如大模型技術(shù)自動(dòng)生成的信息是否具有即時(shí)性、能否做到信息溯源、是否支持二次編輯與多人協(xié)同工作,能否一鍵快速分享等。”他告訴記者。盡管當(dāng)前大模型投研工具的技術(shù)路徑不一,但他們通過(guò)測(cè)試發(fā)現(xiàn),具備自主龐大數(shù)據(jù)庫(kù)與良好大模型訓(xùn)練成效的相關(guān)工具更受歡迎,因?yàn)樗坏珳?zhǔn)快速解決投研人員的個(gè)性化信息收集檢索要求,還能方便投研人員輕松進(jìn)行內(nèi)容加工,進(jìn)而大幅提升投研效率。
恒生電子董事長(zhǎng)劉曙峰向記者表示,盡管大模型技術(shù)帶來(lái)“語(yǔ)控萬(wàn)物”、“大才能強(qiáng)”等變化,但在金融垂直領(lǐng)域,其應(yīng)用仍面臨知識(shí)信息時(shí)效性、數(shù)據(jù)安全與隱私保護(hù)、具體應(yīng)用支持等方面的局限。因此,金融行業(yè)需建設(shè)行業(yè)大模型以承接垂直領(lǐng)域的特定需求。
“未來(lái),金融行業(yè)大模型能落地的場(chǎng)景非常多,除了投研,還有投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等。但它的應(yīng)用難點(diǎn)在于協(xié)同,特別是數(shù)據(jù)協(xié)同,各種數(shù)據(jù)如何打通,將是非常具體且困難的問(wèn)題。”他指出。因此,金融機(jī)構(gòu)要部署應(yīng)用大模型,需從選模型、估規(guī)模、建場(chǎng)景三大步驟入手,構(gòu)建金融行業(yè)大模型與基于大模型的全新數(shù)智產(chǎn)品,為金融行業(yè)應(yīng)用大模型提供新范式。
AI大模型技術(shù)正悄然“改變”投研生態(tài)。
有機(jī)構(gòu)調(diào)研顯示,在投研領(lǐng)域,眾多金融機(jī)構(gòu)面臨諸多痛點(diǎn)瓶頸——60%分析師遇到數(shù)據(jù)碎片、數(shù)據(jù)孤島、投研工具繁雜等困擾;50%基金經(jīng)理遇到信息爆炸、重點(diǎn)信息不突出等挑戰(zhàn);80% 金融機(jī)構(gòu)管理層感到研究團(tuán)隊(duì)不透明,知識(shí)沉淀難等問(wèn)題。
于是,越來(lái)越多金融科技平臺(tái)寄希望大模型技術(shù)破解這些投研痛點(diǎn)瓶頸。
當(dāng)前,大模型投研工具主要分成兩類,一是在現(xiàn)有通用大模型GPT4.0基礎(chǔ)上直接引入“提示工程”與“指令微調(diào)”,以此自動(dòng)生成上市公司公告財(cái)報(bào)要點(diǎn)信息與行業(yè)報(bào)告核心內(nèi)容,提升投研人員信息獲取效率;二是“從頭做起”——將自身數(shù)據(jù)庫(kù)通過(guò)大模型技術(shù)進(jìn)行大量預(yù)訓(xùn)練,再引入指令精調(diào)與提示工程技術(shù),讓自動(dòng)生成的內(nèi)容能進(jìn)一步滿足投研人員的個(gè)性化信息檢索收集需求。
記者多方了解到,投研人員最擔(dān)憂大模型投研工具會(huì)產(chǎn)生兩大問(wèn)題,一是一本正經(jīng)地“胡說(shuō)八道”,二是自動(dòng)生成的相關(guān)內(nèi)容明顯“過(guò)時(shí)”,無(wú)法滿足投研建模要求。
要解決上述兩大問(wèn)題,絕非易事。
恒生聚源副總經(jīng)理白雪告訴記者,為了滿足數(shù)據(jù)即時(shí)性要求,WarrenQ在數(shù)據(jù)層與模型層的基礎(chǔ)上,加入涵蓋NL2SQL、搜索接口、指標(biāo)計(jì)算、向量數(shù)據(jù)庫(kù)等插件層,確保大模型產(chǎn)品能即時(shí)調(diào)用最新的數(shù)據(jù)以反映最新的金融市場(chǎng)動(dòng)態(tài)與行業(yè)變化趨勢(shì)等。
記者獲悉,要防止大模型“一本正經(jīng)地胡說(shuō)八道”,金融科技機(jī)構(gòu)還需開(kāi)展大量預(yù)訓(xùn)練與指令微調(diào)。比如在預(yù)訓(xùn)練環(huán)節(jié),大模型時(shí)常會(huì)“自由發(fā)揮”,自動(dòng)生成很多“天馬行空式”的內(nèi)容信息,于是開(kāi)發(fā)人員通過(guò)不斷調(diào)整指令與反復(fù)預(yù)訓(xùn)練,教會(huì)大模型如何正確識(shí)別提問(wèn)語(yǔ)義與自動(dòng)生成相應(yīng)的專業(yè)精確回答,確保大模型能不再“答非所問(wèn)”。
此外,大模型投研工具能否具備“實(shí)用性”,還在于它是否具備支持查看原文、研報(bào)圖表抽取、OCR識(shí)別、支持二次編輯、文檔信息挖掘等功能。
白雪告訴記者,針對(duì)投研環(huán)節(jié)的數(shù)據(jù)分析與智能處理實(shí)際需求,WarrenQ推出了兩款A(yù)I工具,分別是WarrenQ-Chat和ChatMiner。前者主要借助大模型疊加搜索與恒生聚源金融數(shù)據(jù)庫(kù),通過(guò)對(duì)話指令,幫助投研人員高效獲取金融行情、資訊和數(shù)據(jù),且每一句自動(dòng)生成的對(duì)話都支持原文溯源,還可以生成金融專業(yè)報(bào)表,從而將傳統(tǒng)投研的“搜讀算寫”流程轉(zhuǎn)變成“Chat讀算寫”,提升投研人員的信息獲取效率;后者則主要發(fā)揮金融文檔挖掘器功能——即大模型和向量數(shù)據(jù)庫(kù)會(huì)根據(jù)投研人員個(gè)性化需求,對(duì)相關(guān)文檔進(jìn)行快速解讀與精準(zhǔn)檢索定位,自動(dòng)生成提取關(guān)鍵信息,提升投研人員對(duì)海量文本數(shù)據(jù)的整合歸納提煉效率。
一位正研發(fā)大模型投研工具的金融科技平臺(tái)人士向記者直言,其研發(fā)難度遠(yuǎn)遠(yuǎn)超過(guò)預(yù)期。僅在數(shù)據(jù)庫(kù)建設(shè)、大模型技術(shù)選用、大模型預(yù)訓(xùn)練等方面,企業(yè)都走過(guò)不少?gòu)澛罚?/p>
“這背后,是金融科技平臺(tái)需全方位比拼數(shù)據(jù)、算力與算法。只有數(shù)據(jù)庫(kù)越全越龐大、算力更強(qiáng)、算法模型更高效的大模型投研工具才有望脫穎而出。”他直言。
在白雪看來(lái),大模型時(shí)代的產(chǎn)品化服務(wù)與落地,可以持續(xù)做好三件事:一是加強(qiáng)數(shù)據(jù)獲取的精準(zhǔn)性、數(shù)據(jù)更新的即時(shí)性;二是提升大模型及其精準(zhǔn)的意圖識(shí)別能力,做到自然語(yǔ)言到數(shù)據(jù)、自然語(yǔ)言到指令的精確映射,即“語(yǔ)控萬(wàn)數(shù)”、“語(yǔ)控萬(wàn)物”;三是用好向量數(shù)據(jù)庫(kù),將私域知識(shí)庫(kù)與大模型結(jié)合起來(lái)做好產(chǎn)品與服務(wù)。
在多位業(yè)內(nèi)人士看來(lái),AI大模型技術(shù)能否成功應(yīng)用在投研、投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等金融場(chǎng)景,另一個(gè)關(guān)鍵成敗因素是金融科技平臺(tái)能否構(gòu)建專業(yè)的金融行業(yè)大模型。
一位奇富科技人士指出,金融行業(yè)因其行業(yè)特殊性,對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量、模型生成效果、數(shù)據(jù)安全合規(guī)等方面有著更高要求。首先,金融行業(yè)大模型需全面掌握金融專業(yè)術(shù)語(yǔ),理解客戶意圖,在與客戶對(duì)話過(guò)程能精確提取線索(即客戶想了解的信息),并給出兼顧專業(yè)性與合規(guī)性的應(yīng)答;其次,金融行業(yè)大模型必須在準(zhǔn)確性和適用性兩個(gè)方面做到極致,因?yàn)樵诮鹑陬I(lǐng)域,大模型自動(dòng)生成的內(nèi)容是不能出現(xiàn)“任何錯(cuò)誤”的。
在他看來(lái),要實(shí)現(xiàn)上述要求,金融科技平臺(tái)需向金融行業(yè)大模型注入足夠全面龐大的數(shù)據(jù)進(jìn)行反復(fù)預(yù)訓(xùn)練,才能實(shí)現(xiàn)“回答精確”與“話術(shù)合規(guī)”。
“公司在信貸領(lǐng)域所積累的逾5000萬(wàn)份征信報(bào)告及解讀、月均逾350萬(wàn)的用戶深度對(duì)話,以及涵蓋900多個(gè)行業(yè)、逾3000個(gè)標(biāo)簽屬性的逾1600萬(wàn)家企業(yè)金融行為數(shù)據(jù),加之所衍生的知識(shí)圖譜與專業(yè)知識(shí),都被納入金融行業(yè)大模型的數(shù)據(jù)基礎(chǔ)。”這位奇富科技人士向記者直言。
恒生電子首席科學(xué)家白碩告訴記者,金融行業(yè)大模型的研發(fā),的確離不開(kāi)龐大的金融數(shù)據(jù)支撐。恒生電子所打造的金融行業(yè)大模型LightGPT已使用逾4000億tokens的金融領(lǐng)域數(shù)據(jù)(包括資訊、公告、研報(bào)、結(jié)構(gòu)化數(shù)據(jù)等)、以及逾400億tokens的語(yǔ)種強(qiáng)化數(shù)據(jù)(包括金融教材、金融百科、政府報(bào)告、法規(guī)條例等),并以此作為大模型二次預(yù)訓(xùn)練的“語(yǔ)料”,支持逾80項(xiàng)金融專屬任務(wù)指令微調(diào),進(jìn)一步提升金融行業(yè)大模型的準(zhǔn)確理解能力。
白雪告訴記者,大模型投研工具的研發(fā)成敗,很大程度取決于“語(yǔ)料”的豐富度與專業(yè)性。因?yàn)橥堆腥藛T都希望自動(dòng)生成的內(nèi)容信息能盡可能多地涵蓋當(dāng)前市場(chǎng)各種動(dòng)態(tài)與觀點(diǎn),這都需要金融科技平臺(tái)不斷向大模型注入最新的各類精準(zhǔn)的金融語(yǔ)料,并實(shí)時(shí)鏈接映射到數(shù)據(jù)庫(kù),令大模型投研工具自動(dòng)生成的內(nèi)容能最大限度“與時(shí)俱進(jìn)”。
值得注意的是,一個(gè)行之有效的金融行業(yè)大模型光有龐大專業(yè)的數(shù)據(jù)庫(kù)是不夠的——除了與之配套的算力算法等金融基礎(chǔ)設(shè)施,它還需解決諸多挑戰(zhàn),包括能否做到輕量化部署、能否在金融專業(yè)問(wèn)答、邏輯推理、超長(zhǎng)文本處理能力、多模態(tài)交互能力、代碼能力等金融大模型能力評(píng)測(cè)領(lǐng)域取得不俗表現(xiàn),并保證內(nèi)容和指令的合規(guī)安全等。
上述金融科技平臺(tái)人士向記者透露,這令眾多金融機(jī)構(gòu)倍感壓力——若在傳統(tǒng)AI模型基礎(chǔ)上研發(fā)金融行業(yè)大模型,幾乎是很難完成的任務(wù)。因?yàn)閭鹘y(tǒng)AI模型與大模型技術(shù)在數(shù)據(jù)、模型、模型開(kāi)發(fā)方式、業(yè)務(wù)應(yīng)用、適用場(chǎng)景及成本等方面完全“不同”——相比傳統(tǒng)AI模型的作坊式操作、研發(fā)周期長(zhǎng)、通用性低等特點(diǎn),大模型技術(shù)開(kāi)創(chuàng)性地提出預(yù)訓(xùn)練模式,以流水線的模型開(kāi)發(fā)方式可泛化多應(yīng)用場(chǎng)景,實(shí)現(xiàn)高通用性。
“兩者截然不同的特點(diǎn),預(yù)示著金融機(jī)構(gòu)需要持續(xù)投入大量資金資源,持續(xù)強(qiáng)化金融行業(yè)大模型的預(yù)訓(xùn)練成效,才能令它更精準(zhǔn)高效地匹配投研、投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等金融場(chǎng)景各類業(yè)務(wù)需求。”他直言。
白碩告訴記者,目前LightGPT計(jì)劃在9月底完成新一輪的金融能力升級(jí),并支持金融機(jī)構(gòu)通過(guò)私域任務(wù)數(shù)據(jù)定制化“精調(diào)”大模型,從而打造機(jī)構(gòu)專屬的大模型,滿足個(gè)性化需求。
在劉曙峰看來(lái),在大模型時(shí)代,“數(shù)據(jù)+算法+算力”正構(gòu)成新范式的基本要素。金融行業(yè)更需促進(jìn)大模型產(chǎn)業(yè)上下游合作,為金融數(shù)智化提供更強(qiáng)有力的技術(shù)支撐。
標(biāo)簽:
7月1日,也是產(chǎn)品上市次日,中金湖北科投光谷產(chǎn)業(yè)園REIT(下稱“湖北科
中國(guó)網(wǎng)財(cái)經(jīng)7月3日訊(記者陳瓊)世界上最常用的人工甜味劑之一——阿斯巴
智通財(cái)經(jīng)APP獲悉,7月3日,香港政府統(tǒng)計(jì)處發(fā)表2023年5月零售業(yè)銷貨額臨
AI大模型技術(shù)正應(yīng)用在越來(lái)越多金融場(chǎng)景。
7月1日,也是產(chǎn)品上市次日,中金湖北科投光谷產(chǎn)業(yè)園REIT(下稱“湖北科
中國(guó)網(wǎng)財(cái)經(jīng)7月3日訊(記者陳瓊)世界上最常用的人工甜味劑之一——阿斯巴
日前,湖北能源(000883 SZ)發(fā)布公告稱,公司將在神木、定邊、靖邊、
智通財(cái)經(jīng)APP獲悉,7月3日,香港政府統(tǒng)計(jì)處發(fā)表2023年5月零售業(yè)銷貨額臨
于2023年1月至5月期間,集團(tuán)累計(jì)合約銷售總額約為人民幣238 6億元,累
腎綜合征出血熱是一種以老鼠傳播為主的嚴(yán)重自然疫源性傳染病,疾病負(fù)擔(dān)
胡錫進(jìn)今日盤后發(fā)文稱,今天股市漲了1 31%,老胡真是高興。我個(gè)人持倉(cāng)
在“一夜情、應(yīng)墮胎事件”爆料一周多之后,一直三緘其口、淡化處理的的
智通財(cái)經(jīng)APP獲悉,瑞士政府周一公布的數(shù)據(jù)顯示,瑞士6月份通脹降至1 7%
旗袍,中國(guó)和世界華人女性的傳統(tǒng)服裝,被譽(yù)為中國(guó)國(guó)粹和女性國(guó)服。雖然其定義和產(chǎn)生的時(shí)間至今還存有諸多爭(zhēng)議,但它仍然是中國(guó)悠久服飾文化
7月21日,北京市政府發(fā)布《北京市電影局關(guān)于在疫情防控常態(tài)化條件下有序推進(jìn)電影院恢復(fù)開(kāi)放的通知》,宣布全市低風(fēng)險(xiǎn)地區(qū)影院,可于7月24日
?武漢7·16渡江節(jié)組委會(huì)14日發(fā)布公告,由于長(zhǎng)江武漢關(guān)水位超警戒水位,按照規(guī)定取消2020年第46屆武漢7·16渡江節(jié)。受近期持續(xù)強(qiáng)降雨影響,
過(guò)去一段時(shí)間,國(guó)家級(jí)非遺項(xiàng)目灰塑傳承人邵成村,多次在陳家祠等工作現(xiàn)場(chǎng),向身邊那些帶著好奇目光的人們講解灰塑的種種技術(shù)細(xì)節(jié):草根灰、
7月13日,位于璧山區(qū)南門唐城夜市街區(qū)的璧山冷酒夜市開(kāi)街。這是璧山區(qū)打造夜間經(jīng)濟(jì)消費(fèi)載體、培育夜間經(jīng)濟(jì)活動(dòng)品牌的舉措之一。璧山市民一