投資 >

大模型試水投研場(chǎng)景,如何防止“一本正經(jīng)地胡說(shuō)八道”_全球快資訊

2023-07-03 19:02:24   來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道

21世紀(jì)經(jīng)濟(jì)報(bào)道記者  陳植  上海報(bào)道

AI大模型技術(shù)正應(yīng)用在越來(lái)越多金融場(chǎng)景。

僅僅在投研提效領(lǐng)域,多個(gè)大模型產(chǎn)品悄然面世。


(資料圖片)

近日,恒生聚源推出基于大模型技術(shù)的投研工具平臺(tái)WarrenQ,致力于重新賦能“搜、讀、算、寫”的投研全流程場(chǎng)景,進(jìn)一步提升投研效率。

與此同時(shí),多家金融科技平臺(tái)也推出基于大模型的投研提效工具,即在通用大模型基礎(chǔ)上引入指令微調(diào)或提示工程,自動(dòng)生成各類報(bào)告與圖表摘要,提升投研人員的信息獲取效率。

一位券商投研人員向記者透露,目前他們正在測(cè)試多款大模型投研工具的性能。

“整體而言,這類產(chǎn)品若要顯著提升投研效率,還需解決諸多實(shí)際操作瓶頸,比如大模型技術(shù)自動(dòng)生成的信息是否具有即時(shí)性、能否做到信息溯源、是否支持二次編輯與多人協(xié)同工作,能否一鍵快速分享等。”他告訴記者。盡管當(dāng)前大模型投研工具的技術(shù)路徑不一,但他們通過(guò)測(cè)試發(fā)現(xiàn),具備自主龐大數(shù)據(jù)庫(kù)與良好大模型訓(xùn)練成效的相關(guān)工具更受歡迎,因?yàn)樗坏珳?zhǔn)快速解決投研人員的個(gè)性化信息收集檢索要求,還能方便投研人員輕松進(jìn)行內(nèi)容加工,進(jìn)而大幅提升投研效率。

恒生電子董事長(zhǎng)劉曙峰向記者表示,盡管大模型技術(shù)帶來(lái)“語(yǔ)控萬(wàn)物”、“大才能強(qiáng)”等變化,但在金融垂直領(lǐng)域,其應(yīng)用仍面臨知識(shí)信息時(shí)效性、數(shù)據(jù)安全與隱私保護(hù)、具體應(yīng)用支持等方面的局限。因此,金融行業(yè)需建設(shè)行業(yè)大模型以承接垂直領(lǐng)域的特定需求。

“未來(lái),金融行業(yè)大模型能落地的場(chǎng)景非常多,除了投研,還有投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等。但它的應(yīng)用難點(diǎn)在于協(xié)同,特別是數(shù)據(jù)協(xié)同,各種數(shù)據(jù)如何打通,將是非常具體且困難的問(wèn)題。”他指出。因此,金融機(jī)構(gòu)要部署應(yīng)用大模型,需從選模型、估規(guī)模、建場(chǎng)景三大步驟入手,構(gòu)建金融行業(yè)大模型與基于大模型的全新數(shù)智產(chǎn)品,為金融行業(yè)應(yīng)用大模型提供新范式。

防止大模型“一本正經(jīng)地胡說(shuō)八道”

AI大模型技術(shù)正悄然“改變”投研生態(tài)。

有機(jī)構(gòu)調(diào)研顯示,在投研領(lǐng)域,眾多金融機(jī)構(gòu)面臨諸多痛點(diǎn)瓶頸——60%分析師遇到數(shù)據(jù)碎片、數(shù)據(jù)孤島、投研工具繁雜等困擾;50%基金經(jīng)理遇到信息爆炸、重點(diǎn)信息不突出等挑戰(zhàn);80% 金融機(jī)構(gòu)管理層感到研究團(tuán)隊(duì)不透明,知識(shí)沉淀難等問(wèn)題。

于是,越來(lái)越多金融科技平臺(tái)寄希望大模型技術(shù)破解這些投研痛點(diǎn)瓶頸。

當(dāng)前,大模型投研工具主要分成兩類,一是在現(xiàn)有通用大模型GPT4.0基礎(chǔ)上直接引入“提示工程”與“指令微調(diào)”,以此自動(dòng)生成上市公司公告財(cái)報(bào)要點(diǎn)信息與行業(yè)報(bào)告核心內(nèi)容,提升投研人員信息獲取效率;二是“從頭做起”——將自身數(shù)據(jù)庫(kù)通過(guò)大模型技術(shù)進(jìn)行大量預(yù)訓(xùn)練,再引入指令精調(diào)與提示工程技術(shù),讓自動(dòng)生成的內(nèi)容能進(jìn)一步滿足投研人員的個(gè)性化信息檢索收集需求。

記者多方了解到,投研人員最擔(dān)憂大模型投研工具會(huì)產(chǎn)生兩大問(wèn)題,一是一本正經(jīng)地“胡說(shuō)八道”,二是自動(dòng)生成的相關(guān)內(nèi)容明顯“過(guò)時(shí)”,無(wú)法滿足投研建模要求。

要解決上述兩大問(wèn)題,絕非易事。

恒生聚源副總經(jīng)理白雪告訴記者,為了滿足數(shù)據(jù)即時(shí)性要求,WarrenQ在數(shù)據(jù)層與模型層的基礎(chǔ)上,加入涵蓋NL2SQL、搜索接口、指標(biāo)計(jì)算、向量數(shù)據(jù)庫(kù)等插件層,確保大模型產(chǎn)品能即時(shí)調(diào)用最新的數(shù)據(jù)以反映最新的金融市場(chǎng)動(dòng)態(tài)與行業(yè)變化趨勢(shì)等。

記者獲悉,要防止大模型“一本正經(jīng)地胡說(shuō)八道”,金融科技機(jī)構(gòu)還需開(kāi)展大量預(yù)訓(xùn)練與指令微調(diào)。比如在預(yù)訓(xùn)練環(huán)節(jié),大模型時(shí)常會(huì)“自由發(fā)揮”,自動(dòng)生成很多“天馬行空式”的內(nèi)容信息,于是開(kāi)發(fā)人員通過(guò)不斷調(diào)整指令與反復(fù)預(yù)訓(xùn)練,教會(huì)大模型如何正確識(shí)別提問(wèn)語(yǔ)義與自動(dòng)生成相應(yīng)的專業(yè)精確回答,確保大模型能不再“答非所問(wèn)”。

此外,大模型投研工具能否具備“實(shí)用性”,還在于它是否具備支持查看原文、研報(bào)圖表抽取、OCR識(shí)別、支持二次編輯、文檔信息挖掘等功能。

白雪告訴記者,針對(duì)投研環(huán)節(jié)的數(shù)據(jù)分析與智能處理實(shí)際需求,WarrenQ推出了兩款A(yù)I工具,分別是WarrenQ-Chat和ChatMiner。前者主要借助大模型疊加搜索與恒生聚源金融數(shù)據(jù)庫(kù),通過(guò)對(duì)話指令,幫助投研人員高效獲取金融行情、資訊和數(shù)據(jù),且每一句自動(dòng)生成的對(duì)話都支持原文溯源,還可以生成金融專業(yè)報(bào)表,從而將傳統(tǒng)投研的“搜讀算寫”流程轉(zhuǎn)變成“Chat讀算寫”,提升投研人員的信息獲取效率;后者則主要發(fā)揮金融文檔挖掘器功能——即大模型和向量數(shù)據(jù)庫(kù)會(huì)根據(jù)投研人員個(gè)性化需求,對(duì)相關(guān)文檔進(jìn)行快速解讀與精準(zhǔn)檢索定位,自動(dòng)生成提取關(guān)鍵信息,提升投研人員對(duì)海量文本數(shù)據(jù)的整合歸納提煉效率。

一位正研發(fā)大模型投研工具的金融科技平臺(tái)人士向記者直言,其研發(fā)難度遠(yuǎn)遠(yuǎn)超過(guò)預(yù)期。僅在數(shù)據(jù)庫(kù)建設(shè)、大模型技術(shù)選用、大模型預(yù)訓(xùn)練等方面,企業(yè)都走過(guò)不少?gòu)澛罚?/p>

“這背后,是金融科技平臺(tái)需全方位比拼數(shù)據(jù)、算力與算法。只有數(shù)據(jù)庫(kù)越全越龐大、算力更強(qiáng)、算法模型更高效的大模型投研工具才有望脫穎而出。”他直言。

在白雪看來(lái),大模型時(shí)代的產(chǎn)品化服務(wù)與落地,可以持續(xù)做好三件事:一是加強(qiáng)數(shù)據(jù)獲取的精準(zhǔn)性、數(shù)據(jù)更新的即時(shí)性;二是提升大模型及其精準(zhǔn)的意圖識(shí)別能力,做到自然語(yǔ)言到數(shù)據(jù)、自然語(yǔ)言到指令的精確映射,即“語(yǔ)控萬(wàn)數(shù)”、“語(yǔ)控萬(wàn)物”;三是用好向量數(shù)據(jù)庫(kù),將私域知識(shí)庫(kù)與大模型結(jié)合起來(lái)做好產(chǎn)品與服務(wù)。

金融行業(yè)大模型的征途

在多位業(yè)內(nèi)人士看來(lái),AI大模型技術(shù)能否成功應(yīng)用在投研、投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等金融場(chǎng)景,另一個(gè)關(guān)鍵成敗因素是金融科技平臺(tái)能否構(gòu)建專業(yè)的金融行業(yè)大模型。

一位奇富科技人士指出,金融行業(yè)因其行業(yè)特殊性,對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量、模型生成效果、數(shù)據(jù)安全合規(guī)等方面有著更高要求。首先,金融行業(yè)大模型需全面掌握金融專業(yè)術(shù)語(yǔ),理解客戶意圖,在與客戶對(duì)話過(guò)程能精確提取線索(即客戶想了解的信息),并給出兼顧專業(yè)性與合規(guī)性的應(yīng)答;其次,金融行業(yè)大模型必須在準(zhǔn)確性和適用性兩個(gè)方面做到極致,因?yàn)樵诮鹑陬I(lǐng)域,大模型自動(dòng)生成的內(nèi)容是不能出現(xiàn)“任何錯(cuò)誤”的。

在他看來(lái),要實(shí)現(xiàn)上述要求,金融科技平臺(tái)需向金融行業(yè)大模型注入足夠全面龐大的數(shù)據(jù)進(jìn)行反復(fù)預(yù)訓(xùn)練,才能實(shí)現(xiàn)“回答精確”與“話術(shù)合規(guī)”。

“公司在信貸領(lǐng)域所積累的逾5000萬(wàn)份征信報(bào)告及解讀、月均逾350萬(wàn)的用戶深度對(duì)話,以及涵蓋900多個(gè)行業(yè)、逾3000個(gè)標(biāo)簽屬性的逾1600萬(wàn)家企業(yè)金融行為數(shù)據(jù),加之所衍生的知識(shí)圖譜與專業(yè)知識(shí),都被納入金融行業(yè)大模型的數(shù)據(jù)基礎(chǔ)。”這位奇富科技人士向記者直言。

恒生電子首席科學(xué)家白碩告訴記者,金融行業(yè)大模型的研發(fā),的確離不開(kāi)龐大的金融數(shù)據(jù)支撐。恒生電子所打造的金融行業(yè)大模型LightGPT已使用逾4000億tokens的金融領(lǐng)域數(shù)據(jù)(包括資訊、公告、研報(bào)、結(jié)構(gòu)化數(shù)據(jù)等)、以及逾400億tokens的語(yǔ)種強(qiáng)化數(shù)據(jù)(包括金融教材、金融百科、政府報(bào)告、法規(guī)條例等),并以此作為大模型二次預(yù)訓(xùn)練的“語(yǔ)料”,支持逾80項(xiàng)金融專屬任務(wù)指令微調(diào),進(jìn)一步提升金融行業(yè)大模型的準(zhǔn)確理解能力。

白雪告訴記者,大模型投研工具的研發(fā)成敗,很大程度取決于“語(yǔ)料”的豐富度與專業(yè)性。因?yàn)橥堆腥藛T都希望自動(dòng)生成的內(nèi)容信息能盡可能多地涵蓋當(dāng)前市場(chǎng)各種動(dòng)態(tài)與觀點(diǎn),這都需要金融科技平臺(tái)不斷向大模型注入最新的各類精準(zhǔn)的金融語(yǔ)料,并實(shí)時(shí)鏈接映射到數(shù)據(jù)庫(kù),令大模型投研工具自動(dòng)生成的內(nèi)容能最大限度“與時(shí)俱進(jìn)”。

值得注意的是,一個(gè)行之有效的金融行業(yè)大模型光有龐大專業(yè)的數(shù)據(jù)庫(kù)是不夠的——除了與之配套的算力算法等金融基礎(chǔ)設(shè)施,它還需解決諸多挑戰(zhàn),包括能否做到輕量化部署、能否在金融專業(yè)問(wèn)答、邏輯推理、超長(zhǎng)文本處理能力、多模態(tài)交互能力、代碼能力等金融大模型能力評(píng)測(cè)領(lǐng)域取得不俗表現(xiàn),并保證內(nèi)容和指令的合規(guī)安全等。

上述金融科技平臺(tái)人士向記者透露,這令眾多金融機(jī)構(gòu)倍感壓力——若在傳統(tǒng)AI模型基礎(chǔ)上研發(fā)金融行業(yè)大模型,幾乎是很難完成的任務(wù)。因?yàn)閭鹘y(tǒng)AI模型與大模型技術(shù)在數(shù)據(jù)、模型、模型開(kāi)發(fā)方式、業(yè)務(wù)應(yīng)用、適用場(chǎng)景及成本等方面完全“不同”——相比傳統(tǒng)AI模型的作坊式操作、研發(fā)周期長(zhǎng)、通用性低等特點(diǎn),大模型技術(shù)開(kāi)創(chuàng)性地提出預(yù)訓(xùn)練模式,以流水線的模型開(kāi)發(fā)方式可泛化多應(yīng)用場(chǎng)景,實(shí)現(xiàn)高通用性。

“兩者截然不同的特點(diǎn),預(yù)示著金融機(jī)構(gòu)需要持續(xù)投入大量資金資源,持續(xù)強(qiáng)化金融行業(yè)大模型的預(yù)訓(xùn)練成效,才能令它更精準(zhǔn)高效地匹配投研、投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等金融場(chǎng)景各類業(yè)務(wù)需求。”他直言。

白碩告訴記者,目前LightGPT計(jì)劃在9月底完成新一輪的金融能力升級(jí),并支持金融機(jī)構(gòu)通過(guò)私域任務(wù)數(shù)據(jù)定制化“精調(diào)”大模型,從而打造機(jī)構(gòu)專屬的大模型,滿足個(gè)性化需求。

在劉曙峰看來(lái),在大模型時(shí)代,“數(shù)據(jù)+算法+算力”正構(gòu)成新范式的基本要素。金融行業(yè)更需促進(jìn)大模型產(chǎn)業(yè)上下游合作,為金融數(shù)智化提供更強(qiáng)有力的技術(shù)支撐。

標(biāo)簽:

相關(guān)閱讀

大模型試水投研場(chǎng)景,如何防止“一本正經(jīng)地

投資

AI大模型技術(shù)正應(yīng)用在越來(lái)越多金融場(chǎng)景。

2023-07-03

打新資金離場(chǎng)不改基本面價(jià)值,湖北科投REIT

投資

7月1日,也是產(chǎn)品上市次日,中金湖北科投光谷產(chǎn)業(yè)園REIT(下稱“湖北科

2023-07-03

環(huán)球關(guān)注:阿斯巴甜“潛在致癌風(fēng)波”攪動(dòng)代

投資

中國(guó)網(wǎng)財(cái)經(jīng)7月3日訊(記者陳瓊)世界上最常用的人工甜味劑之一——阿斯巴

2023-07-03

鄂股動(dòng)態(tài)丨湖北能源擬投資超百億元在陜西投

投資

日前,湖北能源(000883 SZ)發(fā)布公告稱,公司將在神木、定邊、靖邊、

2023-07-03

5月香港零售業(yè)總銷貨價(jià)值臨時(shí)估計(jì)為345億港

投資

智通財(cái)經(jīng)APP獲悉,7月3日,香港政府統(tǒng)計(jì)處發(fā)表2023年5月零售業(yè)銷貨額臨

2023-07-03

大模型試水投研場(chǎng)景,如何防止“一本正經(jīng)地胡說(shuō)八道”_全球快資訊

投資

AI大模型技術(shù)正應(yīng)用在越來(lái)越多金融場(chǎng)景。

2023-07-03

打新資金離場(chǎng)不改基本面價(jià)值,湖北科投REIT破發(fā)當(dāng)日即獲增持護(hù)盤丨REITs金融實(shí)務(wù)-全球今日?qǐng)?bào)

投資

7月1日,也是產(chǎn)品上市次日,中金湖北科投光谷產(chǎn)業(yè)園REIT(下稱“湖北科

2023-07-03

環(huán)球關(guān)注:阿斯巴甜“潛在致癌風(fēng)波”攪動(dòng)代糖行業(yè) 本月中旬將發(fā)布結(jié)論

投資

中國(guó)網(wǎng)財(cái)經(jīng)7月3日訊(記者陳瓊)世界上最常用的人工甜味劑之一——阿斯巴

2023-07-03

鄂股動(dòng)態(tài)丨湖北能源擬投資超百億元在陜西投建1900MW光伏發(fā)電項(xiàng)目

投資

日前,湖北能源(000883 SZ)發(fā)布公告稱,公司將在神木、定邊、靖邊、

2023-07-03

5月香港零售業(yè)總銷貨價(jià)值臨時(shí)估計(jì)為345億港元 同比上升18.4%-今日觀點(diǎn)

投資

智通財(cái)經(jīng)APP獲悉,7月3日,香港政府統(tǒng)計(jì)處發(fā)表2023年5月零售業(yè)銷貨額臨

2023-07-03

世茂集團(tuán)前5月合約銷售額238.6億元 美元債重組方案草案已發(fā)送 熱訊

投資

于2023年1月至5月期間,集團(tuán)累計(jì)合約銷售總額約為人民幣238 6億元,累

2023-07-03

快報(bào):共推“健康中國(guó)在基層”關(guān)愛(ài)行動(dòng) 羅益生物與南方財(cái)經(jīng)全媒體集團(tuán)達(dá)成戰(zhàn)略合作

投資

腎綜合征出血熱是一種以老鼠傳播為主的嚴(yán)重自然疫源性傳染病,疾病負(fù)擔(dān)

2023-07-03

世界頭條:胡錫進(jìn): 有人因?yàn)槲夷翘烊胧泄芩小昂a進(jìn)底”,我不敢承受

投資

胡錫進(jìn)今日盤后發(fā)文稱,今天股市漲了1 31%,老胡真是高興。我個(gè)人持倉(cāng)

2023-07-03

看點(diǎn):瑞士6月通脹降至1.7% 市場(chǎng)依舊維持央行加息預(yù)期

投資

智通財(cái)經(jīng)APP獲悉,瑞士政府周一公布的數(shù)據(jù)顯示,瑞士6月份通脹降至1 7%

2023-07-03

遇見(jiàn)旗袍是于萬(wàn)千人群中的驚鴻一瞥 沿途灑滿了愛(ài)的芬芳

旗袍,中國(guó)和世界華人女性的傳統(tǒng)服裝,被譽(yù)為中國(guó)國(guó)粹和女性國(guó)服。雖然其定義和產(chǎn)生的時(shí)間至今還存有諸多爭(zhēng)議,但它仍然是中國(guó)悠久服飾文化

北京市電影院有序恢復(fù)開(kāi)放 周五預(yù)售部分場(chǎng)次已滿座

7月21日,北京市政府發(fā)布《北京市電影局關(guān)于在疫情防控常態(tài)化條件下有序推進(jìn)電影院恢復(fù)開(kāi)放的通知》,宣布全市低風(fēng)險(xiǎn)地區(qū)影院,可于7月24日

近期持續(xù)強(qiáng)降雨影響 第46屆武漢渡江節(jié)因長(zhǎng)江水位過(guò)高取消

?武漢7·16渡江節(jié)組委會(huì)14日發(fā)布公告,由于長(zhǎng)江武漢關(guān)水位超警戒水位,按照規(guī)定取消2020年第46屆武漢7·16渡江節(jié)。受近期持續(xù)強(qiáng)降雨影響,

“非遺”普及受眾最看重“動(dòng)手”參觀大師工作室非常享受

過(guò)去一段時(shí)間,國(guó)家級(jí)非遺項(xiàng)目灰塑傳承人邵成村,多次在陳家祠等工作現(xiàn)場(chǎng),向身邊那些帶著好奇目光的人們講解灰塑的種種技術(shù)細(xì)節(jié):草根灰、

璧山冷酒夜市 豐富市民夜間文旅活動(dòng)

7月13日,位于璧山區(qū)南門唐城夜市街區(qū)的璧山冷酒夜市開(kāi)街。這是璧山區(qū)打造夜間經(jīng)濟(jì)消費(fèi)載體、培育夜間經(jīng)濟(jì)活動(dòng)品牌的舉措之一。璧山市民一

年內(nèi)兩市超過(guò)500家上市公司完成回購(gòu) 累計(jì)回購(gòu)金額超332億元

近期A股市場(chǎng)持續(xù)震蕩,不少上市公司或其重要股東推出回購(gòu)、增持計(jì)劃,用真金白銀力挺股價(jià)。記者根據(jù)同花順數(shù)據(jù)統(tǒng)計(jì),今年以來(lái),兩市超過(guò)500

持續(xù)發(fā)力補(bǔ)鏈強(qiáng)鏈加大研發(fā)搶占市場(chǎng) 渝企跑出“加速度”

玥湖路渝快電充換電站 一輛新能源汽車,離不開(kāi)研發(fā)、動(dòng)力、配套等多個(gè)環(huán)節(jié)。作為汽車制造重鎮(zhèn),重慶在這些環(huán)節(jié)的多個(gè)板塊上,正在加速奔跑

重啟上市公司資本運(yùn)作 康佳集團(tuán)去年半導(dǎo)體業(yè)務(wù)營(yíng)業(yè)收入為3.22億元

近日,康佳集團(tuán)正式對(duì)外發(fā)布2021年年度業(yè)績(jī)報(bào)告。2021年,康佳集團(tuán)實(shí)現(xiàn)全年?duì)I收491 07億元,歸屬于母公司的凈利潤(rùn)為9 05億元,同比增長(zhǎng)89 5

偉祿集團(tuán)連續(xù)6年增長(zhǎng) 去年?duì)I收同比增長(zhǎng)37.5%

深港通標(biāo)的之一的深圳企業(yè)偉祿集團(tuán)近日公布2021年業(yè)績(jī)。財(cái)報(bào)數(shù)據(jù)顯示,偉祿集團(tuán)全年?duì)I業(yè)收入11 95億港元,同比增長(zhǎng)37 5%,連續(xù)6年穩(wěn)步增長(zhǎng);

龍頭企業(yè)去年凈利倍增 整個(gè)行業(yè)營(yíng)收規(guī)模有望創(chuàng)造歷史新高位

近日,面板龍頭TCL科技、京東方分別發(fā)布2021年度業(yè)績(jī)快報(bào),兩家企業(yè)去年歸屬于上市公司股東的凈利潤(rùn)分別增長(zhǎng)129 3%、412 86%,實(shí)現(xiàn)超過(guò)百億

深圳國(guó)企全力為市民 守好“菜籃子”“米袋子”保障量足價(jià)穩(wěn)

疫情防控形勢(shì)下,民生物資供應(yīng)是否充足成為市民最為關(guān)注的問(wèn)題之一。連日來(lái),深農(nóng)集團(tuán)、深糧控股等企業(yè),充分發(fā)揮國(guó)企擔(dān)當(dāng),全力為深圳市民