21世紀(jì)經(jīng)濟(jì)報(bào)道記者 陳植 上海報(bào)道
(資料圖片)
AI大模型技術(shù)正應(yīng)用在越來越多金融場(chǎng)景。
僅僅在投研提效領(lǐng)域,多個(gè)大模型產(chǎn)品悄然面世。
近日,恒生聚源推出基于大模型技術(shù)的投研工具平臺(tái)WarrenQ,致力于重新賦能“搜、讀、算、寫”的投研全流程場(chǎng)景,進(jìn)一步提升投研效率。
與此同時(shí),多家金融科技平臺(tái)也推出基于大模型的投研提效工具,即在通用大模型基礎(chǔ)上引入指令微調(diào)或提示工程,自動(dòng)生成各類報(bào)告與圖表摘要,提升投研人員的信息獲取效率。
一位券商投研人員向記者透露,目前他們正在測(cè)試多款大模型投研工具的性能。
“整體而言,這類產(chǎn)品若要顯著提升投研效率,還需解決諸多實(shí)際操作瓶頸,比如大模型技術(shù)自動(dòng)生成的信息是否具有即時(shí)性、能否做到信息溯源、是否支持二次編輯與多人協(xié)同工作,能否一鍵快速分享等。”他告訴記者。盡管當(dāng)前大模型投研工具的技術(shù)路徑不一,但他們通過測(cè)試發(fā)現(xiàn),具備自主龐大數(shù)據(jù)庫與良好大模型訓(xùn)練成效的相關(guān)工具更受歡迎,因?yàn)樗坏珳?zhǔn)快速解決投研人員的個(gè)性化信息收集檢索要求,還能方便投研人員輕松進(jìn)行內(nèi)容加工,進(jìn)而大幅提升投研效率。
恒生電子董事長(zhǎng)劉曙峰向記者表示,盡管大模型技術(shù)帶來“語控萬物”、“大才能強(qiáng)”等變化,但在金融垂直領(lǐng)域,其應(yīng)用仍面臨知識(shí)信息時(shí)效性、數(shù)據(jù)安全與隱私保護(hù)、具體應(yīng)用支持等方面的局限。因此,金融行業(yè)需建設(shè)行業(yè)大模型以承接垂直領(lǐng)域的特定需求。
“未來,金融行業(yè)大模型能落地的場(chǎng)景非常多,除了投研,還有投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等。但它的應(yīng)用難點(diǎn)在于協(xié)同,特別是數(shù)據(jù)協(xié)同,各種數(shù)據(jù)如何打通,將是非常具體且困難的問題。”他指出。因此,金融機(jī)構(gòu)要部署應(yīng)用大模型,需從選模型、估規(guī)模、建場(chǎng)景三大步驟入手,構(gòu)建金融行業(yè)大模型與基于大模型的全新數(shù)智產(chǎn)品,為金融行業(yè)應(yīng)用大模型提供新范式。
AI大模型技術(shù)正悄然“改變”投研生態(tài)。
有機(jī)構(gòu)調(diào)研顯示,在投研領(lǐng)域,眾多金融機(jī)構(gòu)面臨諸多痛點(diǎn)瓶頸——60%分析師遇到數(shù)據(jù)碎片、數(shù)據(jù)孤島、投研工具繁雜等困擾;50%基金經(jīng)理遇到信息爆炸、重點(diǎn)信息不突出等挑戰(zhàn);80% 金融機(jī)構(gòu)管理層感到研究團(tuán)隊(duì)不透明,知識(shí)沉淀難等問題。
于是,越來越多金融科技平臺(tái)寄希望大模型技術(shù)破解這些投研痛點(diǎn)瓶頸。
當(dāng)前,大模型投研工具主要分成兩類,一是在現(xiàn)有通用大模型GPT4.0基礎(chǔ)上直接引入“提示工程”與“指令微調(diào)”,以此自動(dòng)生成上市公司公告財(cái)報(bào)要點(diǎn)信息與行業(yè)報(bào)告核心內(nèi)容,提升投研人員信息獲取效率;二是“從頭做起”——將自身數(shù)據(jù)庫通過大模型技術(shù)進(jìn)行大量預(yù)訓(xùn)練,再引入指令精調(diào)與提示工程技術(shù),讓自動(dòng)生成的內(nèi)容能進(jìn)一步滿足投研人員的個(gè)性化信息檢索收集需求。
記者多方了解到,投研人員最擔(dān)憂大模型投研工具會(huì)產(chǎn)生兩大問題,一是一本正經(jīng)地“胡說八道”,二是自動(dòng)生成的相關(guān)內(nèi)容明顯“過時(shí)”,無法滿足投研建模要求。
要解決上述兩大問題,絕非易事。
恒生聚源副總經(jīng)理白雪告訴記者,為了滿足數(shù)據(jù)即時(shí)性要求,WarrenQ在數(shù)據(jù)層與模型層的基礎(chǔ)上,加入涵蓋NL2SQL、搜索接口、指標(biāo)計(jì)算、向量數(shù)據(jù)庫等插件層,確保大模型產(chǎn)品能即時(shí)調(diào)用最新的數(shù)據(jù)以反映最新的金融市場(chǎng)動(dòng)態(tài)與行業(yè)變化趨勢(shì)等。
記者獲悉,要防止大模型“一本正經(jīng)地胡說八道”,金融科技機(jī)構(gòu)還需開展大量預(yù)訓(xùn)練與指令微調(diào)。比如在預(yù)訓(xùn)練環(huán)節(jié),大模型時(shí)常會(huì)“自由發(fā)揮”,自動(dòng)生成很多“天馬行空式”的內(nèi)容信息,于是開發(fā)人員通過不斷調(diào)整指令與反復(fù)預(yù)訓(xùn)練,教會(huì)大模型如何正確識(shí)別提問語義與自動(dòng)生成相應(yīng)的專業(yè)精確回答,確保大模型能不再“答非所問”。
此外,大模型投研工具能否具備“實(shí)用性”,還在于它是否具備支持查看原文、研報(bào)圖表抽取、OCR識(shí)別、支持二次編輯、文檔信息挖掘等功能。
白雪告訴記者,針對(duì)投研環(huán)節(jié)的數(shù)據(jù)分析與智能處理實(shí)際需求,WarrenQ推出了兩款A(yù)I工具,分別是WarrenQ-Chat和ChatMiner。前者主要借助大模型疊加搜索與恒生聚源金融數(shù)據(jù)庫,通過對(duì)話指令,幫助投研人員高效獲取金融行情、資訊和數(shù)據(jù),且每一句自動(dòng)生成的對(duì)話都支持原文溯源,還可以生成金融專業(yè)報(bào)表,從而將傳統(tǒng)投研的“搜讀算寫”流程轉(zhuǎn)變成“Chat讀算寫”,提升投研人員的信息獲取效率;后者則主要發(fā)揮金融文檔挖掘器功能——即大模型和向量數(shù)據(jù)庫會(huì)根據(jù)投研人員個(gè)性化需求,對(duì)相關(guān)文檔進(jìn)行快速解讀與精準(zhǔn)檢索定位,自動(dòng)生成提取關(guān)鍵信息,提升投研人員對(duì)海量文本數(shù)據(jù)的整合歸納提煉效率。
一位正研發(fā)大模型投研工具的金融科技平臺(tái)人士向記者直言,其研發(fā)難度遠(yuǎn)遠(yuǎn)超過預(yù)期。僅在數(shù)據(jù)庫建設(shè)、大模型技術(shù)選用、大模型預(yù)訓(xùn)練等方面,企業(yè)都走過不少?gòu)澛罚?/p>
“這背后,是金融科技平臺(tái)需全方位比拼數(shù)據(jù)、算力與算法。只有數(shù)據(jù)庫越全越龐大、算力更強(qiáng)、算法模型更高效的大模型投研工具才有望脫穎而出。”他直言。
在白雪看來,大模型時(shí)代的產(chǎn)品化服務(wù)與落地,可以持續(xù)做好三件事:一是加強(qiáng)數(shù)據(jù)獲取的精準(zhǔn)性、數(shù)據(jù)更新的即時(shí)性;二是提升大模型及其精準(zhǔn)的意圖識(shí)別能力,做到自然語言到數(shù)據(jù)、自然語言到指令的精確映射,即“語控萬數(shù)”、“語控萬物”;三是用好向量數(shù)據(jù)庫,將私域知識(shí)庫與大模型結(jié)合起來做好產(chǎn)品與服務(wù)。
在多位業(yè)內(nèi)人士看來,AI大模型技術(shù)能否成功應(yīng)用在投研、投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等金融場(chǎng)景,另一個(gè)關(guān)鍵成敗因素是金融科技平臺(tái)能否構(gòu)建專業(yè)的金融行業(yè)大模型。
一位奇富科技人士指出,金融行業(yè)因其行業(yè)特殊性,對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量、模型生成效果、數(shù)據(jù)安全合規(guī)等方面有著更高要求。首先,金融行業(yè)大模型需全面掌握金融專業(yè)術(shù)語,理解客戶意圖,在與客戶對(duì)話過程能精確提取線索(即客戶想了解的信息),并給出兼顧專業(yè)性與合規(guī)性的應(yīng)答;其次,金融行業(yè)大模型必須在準(zhǔn)確性和適用性兩個(gè)方面做到極致,因?yàn)樵诮鹑陬I(lǐng)域,大模型自動(dòng)生成的內(nèi)容是不能出現(xiàn)“任何錯(cuò)誤”的。
在他看來,要實(shí)現(xiàn)上述要求,金融科技平臺(tái)需向金融行業(yè)大模型注入足夠全面龐大的數(shù)據(jù)進(jìn)行反復(fù)預(yù)訓(xùn)練,才能實(shí)現(xiàn)“回答精確”與“話術(shù)合規(guī)”。
“公司在信貸領(lǐng)域所積累的逾5000萬份征信報(bào)告及解讀、月均逾350萬的用戶深度對(duì)話,以及涵蓋900多個(gè)行業(yè)、逾3000個(gè)標(biāo)簽屬性的逾1600萬家企業(yè)金融行為數(shù)據(jù),加之所衍生的知識(shí)圖譜與專業(yè)知識(shí),都被納入金融行業(yè)大模型的數(shù)據(jù)基礎(chǔ)。”這位奇富科技人士向記者直言。
恒生電子首席科學(xué)家白碩告訴記者,金融行業(yè)大模型的研發(fā),的確離不開龐大的金融數(shù)據(jù)支撐。恒生電子所打造的金融行業(yè)大模型LightGPT已使用逾4000億tokens的金融領(lǐng)域數(shù)據(jù)(包括資訊、公告、研報(bào)、結(jié)構(gòu)化數(shù)據(jù)等)、以及逾400億tokens的語種強(qiáng)化數(shù)據(jù)(包括金融教材、金融百科、政府報(bào)告、法規(guī)條例等),并以此作為大模型二次預(yù)訓(xùn)練的“語料”,支持逾80項(xiàng)金融專屬任務(wù)指令微調(diào),進(jìn)一步提升金融行業(yè)大模型的準(zhǔn)確理解能力。
白雪告訴記者,大模型投研工具的研發(fā)成敗,很大程度取決于“語料”的豐富度與專業(yè)性。因?yàn)橥堆腥藛T都希望自動(dòng)生成的內(nèi)容信息能盡可能多地涵蓋當(dāng)前市場(chǎng)各種動(dòng)態(tài)與觀點(diǎn),這都需要金融科技平臺(tái)不斷向大模型注入最新的各類精準(zhǔn)的金融語料,并實(shí)時(shí)鏈接映射到數(shù)據(jù)庫,令大模型投研工具自動(dòng)生成的內(nèi)容能最大限度“與時(shí)俱進(jìn)”。
值得注意的是,一個(gè)行之有效的金融行業(yè)大模型光有龐大專業(yè)的數(shù)據(jù)庫是不夠的——除了與之配套的算力算法等金融基礎(chǔ)設(shè)施,它還需解決諸多挑戰(zhàn),包括能否做到輕量化部署、能否在金融專業(yè)問答、邏輯推理、超長(zhǎng)文本處理能力、多模態(tài)交互能力、代碼能力等金融大模型能力評(píng)測(cè)領(lǐng)域取得不俗表現(xiàn),并保證內(nèi)容和指令的合規(guī)安全等。
上述金融科技平臺(tái)人士向記者透露,這令眾多金融機(jī)構(gòu)倍感壓力——若在傳統(tǒng)AI模型基礎(chǔ)上研發(fā)金融行業(yè)大模型,幾乎是很難完成的任務(wù)。因?yàn)閭鹘y(tǒng)AI模型與大模型技術(shù)在數(shù)據(jù)、模型、模型開發(fā)方式、業(yè)務(wù)應(yīng)用、適用場(chǎng)景及成本等方面完全“不同”——相比傳統(tǒng)AI模型的作坊式操作、研發(fā)周期長(zhǎng)、通用性低等特點(diǎn),大模型技術(shù)開創(chuàng)性地提出預(yù)訓(xùn)練模式,以流水線的模型開發(fā)方式可泛化多應(yīng)用場(chǎng)景,實(shí)現(xiàn)高通用性。
“兩者截然不同的特點(diǎn),預(yù)示著金融機(jī)構(gòu)需要持續(xù)投入大量資金資源,持續(xù)強(qiáng)化金融行業(yè)大模型的預(yù)訓(xùn)練成效,才能令它更精準(zhǔn)高效地匹配投研、投顧、客服、運(yùn)營(yíng)、合規(guī)、交易等金融場(chǎng)景各類業(yè)務(wù)需求。”他直言。
白碩告訴記者,目前LightGPT計(jì)劃在9月底完成新一輪的金融能力升級(jí),并支持金融機(jī)構(gòu)通過私域任務(wù)數(shù)據(jù)定制化“精調(diào)”大模型,從而打造機(jī)構(gòu)專屬的大模型,滿足個(gè)性化需求。
在劉曙峰看來,在大模型時(shí)代,“數(shù)據(jù)+算法+算力”正構(gòu)成新范式的基本要素。金融行業(yè)更需促進(jìn)大模型產(chǎn)業(yè)上下游合作,為金融數(shù)智化提供更強(qiáng)有力的技術(shù)支撐。
關(guān)鍵詞:
百事通!出塞拼音版徐錫麟_出塞拼音版
1、出塞二首拼音如下:(普通話拼...
環(huán)球頭條:樂歌股份:第二季度“樂歌轉(zhuǎn)債”轉(zhuǎn)股1051股
樂歌股份(SZ300729,收盤價(jià):18 ...
復(fù)星醫(yī)藥:本集團(tuán)實(shí)際對(duì)外擔(dān)保金額折合人民幣約236.26億元 世界新視野
復(fù)星醫(yī)藥(SH600196,收盤價(jià):31 ...
麗人麗妝董秘杜紅譜:加入金融界“美麗中國(guó)ESG研究聯(lián)盟”,將ESG理念融入公司戰(zhàn)略...
6月29日,“2023金融界高質(zhì)量上市...
盤活閑置資源激活鄉(xiāng)村發(fā)展“一池春水”
盤活閑置資源激活鄉(xiāng)村發(fā)展“一池春...
每日快報(bào)!cf手游戰(zhàn)壘駕照科目一考試答案
近期cf手游上線了一個(gè)有趣的答題活...
報(bào)道:湖南同德職業(yè)技術(shù)學(xué)院_同德職業(yè)技術(shù)學(xué)院
1、湖南應(yīng)用技術(shù)學(xué)院教學(xué)質(zhì)量一般...
焦點(diǎn)關(guān)注:噗噗體操完整版_噗
1、噗的釋義:在網(wǎng)絡(luò)用語中,一般...