近期,多家金融機(jī)構(gòu)公布大模型招投標(biāo)信息。10月10日,工商銀行披露了該行軟件開發(fā)中心“NLP大模型產(chǎn)品新技術(shù)采購項(xiàng)目”入圍信息。10月23日,招商銀行也披露了“招商銀行預(yù)訓(xùn)練基礎(chǔ)大語言模型(千億級)采購項(xiàng)目”結(jié)果。此外,建行、郵儲等銀行也于近期披露了與大模型相關(guān)的項(xiàng)目或招投標(biāo)結(jié)果。
大模型是一種用于處理自然語言信息的大型人工智能模型。近年來,伴隨著生成式人工智能在全球的迅速發(fā)展,我國相關(guān)創(chuàng)新和應(yīng)用步伐加快,其在金融領(lǐng)域的價值潛力也被普遍看好。業(yè)內(nèi)專家認(rèn)為,金融行業(yè)數(shù)據(jù)資源豐富、場景多元,擁有與大模型深度結(jié)合的前景。
“當(dāng)前,大模型在金融業(yè)的應(yīng)用仍處于起步階段?!敝嘘P(guān)村科金技術(shù)副總裁張杰表示,眼下大模型在金融業(yè)的嘗試仍以服務(wù)于內(nèi)部需求為主,在此基礎(chǔ)上再逐漸建立屬于自己的體系。對于大模型在金融業(yè)的應(yīng)用,業(yè)內(nèi)人士認(rèn)為,大模型可以讀懂財經(jīng)報道,讀懂分析師撰寫的年報等,并從這些內(nèi)容里提煉出事實(shí)、事件和觀點(diǎn)等,最后根據(jù)客戶的個性化需求,有針對性地迅速生成專業(yè)性文章。
近期,有多家公司發(fā)布了可用于金融場景的大模型,如中關(guān)村科金發(fā)布了國內(nèi)首個企業(yè)知識大模型。在國際上,美國彭博社推出的大模型,涵蓋了3630億詞的金融文本和3450億詞的通用文本。在業(yè)內(nèi)看來,這樣大體量的金融知識庫是在金融領(lǐng)域較為領(lǐng)先的嘗試。
清華大學(xué)人工智能研究院常務(wù)副院長、歐洲科學(xué)院外籍院士孫茂松表示,未來我國金融領(lǐng)域不能沒有大模型。據(jù)介紹,金融大模型屬于垂直領(lǐng)域大模型,對算力和算法要求相對較低,但對金融專業(yè)知識和數(shù)據(jù)的要求較高。“通用基礎(chǔ)大模型對數(shù)字不太敏感,但金融業(yè)對數(shù)字的精準(zhǔn)性要求很高,而且圖表較多。”孫茂松表示,這些問題需要逐步解決。另外,當(dāng)前大模型主要基于文本,但在行業(yè)領(lǐng)域,知識圖譜更靠譜。如何將知識圖譜在大模型的通用領(lǐng)域和專業(yè)領(lǐng)域的應(yīng)用有機(jī)結(jié)合起來,仍然需要更多的研究和技術(shù)。
業(yè)內(nèi)人士認(rèn)為,企業(yè)在引入大模型或搭建企業(yè)知識中臺的時候,可以用兩種技術(shù)路線來組合:一種是領(lǐng)域大模型技術(shù),另一種是外掛知識庫技術(shù)。張杰建議,企業(yè)可以分三個步驟逐步開展。第一步在基礎(chǔ)大模型之上,針對具體應(yīng)用場景搭建場景提示工程,快速進(jìn)行技術(shù)驗(yàn)證。第二步建立企業(yè)知識庫,通過基礎(chǔ)大模型、外掛企業(yè)知識庫,再在具體場景下調(diào)整提示詞,進(jìn)而解決大模型事實(shí)問題回答不好的“幻覺”問題。第三步成本較高,但能在具體的場景下把性能做到極致并開發(fā)出增量應(yīng)用,即把領(lǐng)域知識注入大模型中形成領(lǐng)域大模型,同時把上層提示工程上升為人工智能應(yīng)用開發(fā)平臺。
來源:中國經(jīng)濟(jì)網(wǎng)