近日,云從科技正式中標中國郵政儲蓄銀行山東省分行(以下簡稱“郵儲銀行山東分行”)基于多模態(tài)大模型的文檔影像信息提取模型構(gòu)建技術(shù)服務(wù)項目,將共同打造金融行業(yè)大模型——文檔多模態(tài)大模型。
這是云從科技在多模態(tài)大模型領(lǐng)域的又一標桿案例,也是郵儲銀行山東分行對云從科技實力的充分肯定。
此次合作的重點在于解決金融場景中的文檔影像處理難題。
金融場景的文檔影像類型眾多,包括卡證、票據(jù)、合同、表格、報告等,不同類型的文檔還存在大量的子類型,存在版式復(fù)雜多樣化、內(nèi)容表達差異大、上下文信息跨度大、真實數(shù)據(jù)收集困難等問題。
傳統(tǒng)的OCR和文檔解析往往需要針對某一具體子類型進行定制開發(fā),導(dǎo)致開發(fā)成本高昂且缺乏泛化能力,同時對文檔的語義理解能力低,難以應(yīng)對這些挑戰(zhàn)。
為了克服這些困難,云從科技與郵儲銀行山東分行攜手合作,深入挖掘行業(yè)痛點。針對傳統(tǒng)OCR和文檔解析的缺陷進行了優(yōu)化升級,研發(fā)基于從容大模型的文檔多模態(tài)大模型。
文檔多模態(tài)大模型的出現(xiàn)將極大提升不同版式間的泛化性能,使其能夠適應(yīng)各種復(fù)雜的文檔版式,并且可以有效處理無固定版式的票據(jù)、卡證、合同、表格、報告等。
不僅降低定制開發(fā)成本,還可以提高大模型在不同場景下的適用性。
此外,通過語言、視覺等不同模態(tài)之間的關(guān)聯(lián),文檔多模態(tài)大模型具有出色的定位能力和多答案文本抽取能力,能夠準確提取非連續(xù)答案。
在數(shù)據(jù)方面,文檔多模態(tài)大模型采用自研的文檔合成工具,實現(xiàn)了數(shù)據(jù)模擬生成的功能。對于難例場景,利用數(shù)據(jù)合成和處理工具也能夠進行適配訓(xùn)練,從而快速而靈活地優(yōu)化模型效果,解決了業(yè)務(wù)數(shù)據(jù)保密和成本方面的痛點。
作為一家致力于引領(lǐng)新一代人工智能浪潮的企業(yè),云從科技憑借其世界領(lǐng)先、自主可控的大模型核心技術(shù),在語言、視覺等多個領(lǐng)域?qū)覄?chuàng)世界紀錄。未來,云從科技將繼續(xù)秉承創(chuàng)新精神,為金融行業(yè)提供更優(yōu)質(zhì)的技術(shù)和解決方案,推動行業(yè)的智能化進程。
由傳播內(nèi)容認知全國重點實驗室科技倫理委員會指導(dǎo)、人民網(wǎng)科技公司聯(lián)合大模型企業(yè)共同發(fā)起的“大模型責(zé)任聯(lián)盟”宣布成立。聯(lián)盟首批成員單位共30家,包含云從科技、華為云、阿里云、智譜AI等多家優(yōu)秀企業(yè)。
6月24日,第十一屆中國(廣州)國際金融交易·博覽會,在產(chǎn)融對接項目簽約儀式上,云從科技和交通銀行廣東省分行達成戰(zhàn)略合作,獲得30億元全融資授信意向額度的支持。
朱芝松書記對云從科技在科技創(chuàng)新、大模型構(gòu)建、數(shù)字城市建設(shè)等領(lǐng)域發(fā)展所取得的良好態(tài)勢給予充分肯定。
周一到周五9:30-18:00(北京時間)
商務(wù)合作:business@cloudwalk.com
媒體合作:Media@cloudwalk.com
渠道合作:business_partner@cloudwalk.com
人才招聘:zhaopin@cloudwalk.com