近日,云從科技從容大模型在綜合評測權威平臺OpenCompass的多模態評測領域中取得重大進展。
最新評測結果顯示,云從科技的從容大模型在該體系中的平均得分為65.5,這一成績使得從容大模型躋身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,僅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9)。而在國內市場,從容大模型的成績也超過了InternVL-Chat(61.7)和GLM-4V(60.8),排名首位。
圖1:OpenCompass多模態榜單
OpenCompass大模型開放評測體系是上海人工智能實驗室推出的完整開源可復現的評測框架。OpenCompass多模態評測方面采用了8個具有代表性的數據集,從多種視角客觀量化多模態大模型的能力,評估維度覆蓋目標檢測、文字識別、動作識別、圖像理解和關系推理、藝術與設計、商業、科學、健康與醫學、人文與社會科學、技術與工程、數學推理等多個方面。
圖2:從容大模型-2.0多模態能力示例
在本次測評中,從容大模型在其中的6個數據集表現優異,排名國內第一(MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench),尤其是在OCRBench測試集上以取得全球最高的827分(總分為1000分),且高于第二名GLM-4v 13分,進一步提升從容大模型在文本識別、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵信息提取等業務場景下的適用性。
圖3:OpenCompass中國大模型多模態能力展示
從容大模型在此體系中的優秀表現,依賴云從科技自研的高效多模態處理架構和先進的計算技術,實現了高效的多模態數據處理能力,能夠在視覺和語言任務之間實現高效的融合和切換,并最大化利用計算資源,保證在處理大規模多模態數據時仍能保持較高的性能和響應速度,使得模型的訓練過程更加高效,收斂速度更快,性能更穩定。
同時也得益于云從科技長期在視覺、語言領域的深厚積累和不斷創新。
圖4:從容大模型-2.0多模態能力示例
此前,從容大模型已在視覺、跨模態領域10次刷新世界紀錄,綜合性能經第三方SuperClue、C-Eval等綜合評測,位列全球前五。
作為一家專注于人機協同技術研發的平臺企業,云從科技一直在積極推動AI智能體及大模型技術的發展和應用。
隨著人工智能技術的迅猛發展,多模態大模型已成為驅動產業變革的核心引擎。此次從容大模型在OpenCompass大模型開放評測體系中的出色表現,不僅是對云從科技技術創新實力的認可,更在業界樹立典范,激勵全球科技企業在新一輪的人工智能競爭中勇攀高峰。
近日,人民網主辦的2023年人民財經論壇在北京舉行。會上,第二十屆人民匠心獎揭曉,云從科技獲評“人民匠心獎——匠心產品獎”。
近日,在科創板迎來開板四周年之際,作為“科創板全球科創競爭力排行榜”系列榜單的主榜單,“科創板全球科創競爭力20強”出爐,云從科技入選榜單。
10月24日,華為昇騰AI創新大賽2023全國總決賽在北京國家會議中心隆重舉辦,云從科技憑借從容大模型訓推一體化解決方案,以總成績第一榮獲應用賽道金獎。
周一到周五9:30-18:00(北京時間)
商務合作:business@cloudwalk.com
媒體合作:Media@cloudwalk.com
渠道合作:business_partner@cloudwalk.com
人才招聘:zhaopin@cloudwalk.com