蜜度攜「跨模態信息檢索」與「智能校對」兩大應用開啟數智化新未來

2022年09月06日13:22:11 科技 1578

在剛剛落幕的2022世界人工智慧大會(WAIC)中,上海蜜度信息技術有限公司不僅與上海市人工智慧行業協會主辦了「數據智能與內容認知高峰論壇」,邀請數據智能領域的國內外頂級學者共同深度探討了技術演進與未來願景;在展覽活動中更通過「蜜小智」「蜜小度」「蜜小校」等虛擬形象,帶領觀眾沉浸式地感受了跨模態信息檢索與智能校對兩大數據智能應用在具體場景中的賦能。

作為蜜度以強大科研能力與深邃行業洞察研發的兩大創新應用,跨模態信息檢索和智能校對能夠成為深化數據價值和提升工作效率的重要途徑。基於兩者的多場景數據智能產品和解決方案,也已經為不同行業用戶提供了從數據融合到智能認知、從策略生成到自動處理的全流程服務,全面助力政府及企業的數智化轉型升級。

跨模態檢索:彙集湍流,覓取一瓢

人類活動伴隨著信息的產生與散播,而隨著技術的進階,信息的模態也從單一文本向多模態發展,包括圖片、音頻和視頻在內的多模態信息佔比越來越大。而當湍流般的龐雜訊息噴涌而至,跨越模態的檢索能幫助我們更接近我們尋覓的答案。

在技術角度,跨模態的實現主要依賴以下四個層面的技術:

一是跨模態對比學習,指首先從單模態數據中的相似性排序進行數據增強,再使用對應特徵計算對比學習損失,最終使模型在多模態任務中的表現更為出色。

二是跨模態語義融合,指通過整合不同模態間的模型和特徵,提高理解能力與效率,實現對語音文字文本的自動糾錯,提升識別準確率。

三是跨模態語義表徵,指整合多模態信息,並對錶征進行聯合,從而實現視頻內容的一體化識別。

四是跨模態語義檢索,指通過用搜索特徵向量對海量目標高維向量進行近似最近鄰計算,實現語義檢索及TopN相似結果的召回,最終提高檢索結果的精度。

秉承高效而全面的跨模態檢索能力,蜜度旗下跨模態檢索平台「蜜度索驥」在保障了文本判讀與圖片識別準確率的同時,還能夠智能識別圖片中的文字內容,準確解析視頻中的字幕、背景、封面等特徵元素。

對模型的細節優化同樣步履不停,目前,蜜度索驥已實現對常規常見場景的快速識別與提取,並針對一百餘個政務類單位、近300個特殊場景進行加強訓練,實現特殊場景識別;並通過智能識別能力輸出視覺、語音多維度內容標籤,進一步提高檢索效率。

目前,蜜度旗下的蜜度索驥、蜜度版權通、城感通等產品已經植入了先進的跨模態檢索能力,為社會治理、網路安全、版權保護、品牌決策、營銷洞察等場景打造了標杆化應用。

除了各種場景化應用之外,跨模態檢索的發展也為AIGC(AI Generated Content,人工智慧自主生成內容)帶來了前所未有的勢能。一個極好的例子就是正在迅猛發展中的AI繪畫——藉助大模型的跨模態綜合技術能力,人工智慧可以通過表徵學習將圖像、視頻、音頻、語義等多模態信息融合,再佐以跨模態數據的協同訓練,最終讓抽象的自然語言可以經由預訓練模型自動完成視覺圖像的自動生成。

蜜度攜「跨模態信息檢索」與「智能校對」兩大應用開啟數智化新未來 - 天天要聞

蜜度AI小畫家「蜜小度」繪製作品

隨著人工智慧技術的全局發展,跨模態檢索提升的不僅是搜索效率與結果質量,同樣也幫助我們突破人腦的創意限制,用貼切的想像力營建更精彩的未來世界。

智能校對:一目萬行,纖悉無遺

蜜度在智能校對應用能力通過結合行業先進的自然語言處理、知識圖譜與光學字元識別等技術,實現了對中文文本和語義關係錯誤的自動發現與糾正處理,可廣泛應用於政府公文、新聞稿件、日常寫作等場景,在降低差錯概率和提升文本質量的同時,也大幅度提高工作效率。

在技術角度,智能校對的實現主要有以下特點:

一是基於「大數據+大模型」,百億級別的平衡語料,實現細微語義信息的捕捉、辨別。

二是專用校對知識圖譜,以知識圖譜技術驅動,刻畫人物、機構、地域等實體關係,實現時政相關表述校對,讓字元串擁有關聯語義。

三是專業領域校對賦能,通過集成學習技術,能夠快速形成不同行業的校對能力。

蜜度旗下AI智能校對平台「蜜度校對通」就是基於智能校對應用而開發的專業軟體。蜜度校對通圍繞中文語言特點及使用習慣,以百億級訓練語料為基礎,覆蓋文字標點差錯、知識性差錯、內容導向風險三大審核與校對類型,並擁有25類全棧審核與校對能力,能夠對錯別字、詞,多字、少字錯誤,語義重複,語序錯誤,句式雜糅,量與單位差錯;專有名詞及術語,法律法規名稱,常識差錯等內容進行智能審核與校對,有效解決內容的規範性、安全性、合法性問題。

無論是政務單位的日常公文、思想彙報、宣傳稿、工作總結等材料;還是圖書、期刊、科研報告、論文、媒體通稿、專題報道等文稿;抑或音像電子、網路遊戲等電子出版物;以及企業軟文、品宣物料、策劃案等內容,都可以由蜜度校對通執行快速錯敏校對,一站式全方位地提高內容質量,保障內容安全。

蜜度攜「跨模態信息檢索」與「智能校對」兩大應用開啟數智化新未來 - 天天要聞

AI智能校對平台——蜜度校對通

就在此次2022世界人工智慧大會(WAIC)現場,軟硬體本地化智能解決方案——校對通AI-Box也正式發布,作為首個通過華為昇騰AI生態認證的本地化智能校對解決方案,校對通AI-Box既可以在本地化的部署下,充分保障數據私密性;也能夠作為專屬的邊緣計算,大幅度提升用戶工作效率;同時也在融入華為昇騰 AI 生態體系的過程中,與主流國產系統共同營造高質量的數字辦公體驗。

對數據最好的尊重是智能化地挖掘它們蘊藏的價值,而在此過程中,我們不僅可以凝集人類的過往經驗用以打造更快捷的演算法模型,也需要人工智慧使用不同於人腦的方式感知這個世界,從而開闢一個全新的方式,不僅理解萬物,也汲取能量,最終創造更精彩的未來。

人工智慧是屬於這個時代的強大工具,它不僅是信息檢索長途上的同行者,也是重構世界的創造者,而作為數據智能領域的領軍者,蜜度致力於用每一點技術進步,推動各行各業的數智化發展,與業內合作夥伴以及廣大用戶一同,眾行致遠,探索浩瀚。

科技分類資訊推薦

電動牙刷哪個牌子的好用?帶你一次盤點品牌前十名產品優勢 - 天天要聞

電動牙刷哪個牌子的好用?帶你一次盤點品牌前十名產品優勢

隨著現代人口腔問題日益增多,刷牙作為口腔護理的關鍵環節顯得尤為重要。相比傳統牙刷可能存在的清潔不徹底問題,專業電動牙刷能顯著提升清潔效果,有效預防口腔疾病。然而,市面上不少產品存在過度清潔的問題,容易引發牙齒敏感、出血、牙齦不適等不良反應。
要續航有續航,要性能有性能,價格只要1989元 - 天天要聞

要續航有續航,要性能有性能,價格只要1989元

不知道大家有沒有這樣的消費習慣:預算不高,眼光還挺高。想買個性能好的手機,拍照不能拉胯,屏幕要護眼,電池要耐用,關鍵是還不能貴,最好一千多塊就能拿下,買完了還得跟朋友吹:「你看,我花這麼點錢買的手機,多值啊!」放在兩年前,你要真有這種心思,
【裝機幫扶站】第1240期:2000/3500/6000:聊幾套用戶需求較高的配置組裝方案 - 天天要聞

【裝機幫扶站】第1240期:2000/3500/6000:聊幾套用戶需求較高的配置組裝方案

【Q1】預算6000元左右,希望上一張RTX5060Ti/16GB,日常還要做一些簡單設計,希望內存至少達到32GB,請問配置如何組更加合理?盡量不超預算,謝謝!【A1】目前RTX5060Ti/16GB的市場熱度非常高,所以價格相比前期出現了小漲,就連丐中丐雙風扇散熱的產品也要賣3799~3899元的樣子,因此6000元的總預算實際非常吃緊,你只能「...
【硬體資訊】NVIDIA不再保守?物理引擎Newton開源,NVLink Fusion開放授權,合作推出Fast-dLLM 框架 - 天天要聞

【硬體資訊】NVIDIA不再保守?物理引擎Newton開源,NVLink Fusion開放授權,合作推出Fast-dLLM 框架

新聞:英偉達:計劃於 7 月開源全球最先進的物理引擎 Newton5 月 19 日消息,在今日的台北電腦展 2025 主題演講中,英偉達 CEO 黃仁勛表示,在物理世界中製造機器人「不切實際」,必須在遵循物理定律的虛擬世界中訓練它們。英偉達與 DeepMind 和 Disney Research 研究合作開發了「全球最先進的物理引擎 Newton」,計劃於.
回應 WP Engine 商標爭議事件:Linux 基金會推出 FAIR 項目 - 天天要聞

回應 WP Engine 商標爭議事件:Linux 基金會推出 FAIR 項目

IT之家 6 月 9 日消息,Linux 基金會於 6 月 6 日宣布啟動一個名為 FAIR Package Manager(FAIR)的項目,旨在打造一個去中心化的 WordPress 插件與主題生態系統,該項目意圖將控制權歸還給網站託管服務商和開發者,被業界廣泛認為是回應 WP Engine 爭議事件的一項延伸舉措。根據項目官方介紹,FAIR 套件管理器
從3199元跌至1835元,天璣9400+120w+超聲波指紋,水桶機更親民 - 天天要聞

從3199元跌至1835元,天璣9400+120w+超聲波指紋,水桶機更親民

手機行業每一年都有大變動,就不能懷著之前的想法去買手機,如果去年618你想買高性能手機,最起碼預算要有個兩千五以上,而且當時買驍龍8Gen 3手機,還要接近三千元的預算,也就是天璣9300手機會更便宜一些,當時降到兩千六七,不過那會沒有國補