蜜度攜「跨模態信息檢索」與「智能校對」兩大應用開啟數智化新未來

2022年09月06日13:22:11 科技 1578

在剛剛落幕的2022世界人工智能大會(WAIC)中,上海蜜度信息技術有限公司不僅與上海市人工智能行業協會主辦了「數據智能與內容認知高峰論壇」,邀請數據智能領域的國內外頂級學者共同深度探討了技術演進與未來願景;在展覽活動中更通過「蜜小智」「蜜小度」「蜜小校」等虛擬形象,帶領觀眾沉浸式地感受了跨模態信息檢索與智能校對兩大數據智能應用在具體場景中的賦能。

作為蜜度以強大科研能力與深邃行業洞察研發的兩大創新應用,跨模態信息檢索和智能校對能夠成為深化數據價值和提升工作效率的重要途徑。基於兩者的多場景數據智能產品和解決方案,也已經為不同行業用戶提供了從數據融合到智能認知、從策略生成到自動處理的全流程服務,全面助力政府及企業的數智化轉型升級。

跨模態檢索:彙集湍流,覓取一瓢

人類活動伴隨着信息的產生與散播,而隨着技術的進階,信息的模態也從單一文本向多模態發展,包括圖片、音頻和視頻在內的多模態信息佔比越來越大。而當湍流般的龐雜訊息噴涌而至,跨越模態的檢索能幫助我們更接近我們尋覓的答案。

在技術角度,跨模態的實現主要依賴以下四個層面的技術:

一是跨模態對比學習,指首先從單模態數據中的相似性排序進行數據增強,再使用對應特徵計算對比學習損失,最終使模型在多模態任務中的表現更為出色。

二是跨模態語義融合,指通過整合不同模態間的模型和特徵,提高理解能力與效率,實現對語音文字文本的自動糾錯,提升識別準確率。

三是跨模態語義表徵,指整合多模態信息,並對錶征進行聯合,從而實現視頻內容的一體化識別。

四是跨模態語義檢索,指通過用搜索特徵向量對海量目標高維向量進行近似最近鄰計算,實現語義檢索及TopN相似結果的召回,最終提高檢索結果的精度。

秉承高效而全面的跨模態檢索能力,蜜度旗下跨模態檢索平台「蜜度索驥」在保障了文本判讀與圖片識別準確率的同時,還能夠智能識別圖片中的文字內容,準確解析視頻中的字幕、背景、封面等特徵元素。

對模型的細節優化同樣步履不停,目前,蜜度索驥已實現對常規常見場景的快速識別與提取,並針對一百餘個政務類單位、近300個特殊場景進行加強訓練,實現特殊場景識別;並通過智能識別能力輸出視覺、語音多維度內容標籤,進一步提高檢索效率。

目前,蜜度旗下的蜜度索驥、蜜度版權通、城感通等產品已經植入了先進的跨模態檢索能力,為社會治理、網絡安全、版權保護、品牌決策、營銷洞察等場景打造了標杆化應用。

除了各種場景化應用之外,跨模態檢索的發展也為AIGC(AI Generated Content,人工智能自主生成內容)帶來了前所未有的勢能。一個極好的例子就是正在迅猛發展中的AI繪畫——藉助大模型的跨模態綜合技術能力,人工智能可以通過表徵學習將圖像、視頻、音頻、語義等多模態信息融合,再佐以跨模態數據的協同訓練,最終讓抽象的自然語言可以經由預訓練模型自動完成視覺圖像的自動生成。

蜜度攜「跨模態信息檢索」與「智能校對」兩大應用開啟數智化新未來 - 天天要聞

蜜度AI小畫家「蜜小度」繪製作品

隨着人工智能技術的全局發展,跨模態檢索提升的不僅是搜索效率與結果質量,同樣也幫助我們突破人腦的創意限制,用貼切的想像力營建更精彩的未來世界。

智能校對:一目萬行,纖悉無遺

蜜度在智能校對應用能力通過結合行業先進的自然語言處理、知識圖譜與光學字符識別等技術,實現了對中文文本和語義關係錯誤的自動發現與糾正處理,可廣泛應用於政府公文、新聞稿件、日常寫作等場景,在降低差錯概率和提升文本質量的同時,也大幅度提高工作效率。

在技術角度,智能校對的實現主要有以下特點:

一是基於「大數據+大模型」,百億級別的平衡語料,實現細微語義信息的捕捉、辨別。

二是專用校對知識圖譜,以知識圖譜技術驅動,刻畫人物、機構、地域等實體關係,實現時政相關表述校對,讓字符串擁有關聯語義。

三是專業領域校對賦能,通過集成學習技術,能夠快速形成不同行業的校對能力。

蜜度旗下AI智能校對平台「蜜度校對通」就是基於智能校對應用而開發的專業軟件。蜜度校對通圍繞中文語言特點及使用習慣,以百億級訓練語料為基礎,覆蓋文字標點差錯、知識性差錯、內容導向風險三大審核與校對類型,並擁有25類全棧審核與校對能力,能夠對錯別字、詞,多字、少字錯誤,語義重複,語序錯誤,句式雜糅,量與單位差錯;專有名詞及術語,法律法規名稱,常識差錯等內容進行智能審核與校對,有效解決內容的規範性、安全性、合法性問題。

無論是政務單位的日常公文、思想彙報、宣傳稿、工作總結等材料;還是圖書、期刊、科研報告、論文、媒體通稿、專題報道等文稿;抑或音像電子、網絡遊戲等電子出版物;以及企業軟文、品宣物料、策劃案等內容,都可以由蜜度校對通執行快速錯敏校對,一站式全方位地提高內容質量,保障內容安全。

蜜度攜「跨模態信息檢索」與「智能校對」兩大應用開啟數智化新未來 - 天天要聞

AI智能校對平台——蜜度校對通

就在此次2022世界人工智能大會(WAIC)現場,軟硬件本地化智能解決方案——校對通AI-Box也正式發佈,作為首個通過華為昇騰AI生態認證的本地化智能校對解決方案,校對通AI-Box既可以在本地化的部署下,充分保障數據私密性;也能夠作為專屬的邊緣計算,大幅度提升用戶工作效率;同時也在融入華為昇騰 AI 生態體系的過程中,與主流國產系統共同營造高質量的數字辦公體驗。

對數據最好的尊重是智能化地挖掘它們蘊藏的價值,而在此過程中,我們不僅可以凝集人類的過往經驗用以打造更快捷的算法模型,也需要人工智能使用不同於人腦的方式感知這個世界,從而開闢一個全新的方式,不僅理解萬物,也汲取能量,最終創造更精彩的未來。

人工智能是屬於這個時代的強大工具,它不僅是信息檢索長途上的同行者,也是重構世界的創造者,而作為數據智能領域的領軍者,蜜度致力於用每一點技術進步,推動各行各業的數智化發展,與業內合作夥伴以及廣大用戶一同,眾行致遠,探索浩瀚。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發佈了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發佈會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,積架路虎宣布暫停對美出口一個月,奧迪更是直接