技術文章:論人類語言的數學本質

2022年09月27日23:53:17 科學 1399

技術文章:論人類語言的數學本質 - 天天要聞

聲音的波形

既然只能傳遞一維的信息,那麼眼睛看到的二維圖像就面臨著一個編碼問題,這就是語言

漢語把信號發射器所在的那個人編碼為「我」,把接收器所在的人編碼為「你」,這就是象形文字

英語把信號發射器編碼為"I",把接收器編碼為"you",這就是拼音文字

(PS:英語必然是次生文明的文字,而不是主文明的文字[呲牙]因為英語的編碼方式不符合人類90%的信息依賴眼睛的特點)

這種編碼和計算機的H264編碼比起來,是非常粗糙的。

H264編碼在接收端可以完整的解碼出圖像來,而人類語言則需要聽者根據先驗信息腦補[大笑]

H264也存在先驗信息,就是這個編碼協議本身,它是基於離散餘弦變換(DCT)的,類似於二維圖像在傅立葉級數上的展開。

傅立葉級數的不同項在數學上是線性無關的,構成一組基

人類的文字其實也可以看作「一組基」

漢語因為是二維文字,描述起來比較複雜,但英語的描述是很簡單的。

它有26個字母表示不同的讀音,這26個字母暫時可以認為是線性無關的。

素數給這26個字母編號:

1,A:2,B:3,C:5,D:7,E:11,F:13,G:17。

2,H:19,I:23,J:29,K:31,L:37,M:41,N:43。

3,O:47,P:53,Q:59,R:61,S:67,T:71。

4,U:73,V:79,W:83,X:89,Y:97,Z:101。

那麼,「我」(I)這個視覺信息數學上的編碼就是23[呲牙]

「你」(you)這個視覺信息在數學上的編碼就是97*47*73[呲牙]

因為素數是不能因式分解的,多個素數的積的因式分解在忽略了順序的情況下是唯一的,所以這個編碼實際上是唯一的。

人腦對來自眼睛大量信息的處理結果,最終是一組線性無關的,以及它們的係數組合。

技術文章:論人類語言的數學本質 - 天天要聞

如果人腦的底層機制也跟電腦一樣是數字信號的話,那麼這組係數就是有理數

如果人腦的底層機制是模擬信號,它是實數,但可以選一個與它最近似的有理數:因為有理數在實數集上是稠密的。

當人腦把眼睛看到的視覺信息處理完之後,獲得了一組有理數:學過實變函數的都知道,有理數和整數實際上沒什麼區別,都是可數的

(有理數m / n可以看作是二維的整數對(m, n),按照對角線法則它可以與自然數一一對應

大腦視覺中樞處理完的這組有理數,當然可以因式分解成一組素數的乘積

現在要把這組信息通過嘴巴傳遞出去,只需要給不同的素數找到不同的讀音即可!

技術文章:論人類語言的數學本質 - 天天要聞

人的發音範圍是有限的(85-1100赫茲),聽力範圍也有限(20-20000赫茲),只要在這兩個範圍的交集上給這些常用的編碼素數找個合適的頻率就行。

為了減輕不同聲音(字母)之間的干擾,這個頻率應該是個素數

人說話的聲音強度變化不大,可以認為人的語言是調頻波,而不是調幅波。

為什麼深度學習生成的那些特徵,人們看不懂

因為電腦模型不會說話,沒法和人直接溝通[捂臉]

我覺得,現在的深度學習框架寫的有問題,不該使用計算機的double浮點數,而是該使用2個int整數(構成的有理數)來表示權值

這樣訓練後的網絡特徵,直接把分子和分母上的2個整數做因式分解,然後給它對應一個聲音頻率就行了。

只要電腦能把它從大量圖片里訓練出來的數據通過聲音讀出來,那麼人類現有科技要破解這種「語言」是很容易的。

技術文章:論人類語言的數學本質 - 天天要聞

深度學習

從本文的以上分析看來,拼音文字確實比象形文字更接近數學

求個讚賞會不會被罵[捂臉]

或許20年後本文是一篇開天闢地的論文[呲牙]

科學分類資訊推薦

孫夢如 | 中國特色數字新聞學自主知識體系建設思考——《數字新聞:理念、價值與秩序重構》新書發佈會綜述 - 天天要聞

孫夢如 | 中國特色數字新聞學自主知識體系建設思考——《數字新聞:理念、價值與秩序重構》新書發佈會綜述

作者孫夢如2024年11 月10日下午,浙江大學「數字新聞業與新聞學」論壇暨《數字新聞:理念、價值與秩序重構》新書發佈會在浙江杭州舉辦。來自清華大學、中國人民大學、復旦大學、上海交通大學、南京大學、北京師範大學、暨南大學、上海大學等高校的3
百度「AI守護官」獲2025愛迪生獎,86%識別準確率捍衛全球生物多樣性 - 天天要聞

百度「AI守護官」獲2025愛迪生獎,86%識別準確率捍衛全球生物多樣性

4月3日——被譽為「科技界奧斯卡」的愛迪生獎揭曉,百度與國際愛護動物基金會(IFAW)聯合開發的「瀕危物種AI守護官2.0」從全球數千項頂尖創新項目中脫穎而出,斬獲2025愛迪生最佳新產品獎銀獎。據了解,愛迪生獎創立於1987年,以發明家托馬斯·愛迪生命名,致力於表彰重塑行業格局、推動人類進步的突破性創新,被譽為「科...
美股暴跌,我們研究了如何用加農炮把特朗普發射到太陽上 - 天天要聞

美股暴跌,我們研究了如何用加農炮把特朗普發射到太陽上

當地時間4月3日,由於特朗普宣布美國將對所有貿易夥伴全面徵收關稅的計劃,美國股市收盤暴跌,三大股指均刷新近5年來最大單日跌幅紀錄。股災降臨,不少網友都翻出了據說是美國總統特朗普在2015年競選期間發過的一條推特:「如果有一天道瓊斯指數單日狂跌超過1000點,那當時的總統就應該被裝進加農炮里,以極快的速度被射向...
肯雅古老森林中發現新的極度瀕危鱂魚物種 - 天天要聞

肯雅古老森林中發現新的極度瀕危鱂魚物種

《Zootaxa》雜誌正式描述了一種新發現的鱂魚,Nothobranchius sylvaticus 。這種魚屬於極度瀕危物種,在 2017 年和 2018 年的實地考察中,研究人員在肯雅東南部的一片古老森林中採集了這種魚的樣本。
比鄰星的劇烈耀斑可能危及附近行星上的生命 - 天天要聞

比鄰星的劇烈耀斑可能危及附近行星上的生命

利用ALMA,天文學家發現比鄰星經常產生高能毫米波長耀斑,這可能會顯著改變或剝離其宜居帶行星的大氣層。比鄰星距離我們僅四光年多一點,是我們最近的恆星鄰居,也是一顆高度活躍的 M 矮星。藝術家對比鄰星恆星耀斑的概念圖。圖片來源:NSF/AUI
數學家破解笛卡爾四圓定理 來自380年前的幾何難題 - 天天要聞

數學家破解笛卡爾四圓定理 來自380年前的幾何難題

莫納什大學的數學家終於解決了一個可以追溯到 17 世紀的古老幾何難題,為哲學家和數學家勒內·笛卡爾最初提出的一個等式提供了新的見解。研究人員利用受物理學啟發的先進數學工具,通過找到任意數量切線圓的一般方程,擴展了笛卡爾四圓定理。左圖為 3