技術文章：論人類語言的數學本質

2022年09月27日23:53:17 科學 1399

聲音的波形

既然只能傳遞一維的信息，那麼眼睛看到的二維圖像就面臨著一個編碼問題，這就是語言。

漢語把信號發射器所在的那個人編碼為「我」，把接收器所在的人編碼為「你」，這就是象形文字。

英語把信號發射器編碼為"I"，把接收器編碼為"you"，這就是拼音文字。

（PS：英語必然是次生文明的文字，而不是主文明的文字[呲牙]因為英語的編碼方式不符合人類90%的信息依賴眼睛的特點）

這種編碼和計算機的H264編碼比起來，是非常粗糙的。

H264編碼在接收端可以完整的解碼出圖像來，而人類語言則需要聽者根據先驗信息去腦補[大笑]

H264也存在先驗信息，就是這個編碼協議本身，它是基於離散餘弦變換（DCT）的，類似於二維圖像在傅立葉級數上的展開。

傅立葉級數的不同項在數學上是線性無關的，構成一組基。

人類的文字其實也可以看作「一組基」。

漢語因為是二維文字，描述起來比較複雜，但英語的描述是很簡單的。

它有26個字母表示不同的讀音，這26個字母暫時可以認為是線性無關的。

用素數給這26個字母編號：

1，A：2，B：3，C：5，D：7，E：11，F：13，G：17。

2，H：19，I：23，J：29，K：31，L：37，M：41，N：43。

3，O：47，P：53，Q：59，R：61，S：67，T：71。

4，U：73，V：79，W：83，X：89，Y：97，Z：101。

那麼，「我」(I)這個視覺信息在數學上的編碼就是23[呲牙]

「你」(you)這個視覺信息在數學上的編碼就是97*47*73[呲牙]

因為素數是不能因式分解的，多個素數的積的因式分解在忽略了順序的情況下是唯一的，所以這個編碼實際上是唯一的。

人腦對來自眼睛的大量信息的處理結果，最終是一組線性無關的基，以及它們的係數組合。

如果人腦的底層機制也跟電腦一樣是數字信號的話，那麼這組係數就是有理數。

如果人腦的底層機制是模擬信號，它是實數，但可以選一個與它最近似的有理數：因為有理數在實數集上是稠密的。

當人腦把眼睛看到的視覺信息處理完之後，獲得了一組有理數：學過實變函數的都知道，有理數和整數實際上沒什麼區別，都是可數的。

（有理數m / n可以看作是二維的整數對(m, n)，按照對角線法則它可以與自然數一一對應）

大腦視覺中樞處理完的這組有理數，當然可以因式分解成一組素數的乘積。

現在要把這組信息通過嘴巴傳遞出去，只需要給不同的素數找到不同的讀音即可！

人的發音範圍是有限的（85-1100赫茲），聽力範圍也有限（20-20000赫茲），只要在這兩個範圍的交集上給這些常用的編碼素數找個合適的頻率就行。

為了減輕不同聲音（字母）之間的干擾，這個頻率應該是個素數。

人說話的聲音強度變化不大，可以認為人的語言是調頻波，而不是調幅波。

為什麼深度學習生成的那些特徵，人們看不懂？

因為電腦模型不會說話，沒法和人直接溝通[捂臉]

我覺得，現在的深度學習框架寫的有問題，不該使用計算機的double浮點數，而是該使用2個int整數（構成的有理數）來表示權值。

這樣訓練後的網絡特徵，直接把分子和分母上的2個整數做因式分解，然後給它對應一個聲音頻率就行了。

只要電腦能把它從大量圖片里訓練出來的數據通過聲音讀出來，那麼人類現有科技要破解這種「語言」是很容易的。

深度學習

從本文的以上分析看來，拼音文字確實比象形文字更接近數學。

求個讚賞會不會被罵[捂臉]

或許20年後本文是一篇開天闢地的論文[呲牙]

科學

湯坑鎮第一中心小學舉行「知識產權與人工智能」知識產權宣傳暨多彩科技節活動

4月3日上午，在湯坑鎮第一中心小學舉行了一場以「知識產權與人工智能」為主題的知識產權宣傳暨多彩科技節活動。全校3200 名師生共享科技盛宴。

04月05日 1878

孫夢如 | 中國特色數字新聞學自主知識體系建設思考——《數字新聞：理念、價值與秩序重構》新書發佈會綜述

作者孫夢如2024年11 月10日下午，浙江大學「數字新聞業與新聞學」論壇暨《數字新聞：理念、價值與秩序重構》新書發佈會在浙江杭州舉辦。來自清華大學、中國人民大學、復旦大學、上海交通大學、南京大學、北京師範大學、暨南大學、上海大學等高校的3

04月05日 1082

韋柳伶 | 數字新聞與新聞業的未來——評《數字新聞：理念、價值與秩序重構》

20世紀末信息技術革命改變了人們的生活方式、生產方式乃至社會形態。人工智能、大數據、雲計算等數字技術驅動各個產業進行數字化轉型，人類正在進入數字社會。作為受技術與社會條件變化影響最大的實踐形式之一，新聞的生產、流通與消費的邊界變得日益模糊。

04月05日 1483

美國專家：中國不要執迷不悟，如果繼續研發芯片，將遇到經濟危機

美國專家對中國芯片研發的看法挺火的，他們覺得中國要是繼續在這條路上硬幹下去，可能會撞上經濟危機的牆。這話聽着挺刺耳，但也不是隨便瞎說的，尤其現在中美科技較勁兒越來越厲害，美國那邊對中國的動向盯得特別緊。一、美國專家咋看中國芯片？

04月04日 1637

百度「AI守護官」獲2025愛迪生獎，86%識別準確率捍衛全球生物多樣性

4月3日——被譽為「科技界奧斯卡」的愛迪生獎揭曉，百度與國際愛護動物基金會（IFAW）聯合開發的「瀕危物種AI守護官2.0」從全球數千項頂尖創新項目中脫穎而出，斬獲2025愛迪生最佳新產品獎銀獎。據了解，愛迪生獎創立於1987年，以發明家托馬斯·愛迪生命名，致力於表彰重塑行業格局、推動人類進步的突破性創新，被譽為「科...

04月04日 5374

美股暴跌，我們研究了如何用加農炮把特朗普發射到太陽上

當地時間4月3日，由於特朗普宣布美國將對所有貿易夥伴全面徵收關稅的計劃，美國股市收盤暴跌，三大股指均刷新近5年來最大單日跌幅紀錄。股災降臨，不少網友都翻出了據說是美國總統特朗普在2015年競選期間發過的一條推特：「如果有一天道瓊斯指數單日狂跌超過1000點，那當時的總統就應該被裝進加農炮里，以極快的速度被射向...

04月04日 3803