唐世平團隊「搶政治學者飯碗」:計算機輔助預測美國大選?

2025年01月05日23:40:24 國際 1056

唐世平團隊「搶政治學者飯碗」:計算機輔助預測美國大選? - 天天要聞

計算機通過大數據搭建選民模型,提前預測特朗普勝選。(黃雨婕使用ai工具生成/圖)

57歲的唐世平不稱自己是「神人」了,儘管他領著十餘人的團隊「比較成功地」預測了幾屆大選。「我努力的動力主要是挑戰自己的智力(極限)。」他略帶自誇地說。

其實,唐世平算得上中國社會科學界最桀驁不馴的學者之一。十幾年前的訪談里,青年時代的唐世平話語「輕狂」,他自比20世紀最偉大的哲學家波普爾(karl popper),宣稱要成為「21世界最重要的社會科學家之一」。

唐世平學術生涯的大轉向始於1995至1996年的「台海危機」。那年,他從美國韋恩州立大學醫學院分子生物及遺傳學剛剛畢業不久在做博士後,帶著「學生物不能救中國」的使命感,他從自然科學轉向社會科學。

後來,從國際政治、比較政治擴展到制度經濟學、政治(學)理論及計算社會科學的唐世平,開始「用計算機科學預測美國大選」。2013年復旦大學複雜決策分析中心成立後,唐世平試圖將計算社會科學引入政治決策,這讓傳統政治學界再次看到了他的「狂」。

雖然唐世平團隊在具體搖擺州預測略有偏差,但屢次命中總統當選人又讓旁人深感好奇:他為什麼要用計算機預測大選?他們團隊是如何預測的?

「用計算社會科學搶政治學者的飯碗」

在中國社科院做研究時,唐世平思忖,國內傳統社科學界總是按資排輩,「資歷越老的教授越有話語權,這說不通」。

唐世平的學術生涯深受現代計算機之父馮·諾依曼(von neumann)、諾貝爾經濟學獎得主托馬斯·謝林(thomas schelling)等學者的影響。他認為,許多複雜的決策問題應該需要技術支持。而類似於美國蘭德智庫等以技術主導的研究在中國的智庫當時幾乎不存在。

在唐世平眼中,戰爭、衝突和威懾等問題是一種「非常規複雜戰略博弈」——這些博弈涉及多個行為體、多個行為和行為規則,行為交互作用更加多元,甚至要考慮到行為體多個方面的得失,因此權衡得失異常困難。

「因為沒有技術支持,我們很多專家只是看看新聞、拍腦子做決策,他們的論斷缺乏數據、實證和模型支持。」唐世平想要為登上世界舞台的中國做點改變。

2011年前後,他開始籌建復旦大學複雜分析決策中心。為了推演和預測「非常規複雜戰略博弈」,唐世平認準了由博弈論發展而來的「基於行為體的模擬模型(agent based modeling,簡稱abm)」。

abm是一種自下而上的行為體建模技術,用於模擬具有自主意識、特定特徵的行為體(agent)的行為和相互作用。行為體可以是政黨、政府、社會組織、個人等。其結果是複雜系統中眾多行為體相互作用所產生的「湧現式結果(emergent outcomes)」。

「abm的結果不是具體的某個數值,而是多次計算得出不同結果的概率分布。」唐世平曾解釋,在構建abm時,研究者一般會對行為體、行為、行為規則、互動規則、系統環境等先做設定,但這些設定通常都不是固定數值,而是某個區間,然後用蒙特卡羅模擬(記者註:一種用計算機生成大量隨機數據來預測結果的演算法,適用於處理不確定性問題)過程來隨機抽取。

在經過多輪模擬之後,研究人員可以通過更改這些設定來創建數量巨大的相鄰模型,然後基於驗證(validation)和校準(calibration),abm可以靠修改方程、參數調參來迅速篩選出更符合實際世界的模型。

最早,唐世平團隊嘗試用abm建模來處理「非常規複雜戰略博弈」,諸如「蘇聯撤軍後誰來主導阿富汗」等。而邁入大選預測,其實純屬「機緣巧合」。

2015年元旦,他與一位台灣學者探討政治學研究時發現,大部分選舉研究都只是解釋選舉政治。「這多沒意思啊!要不我做一個東西,乾脆讓他們都失業得了!」唐世平調侃,當時的玩笑也成了他這些年研究的動力。

此後,一發而不可收。唐世平與他的同事們開啟了國內獨樹一幟的「基於計算機模擬的選舉預測研究」。

模擬一場美國大選

「我們中心的美國選舉團隊核心成員有四五個人,美國部分由我的學生王凱主導,王中原老師也會參與一部分。主要的構想由高鳴和我們其他的數據工程師、軟體工程師實現。我們中心的項目常常是我負責提供idea,由他們來具體實施。」唐世平作為復旦複雜決策研究中心的「老闆」,為推動計算社會科學、全數據建設,不斷給中心籌集資金、提供研究方向、招兵買馬。

傳統美國大選預測依賴民調、意見領袖分析,由於2016年特朗普和希拉里競選期間,多家金牌民調翻車預測,外界基本對民調喪失了信心。作為技術弄潮兒的唐世平團隊,是如何用abm模擬美國大選的?

「首先是要收集數據,搭建選民行為體。」唐世平強調,他們搜集的數據全部是公開數據,共有五十多項,其中涵蓋從微觀的人口統計學指標、中觀的選舉周期結果,再到宏觀的美國經濟數據。

下一步構建行為體是abm模擬的核心動作。在大選預測中,一個選民即為一個行為體。

「拿美國的密歇根州來打比方。假定密歇根州有1000萬選民,我們根據性別、受教育程度、族群分布等身份標籤,用計算機生成1000萬個選民模型。」唐世平提到,考慮到計算機算力有限,他們按1:10的比例縮小計算數據,只構建100萬個密歇根選民。「基於歷史選舉投票結果,我們通過簡單的回歸分析,得出不同特徵選民的投票傾向,得到粗略的投票結果區間。」

篩選與驗證是很關鍵的。研究人員起初是無法判斷幾千萬到上億個abm選民模型中哪一個更精準的。但這不重要,通過計算機模擬選民的投票結果,再與2000年至2020年的大選歷史投票結果相對比,篩選出誤差最小的選民模型就可以。

在此期間,模型至少經過兩輪以上的數據篩選,其中會加入選舉周期、政治醜聞衝擊、候選人特徵等因素。最終剩下的模型和歷史選舉結果的誤差僅在2.5%-3%之間。

「如果一個abm選民模型能重複出歷史上的五六次選舉結果,一定不是奇蹟。」唐世平說,最後,只會剩下幾十到幾百個最終符合標準的選民模型,再放入最新公開數據,預測2024年的選舉結果。

在整個模型預測過程中,計算機的算力是技術保障。「2016年第一次預測時,我們學校的伺服器跑得太慢了,只能去外面租阿里雲計算的伺服器。」唐世平解釋,由於每個abm模型是一個預測區間,每次計算會在區間里隨機取一個數,也因此每一個abm模型只有進行成百上千次的計算,才能得出一個相對穩定的結果。

「隨著雲計算水平的普及和提高,現在我只要買足夠的伺服器,半個月就可以算完所有大選預測數據。」唐世平說,2024年美國大選的預測結果是在9月底第二季度經濟數據公布後,10月初就算完的。

最後,唐世平團隊通過abm模擬預測了2024年美國大選的八個關鍵州,他們的預測結果是特朗普贏得:密西根、俄亥俄、賓夕法尼亞、佛羅里達、威斯康星。哈里斯贏得:喬治亞、亞利桑那、北卡羅來納。

「剩下42個州通過100萬次的蒙特卡羅模擬,得到民調預測結果及選舉人團票歸屬。兩相匯總,再得出2024年美國大選整體預測結果。」唐世平說。

唐世平團隊「搶政治學者飯碗」:計算機輔助預測美國大選? - 天天要聞

abm模型預測大選的過程,forecasting elections with agent-based modeling:two live experiments論文截圖。

沒算準的搖擺州

熟悉美國大選的人不難看出端倪。在美聯社最終公布的2024年大選結果中,特朗普橫掃多個搖擺州,以312張選舉人票當選第47任總統。儘管唐世平團隊的總體結果正確,而且對五個搖擺州的預測也是正確的,但是他們對其它三個州(亞利桑那、喬治亞、北卡羅來納)的預測卻是錯誤的。

「任何預測都會有偏差。」對於搖擺州預測的失誤與外界的質疑,唐世平回答時很坦然,「好在我們的abm預測可以復盤,不像民調總有難以克服的問題」。

預測失誤的喬治亞、亞利桑那、北卡羅來納是他們團隊2024年才開始做數據統計的三個州,無論是2018年的中期選舉,還是2020年的大選都尚未涉及。

「在這三個州的數據搜集上,我們可能不夠全面、精準。」唐世平想了想說,比如9月24日至27日,北卡羅來納遭遇了颶風,之後拜登政府的賑災不力。但我們的模型在10月初就已經算完,我們沒法再將自然災害對選民的影響納入計算。

唐世平團隊的大選預測結果會給出一個相對得票率區間。「最終結果如果與預測模型相差超過±2.5%的範圍,就證明這一個模型建構不夠完善。」他說,「雖然每次預測的技術是一樣的,但abm的建模是一個不斷篩選的過程。」

用abm預測大選遠優於傳統民調。唐世平提到,民調是很難判斷特朗普遭槍擊等「黑天鵝事件」對於預測結果的影響,因為沒有一個「特朗普未遭槍擊」的對照組作比較。「但是,基於abm的技術則是可以的,因為衝擊事件的最終影響是可以累加到基礎模型給出的結果的。因此,通過比對最終的預測選舉結果和實際的選舉結果,可以大致估計這些衝擊事件的最終影響。」

「大選期間的突發事件對最終的結果的影響肯定沒有大眾心理那麼大。」唐世平和團隊發現。

「當然,如果特朗普在大選最後一刻遭遇槍擊,而我們的模型早就算完了,也是不能預測的。」

在他看來,重複性的、有特定指標的事情、穩定的國家政體走向等都是可以用abm預測的,而多黨競爭、戰爭的具體動態是難以預測的。「以戰爭為例,我們可以預測一個特定時間段內是否有戰爭爆發、如何爆發。但戰爭的走向卻比較難以預測。」唐世平說。

當南方周末記者問到「人的行為是可被量化的嗎」時,唐世平用另一種技術路徑探索解釋,「最近,魏忠鈺老師的團隊和我們一起,在嘗試用大語言模型(llm)判斷選民的投票傾向,他原來是做自然語言處理的。」魏忠鈺曾對美國國會議員的公開表態與其議案投票建模,去預測和解釋政客是否言行一致。

「abm是模擬100萬個選民。而魏老師是用大語言模型解讀選民的公開言論,基於ai來判斷其投票傾向,再推斷選民的支持方向。因此,這是兩種非常不同的技術路徑。」唐世平說,我們從來不假設每一個選民都是理性的,每一次模擬都是準確的。科學的好處就是「我們可以不斷改進模型,不斷進步」。

面對外界對用計算機模擬來預測大選的爭議,唐世平毫不在意。他只覺得「自己又做出來一個有意思的研究」,這才是三十多年來不斷改換賽道、突破新研究領域的他。

「現在做選舉預測的學者,應該都要引用我們發在plos one上的英文論文。我們是第一批將abm系統引入預測選舉的學者。」唐世平很篤定,也有些驕傲地說。

參考資料:

1.唐世平.(2023).計算社會科學與科學決策的未來.《國際政治科學》,第8卷,第3期.

2.王中原,唐世平.(2020).政治科學預測方法研究——以選舉預測為例.《政治學研究》,第2期.

3.gao,m.,wang,z.,wang,k.,liu,c.,&tang,s.(2022).forecasting elections with agent-based modeling: two live experiments.plos one,https://doi.org/10.1371/journal.pone.0270194.

南方周末記者 顧月冰

責編 姚憶江

國際分類資訊推薦

全國首例過度醫療公益訴訟案:125份病歷中113份存在過度醫療 - 天天要聞

全國首例過度醫療公益訴訟案:125份病歷中113份存在過度醫療

125份病歷中,113份病歷存在對未達到手術指征、不符合手術條件、有手術禁忌證的患者實施手術及違反診療流程實施手術等過度醫療違法行為……近日,最高人民檢察院與中國消費者協會聯合發布一批消費者權益保護公益訴訟典型案例,其中湖北省黃石市檢察院辦理的某醫院過度醫療侵
人民公安報:王玉鑫 用愛鋪就山區孩子的「求學路」 - 天天要聞

人民公安報:王玉鑫 用愛鋪就山區孩子的「求學路」

3月20日清晨,在位於西南邊陲的雲南省德宏傣族景頗族自治州盈江縣昔馬鎮保邊村,晨露沾濕了雲南出入境邊防檢查總站德宏邊境管理支隊盈江邊境管理大隊昔馬邊境派出所教導員王玉鑫的警服,他把裝滿文具的袋子遞到山區男孩小申手裡。「阿鑫叔叔,我一定要努力走出大山!」男孩堅定
未成年人自願文身,刺青館能否免責?法院:不能以未成年人「同意」而免責 - 天天要聞

未成年人自願文身,刺青館能否免責?法院:不能以未成年人「同意」而免責

未成年人自願文身,刺青館是否需要承擔責任呢?近日,四川省南充市順慶區人民法院調解了一起涉未成年人文身糾紛,對刺青館是否能以未成年人自願行為免除責任給出了答案。法院審理後認為,未成年人以其年齡、智力狀況、社會經驗等尚不能判斷文身對自己身體和人格利益帶來的損害和影
辦公場所提前解約,承租方能否要求搬家費? - 天天要聞

辦公場所提前解約,承租方能否要求搬家費?

藍天公司與白雲公司達成協議,約定白雲公司入駐由藍天公司提供的辦公場所。藍天公司交付場地後,白雲公司依約支付押金及服務費。後藍天公司與白雲公司協商終止協議,並承諾退還押金、支付搬家費。因藍天公司逾期未付上述款項,白雲公司將藍天公司訴至法院,要求藍天公司退還押金3