導語
2020年,我們第一次嘗試在全球範圍內利用精細的個人數據和數據科學來幫助提升社會系統的穩健性與適應性,從而適應與新冠疫情共存的世界。數字化、智能化進程再度加速的今天,集智俱樂部聯合智源社區,邀請北京大學公共衛生學院生物統計系主任周曉華,清華大學計算機科學與技術系副教授崔鵬與北京師範大學系統科學學院教授張江,匹茲堡大學助理教授吳令飛等眾多學者進行分享,同時還有共同開因果推薦系統、圖網絡與時序數據網絡、理解複雜性、高中生專場等不同主題的分享,與大家一起面對面分享對交叉學科的最新探索及對複雜系統的最新見解。一年一度的集智學術年會,讓我們一起加入發生在數據科學與人工智能領域的因果革命,探索因果糾纏的複雜社會!
同時,我們呼喚天使投資贊助與合作,期待您與我們一起建設“沒有圍牆的研究所”!
掃描海報二維碼,即可付費報名
五場報告分享:
1.崔鵬 | 穩定學習:發掘因果推理和機器學習的共同基礎
2.周曉華 | 因果推斷在醫療中的應用
3.吳令飛 | 創新的未來: 如何在智能時代評估和加速創新
4.李睿琪 | 共享單車系統中標度律的湧現
5.李周園 | 生物多樣性與穩定性的跨尺度研究
三場分論壇:
1.因果推薦系統
2.圖網絡與時空預測
3.理解複雜性
主場分享
穩定學習:發掘因果推理和機器學習的共同基礎
近年來,隨着人工智能技術的應用研究進入了「深水區」,暴露出現有的機器學習學習方法存在許多的風險和短板。如何開發對數據變化具有穩定性和魯棒性的學習模型,對於學術研究和實際應用都是至關重要的。因果推斷是一種強有力的統計建模工具,用於解釋和穩定學習。在這次分享中,崔鵬老師着重於因果推理和穩定學習,旨在從觀察數據中探索因果知識,以提高機器學習算法的解釋性和穩定性。
個人簡介:崔鵬,清華大學副教授,研究方向包括大數據環境下的因果推理與穩定預測、網絡表徵學習,及其在金融科技、智慧醫療及社交網絡等場景中的應用。
因果推斷在醫療中的應用
自從奧巴馬啟動精準醫療計劃,精準醫療這個詞就站到了風口,備受矚目。精準醫療是一種將個人基因、環境與生活習慣差異考慮在內的疾病預防與治療的新興方法,其涉及的兩個主要因果問題是異質性的治療效果估計和個體化治療方案選擇。在這個講座里, 周曉華老師將介紹潛在結果模型和結構方程模型框架,相關數學概念和工具。並且介紹如何解決生物醫學中因果推理的一些問題,例如非依從性,死亡截斷,混淆控制,因果中介分析和缺失數據等問題。
個人簡介:周曉華,北京大學公共衛生學院生物統計系主任,研究方向是缺失數據,因果推斷分析,大數據分析,半參數模型, 醫學檢驗衛生經濟,衛生服務領域發展新的統計方法。
創新的未來: 如何在智能時代評估和加速創新
人類社會從簡單到複雜的進程中,伴隨着一系列的創新。今天,創新被視作社會發展乃至維持社會運轉的重要動力。在我們不斷感嘆“內卷”的同時,背後體現的可能是當前創新速度不足以維持社會的快速發展這一窘境。我們不禁要問,科學的發展、技術的進步和經濟的繁榮是否受到人類創新能力的限制?如果答案是肯定的,那麼又是什麼限制了人的創造力,我們有可能通過設計(Design)集體智能及機器智能來釋放它嗎? 為了獲取可以用來指導未來創新研究、政策和商業戰略的洞見,我們回顧了創新的最新研究進展,重點對知識融合導致的創新瓶頸進行了研究。
個人簡介:吳令飛,匹茲堡大學助理教授,對如何衡量科學技術的創新,發現有效的團隊機制以加速創新,設計AI工具以實現自動化創新感興趣。
共享單車系統中標度律的湧現
人類移動的基本規律在城市研究中是非常重要的研究問題,但是運輸工具與乘客之間的移動模式規律卻少有研究,這樣的問題在共享經濟時代卻非常關鍵。通過對無樁自行車共享系統記錄每次出行的詳細信息進行分析,為我們揭示隱藏在出行背後的行為模式,存在普遍的標度行為,為共享經濟下的綠色出行有積極的指導意義。
個人簡介:李睿琪,北京化工大學信息科學與技術學院副教授,城市網絡實驗室主任,主要研究方向為城市大數據分析與建模、複雜網絡研究與流行病傳播動力學。
生物多樣性與穩定性的跨尺度研究
“生物多樣性與穩定性跨尺度研究:從物種到群落”(Biodiversity and stability across scales: from species to community),本報告將從生態學中多樣性與穩定性關係的經典思辨出發,根據物種觀測數據的實證分析,討論群落穩定性的驅動因素,展示種群隨空間尺度變化的穩定化規律,分享多樣性與生態系統功能關聯機制的新理解。
個人簡介:李周園,北京林業大學講師,研究方向是遙感與地理信息學應用、土地利用和氣候變化、生物多樣性與生態系統功能。
分論壇一:
因果推薦系統專題
1.內容背景介紹
在智能時代初期,我們接觸着各種各樣的推薦系統。如果說互聯網的目標就是連接一切,那麼推薦系統的作用就是建立更加有效率的連接。本質上,推薦是信息提取的一種特殊形式,它利用過去的行為和用戶相似性來生成一系列根據最終用戶的喜好量身定製的信息。這使得推薦系統可以更有效率的連接用戶與內容和服務,從而節約了大量的時間和成本。
推薦系統的任務很多時候本質上是要回答一個因果問題,例如如果我們“強迫”用戶去看電影,評分會是多少? 目前工業界回答此問題的主要工具是 A/B 測試,考慮到其昂貴的價格和回答問題的局限性質,工業界有強烈的使用觀測數據回答因果問題的需求,使用因果推理 Debias 成為了一個非常 Promising 的方向。本次分論壇圍繞Causal debias 進行,我們將從問題出發,探索設計合適的統計指標及其估計方法評估推薦系統存在的 Bias,使用因果信息優化推薦系統中的召回和排序算法。
2.分享流程及介紹
董振華:推薦系統模型的運用及挑戰
分享主題簡介:推薦系統是人工智能和大數據商業運用中最重要的技術之一,它被廣泛應用於社交媒體、網購平台、短視頻平台、移動瀏覽器等的信息流和廣告系統中。本次分享將介紹當前推薦系統使用的主要技術模型,以及這種面向數據關聯建模的技術模型可能存在的偏執挑戰和可解釋性問題,最後,我們還將探討在因果啟發下,對上述問題的解決方案。
個人簡介:董振華,現任華為諾亞方舟實驗室技術專家,負責推薦系統、機器學習前沿技術的研究與落地,幫助華為多個產品構建推薦系統,包括:華為瀏覽器,華為應用市場,廣告系統,負一屏信息流與服務直達,金融產品推薦系統等,研究方向:推薦系統,信息檢索,因果推理,反事實學習。
鄒昊:運用混淆變量平衡實現穩定學習
分享主題簡介:現如今,機器學習技術在許多領域都取得了卓越的成績。但可解釋性、穩定性還是目前機器學習尚未充分解決的問題和困境。而這兩個問題之所以存在,是因為現有的大多數機器學習模型都以不可解釋、不穩定的關聯統計為基礎。因此,我們在機器學習中嘗試與因果科學相結合,力圖達到穩定學習的目標。本次分享將介紹以混淆變量平衡為基礎的因果效應估計,以及如何將這種思想引入到機器學習中實現穩定學習。
問題大綱:
穩定學習在推薦系統等業界有哪些應用和結合點。
穩定學習從因果分析的角度有哪些更深入的分析和解讀。
個人簡介:鄒昊,清華大學計算機科學與技術系三年級在讀博士生,導師崔鵬。研究方向為因果推理和反事實學習。
吳鵬:非參/半參統計在推薦系統中的運用
分享主題簡介:我們如要要在觀察性研究中進行因果推斷,通常的做法是將傾向性得分的倒數作為權重剔除混雜。但是當傾向性得分的值接近0或1時,最終的估計將會非常不穩定。本次分享將介紹,當允許傾向性得分的值接近0或1時,如何用最少的模型假定(半參或非參),估計出感興趣的因果參數,探討如何將這種方法應用於推薦系統與機器學習中。
問題大綱:
推薦系統的評價標準。
推薦系統中各種bias的形式化定義。
推薦系統中的因果框架。
推薦系統中如何處理由於傾向性得分的值接近0或1時導致方差過大的問題。
推薦系統中如何結合少量的隨機化試驗數據(uniform data)和大量的觀察性數據消除bias。
Rerandomization與穩定學習的聯繫。
個人簡介:吳鵬,北京大學博士後。研究方向是因果推斷、非參/半參統計 已發表論文10+篇 。
3.主題討論
1. 我們對推薦系統的期待
2. 具備因果知識和推理能力的推薦系統如何實現
分論壇二:
圖網絡與時序數據網絡專題
1.內容背景介紹
圖神經網絡已經成為深度學習領域最熱門的方向之一,在自然語言處理/計算機視覺/推薦系統等領域都得到了廣泛的應用。但是,當前圖神經網絡的研究主要針對由相同類型節點和邊構成的同質圖。然而,在現實生活中的圖數據往往是由多種類型的節點和邊構成的異質圖,因此其更符合實際工業應用的需求。如何設計異質圖神經網絡架構並在實際工業場景下進行實際應用是一個迫切需要解決的問題。本次分論壇,我們將通過時空數據挖掘、異質圖神經網絡等的模型構建和現實應用來理解社會中的結構和關係。
2.分享流程及介紹
王寰東:時空數據挖掘與用戶隱私保護
分享主題簡介:近些年隨着國家城鎮化戰略的實施,大城市、城市群飛速發展,帶來了交通、環境等一系列城市問題。究其根源,是我們對城市運轉的本質理解不夠,對其發展規律把控不足。城市大數據為我們研究其規律提供了寶貴的機會,然而當我們想用數據驅動的方法來解決城市問題的時候,卻很面臨著數據質量參差不起、多源數據天然分離等問題。針對以上問題,我們研發了一系列智能時空數據增強技術,實現了從局部數據恢復出全局數據、從低分辨率數據估計出高分辨率數據、基於多域分離數據形成跨域融合數據,實現了從小數據到城市大數據的跨越。基於這些數據,我們實現了從個體層面到群裡層面的用戶時空移動規律建模,並且研究了其中的隱私保護問題。
個人簡介:王寰東是清華大學電子工程系的博士後研究員,他分別於2014年和2015年在清華大學獲得信息與通信工程學士學位和數學與應用數學第二學士學位,並於2019年在清華大學獲得信息與通信工程博士學位。研究興趣包括城市計算、移動大數據挖掘、強化學習。
紀厚業:異質圖神經網絡及其在阿里推薦業務中的應用
分享主題簡介:圖神經網絡已經成為深度學習領域最熱門的方向之一,在自然語言處理/計算機視覺/推薦系統等領域都得到了廣泛的應用。但是,當前圖神經網絡的研究主要針對由相同類型節點和邊構成的同質圖。然而,在現實生活中的圖數據往往是由多種類型的節點和邊構成的異質圖,因此其更符合實際工業應用的需求。如何設計異質圖神經網絡架構並在實際工業場景下進行實際應用是一個迫切需要解決的問題。本報告將介紹異質圖神經網絡以及在阿里巴巴分享推薦業務中的應用。
溫浩珉:城市及末端攬配網絡智能化實踐—以攬件順序預測為例
分享主題簡介:近年來電商行業的迅速發展對物流行業提出了更高的要求。我們將介紹城市及末端攬配網絡的智能化場景,並簡要我們在攬件順序預測上的相關工作。攬件路徑預測對於理解快遞員派送行為,優化派單系統至關重要。該問題本質上是帶有嚴格時空約束的排序問題,並且不同的快遞員具有不同的決策偏好。針對以上問題,我們提出了一種深度神經網絡模型,通過建模快遞員歷史行為,來學習快遞員的決策經驗和偏好。
個人介紹:溫浩珉,北京交通大學網絡科學與智能系統研究所(INSIS)在讀博士生(博二)。主要研究方向:時空數據挖掘。目前在頂會ICDE上發表論文一篇。
林彥:上下文敏感的地點表示學習
分享主題簡介:在時空軌跡上對地點進行表示學習是一個非常重要的任務,能夠幫助多種軌跡數據挖掘任務取得更佳的性能。在現實世界中,一個地點往往承載着多種功能,在不同的上下文環境中,用戶訪問一個地點的目的不同。然而,現有的地點表示學習方法通常為每個地點學習一條靜態的嵌入向量,未考慮地點的動態多功能性特徵。針對上述問題,我們提出了一種上下文敏感的地點表示學習方法,根據目標地點具體的上下文,動態地計算其表示。如此一來,地點的多功能特徵能被更精準地融入其嵌入向量中。
個人介紹:林彥,北京交通大學INSIS博士一年級生,研究方向為時空數據挖掘和表示學習。
3.主題討論
1.圖神經網絡的問題與瓶頸。
2.圖神經網絡下一步的發展。
分論壇三:理解複雜性
宇宙、生命、意識的思考與度量
1.內容背景介紹
人活一世,見天地,見眾生,見自己。不斷的想見、看見、證見中,我們會追問同一串問題:世界為什麼會是複雜的?這複雜可以被認識嗎?人自身可以被認識嗎?
走在不同道路上的我們,為回答這些共同的問題,進入到了複雜系統研究的領地。我們跟隨系統研究的先行者,將視角從不同的研究熱點中轉移,從混沌,到耗散,到控制,到集群湧現,到冪律,到網絡,到深度學習,到因果,到圖網絡……我們的研究對象各不相同,從量子,到天氣,到經濟,到社會,到城市,到智能機器,到遊戲,到生命,到腦,到意識,到宇宙萬物……我們驚奇於系統的自發、自組、自適應,迷惑於複雜性發展的有向性、自主性,我們希望理解、度量、模擬甚至重建這套神奇的系統。
複雜性可以被認識嗎?複雜性正在被認識,被破解,被攻陷,被擠壓……這過程仍在繼續,我們是見證者,也可能是參與者。我們可以重新思考和審視,我們口口聲聲的複雜性,還是不是“科學中湧現的綜合”?大腦怎樣認識和學習複雜性,怎樣意識自身?我們是否能夠通過理解而重現這一過程?物理世界與生命世界的演生,是否共享同一套複雜化和層次形成的規則,是否能夠用同樣的方法度量?自複製的機制是什麼,主體是不是生命的起點?
這是一群“老集智”的重聚,主講的每一位,在集智社區中都有十年上下的經歷。我們驚喜地發現,這十多年中,大家各自仍然思考和探索着最初的那些問題。就如同這期間的每一次遇見都是同樣的感受:時間似乎從未流逝,我們只是轉身去打了一杯咖啡,討論又可以繼續了。
走了很遠,回首相見,仍是當初那群硬核少年。
理解複雜性,今天的你,來和我們一起玩吧~
2.分享流程及介紹
十三維:一個有關意識的閉包理論
分享主題簡介:
大腦的信息處理過程可以在多個時空尺度上進行描述和分析,然而只有粗粒度在特定尺度上的信息似乎才能為意識知覺和利用。意識的信息閉包理論認為,意識過程是在某些粗粒度上對環境形成非平凡信息閉包(NTIC)的過程,該理論不僅對對意識內容和水平都提出了新的量化定義,對各種意識現象進行了解釋和預測,還自然而然地調和了許多現有的意識理論。
十三維,某航企數據運營主管、集智俱樂部常駐作者,畢業於首都師範大學數學系,長期關注複雜系統與認知科學等跨學科研究。
苑明理:用塞倫蓋蒂遊戲探索自然數的概念形成
分享主題簡介:
在簡單回顧數制歷史和自然數的定義之後,提出了一個基於強化學習的場景,嘗試從學習的視角重新考慮自然數的概念形成。
苑明理,十餘年程序員生涯,遊走於工程、語言、知識、智能這些關鍵詞之間,內心對世界充滿很多好奇和困惑,嘗聽友人講大劉《山》的故事,也期自己可憑蠻力,鑿空厚壁,得見星空。
王東:深度學習與科學發現的邏輯
分享主題簡介:
科學發現能否自動化?僅僅依靠數據和算法能否得到新的科學發現,還是需要某些天才的靈光一現?這次分享的主題為深度學習與科學發現的邏輯,拋磚引玉,與大家一起探討科學發現自動化這個問題。
王東,科學哲學背景,關注智能與認知哲學。
袁行遠:從網絡文學邁向世界模型
分享主題簡介:
隨着自然語言處理超大規模語料的新潮流興起,神經網絡語言模型還是一個魔改版統計模型嗎?從天氣預報到小說續寫,世界運轉的深層規律會隱藏在網絡連接當中嗎?語言模擬器可以作為強化學習智能體的策略函數嗎?請欣賞2020年來自行遠的無責腦洞
袁行遠:彩雲科技CEO。
玉德俊:基於 Avida 的自複製演變規律探索
分享主題簡介:
1. 對自複製問題的簡要介紹,其研究的歷程和存在的主要問題。2. 人工生命avida平台以及基於avdia的自複製工作介紹 3. 推論和猜想。
玉德俊,石油企業高級工程師,從事天然氣與管道相關企業信息化工作,對人工智能、自複製系統研究感興趣。
王雄:主體性的起源思考 從粒子到複雜系統
分享主題簡介:
一個由客觀規律支配的世界是如何產生自由意志的?一個可能的方向是從粒子的模型到複雜系統的模型來理解宇宙構建的基礎,我將系統回顧理論物理的粒子和場的概念,並暢想一個用系統來取代粒子和場的基礎理論。
王雄,集智科學家。從事複雜性科學與量化投資研究與教學。自大學時代起,一直堅持研究自然規律的統一性與複雜性兩個科學的極致問題。
小木球:前生命主體與二級湧現概念的探索
分享主題簡介:
早期複雜性研究基於對混沌系統、耗散系統及集群系統的動力學分析,近年來集中於對網絡與控制的理解。但對於生命這類多層次複雜系統,它的層級產生過程與物理世界是否共享同一套規則?我們將從自催化與前生命主體的關係,以及二級湧現概念的討論中,重新審視複雜性研究中的湧現與層次生成問題。
小木球,腫瘤分子遺傳學博士,集智科學家,從事生物新葯研發工作。曾在集智俱樂部組織過24期《失控》讀書會,長期關注生命複雜性和生命起源問題。
傅渥成:理解複雜系統的可理解性
分享主題簡介:
愛因斯坦曾經說:「宇宙最不可理解之處,就在於它竟然是可理解的」,複雜系統也是如此。在複雜系統背後可能有簡單的微觀機制,又或者我們可以建立起關於系統的宏觀唯象理論。為什麼看似具有高自由度的複雜系統,往往可以被約簡到較低的維度上?在討論中,我將會結合統計物理(自旋玻璃)、生物進化(突變穩定性)、神經科學(神經可變性)和機器學習等領域的一些新進展,嘗試對相關問題進行回答。
傅渥成,南京大學物理系物理學博士,東京大學博士後,集智科學家,“知乎鹽 Club 2014”榮譽會員,曾出版知乎鹽系列電子書《寫在物理邊上》《臨界:智能的設計原則》,知乎一小時電子書《能量守恆》,科普書籍《宇宙從何而來》,研究方向包括統計物理及其在生命科學問題中的應用等。
3.主題討論
秩序的起源與複雜性:問題-工具-應用
研究者與集智科學社區
高中生專場
今年的高中生專場依然由高中生馮睿洋進行策劃、邀請到了幾位她的高中生小夥伴們進行分享。
高中生們分別就自己過去一年中做的小研究與自己對科研的理解和感悟,進行三到五分鐘的項目分享。
以下是分享者及大家分享的主題簡介:
蘭正陽,一個因自己受惠於社會結構性不公而心懷愧怍的北京高中生;
帶來的分享主題是“在一個註定不公平的社會前,學生們應該學會什麼?”。
李韻韻,夢想是Debug the World的心理學愛好者,科學與技術是她與世界溝通的語言;
郭宇澤,期望將科學技術與心理知識結合,於理性和感性間與世界溝通;
她們帶來的分享主題是“肢體語言對人類情緒感受的影響”。
王禹衡,加拿大高中11年級在讀,喜歡動手,熱愛科學;
分享的內容是“探究無線電力傳輸技術 — Wireless Power Transmission”。
張峰源,加拿大11年級高中生在讀;
帶來的分享主題是“軟件逆向工程”。
吳雨峻,目前就讀於人大附中ICC高三AP;
本次分享的主題是他在IMMC國際高中生數學建模比賽中的獲獎研究“電子產品零售店應對搶購的裝修和布局調整”。
劉遠心,對物理和歷史有着同樣熱愛的高中生;
帶來分享的主題是“探究玻璃和琉璃的關係”。
往期年會介紹
集智俱樂部2019學術年會
天使投資贊助和合作
我們本次年會依然以定向邀請為主,預計參與人數在200人左右;活動主題是“因果糾纏”,同時也涵蓋其他技術方面的主題,比如統計物理、深度學習、因果科學、圖網絡、人工智能等;我們的參會人員主要由研究學者、技術工程師/產品/運營、在科研中探索的碩士博士、社區內活躍的志願者代表、公司創始人或者是投資人等組成。
為了辦好這場年會,我們誠摯邀請企業踴躍贊助,我們會努力滿足您在招聘、品牌宣傳、技術探討、產學研對接等業務的需求,同時我們承諾,集智俱樂部作為一個非盈利的組織,您贊助的所有經費都將用於本次年會以及集智俱樂部的運營!
如果您有合作意願,請聯繫本次活動負責人王婷,洽談詳細合作事宜。