OpenAI 的 Sora API 泄露事件簡單回顧
昨天 OpenAI 的 Sora API 泄露的新聞沸沸揚揚,給大夥總結下:一個名為 PR Puppets 的 Hugging Face 組織發布了一個 Space,該 Space 能夠通過提示詞生成視頻,並且代碼是開源的。人們發現,這個 Space 實際上是通過調用 OpenAI 還未正式發布的 Sora 視頻生成模型的介面實現的。
隨後,該組織發布了一封公開信[5],聲稱 OpenAI 暫時關閉了 Sora 對所有藝術家的搶先體驗,並呼籲大家一起抵制 OpenAI 的霸主行為。
公開信中還展示了一些『偷跑』的視頻,具體效果你們可以自己去看判斷下。有人猜測這些可能是 Sora 的 Turbo 模型生成的,因此速度較快,但效果差點。
ShowUI: GUI 自動化 Agent
ShowUI[1] 是一個用於 GUI 自動化的視覺-語言-操作模型,類似於 Computer Use,能夠通過自然語言來控制 AI 實現點擊、輸入、選擇、滾動等操作。根據相關論文的描述,該模型實現了 75.1% 的準確率,性能提高了 1.4 倍,目前代碼已經開源。
OneDiffusion:多功能生圖模型即將發布
OneDiffusion[2] 是一個多功能生圖模型,不僅支持文生圖、ID 一致性、單圖生多視角、文生多視角,還具備雙向生成能力。例如,它可以實現類似 ControlNet 的條件生成(如深度、姿勢、布局、語義等),同時也能將圖片預處理為這些條件。官方計劃於12月初發布模型和代碼,敬請關注。
Qwen2vl-Flux 在線演示:體驗 mini 版本的強大功能
Qwen2vl-Flux[3]現在提供了一個在線演示[4],效果十分不錯,就像 IpAdapter 一樣強。作者表示,這是一個 mini 版本,用於快速出圖,完整版本的能力更強。
阿里通義開源 QwQ-32B-Preview:最強國產推理模型
QwQ-32B-Preview[6] 是阿里通義團隊最新開源的推理模型,目前仍處於預覽階段。儘管在安全和語言混用等方面存在一定的局限性,但其性能已能與 o1-mini 相媲美,尤其在數學性能上更是超越了 o1-preview。
值得一提的是,QwQ 也是為數不多的可商用推理模型之一,而且這個名字確實很可愛,不是嗎?