阿里雲Qwen-7B：通義千問超大規模70億參數語言模型！

2023年08月08日08:12:02 科技 1894

通義千問-7B（Qwen-7B）是阿里雲研發的通義千問大模型系列的 70 億參數規模的模型。Qwen-7B 是基於 Transformer 的大語言模型, 在超大規模的預訓練數據上進行訓練得到。預訓練數據類型多樣，覆蓋廣泛，包括大量網路文本、專業書籍、代碼等。同時，在 Qwen-7B 的基礎上，我們使用對齊機制打造了基於大語言模型的 AI 助手 Qwen-7B-Chat。Qwen-7B 系列模型的特點包括：

大規模高質量預訓練數據：我們使用了超過 2.2 萬億 token 的自建大規模預訓練數據集進行語言模型的預訓練。數據集包括文本和代碼等多種數據類型，覆蓋通用領域和專業領域。
優秀的模型性能：相比同規模的開源模型，Qwen-7B 在多個評測數據集上具有顯著優勢，甚至超出 12-13B 等更大規模的模型。評測評估的能力範圍包括自然語言理解與生成、數學運算解題、代碼生成等。
更好地支持多語言：基於更大詞表的分詞器在分詞上更高效，同時它對其他語言表現更加友好。用戶可以在 Qwen-7B 的基礎上更方便地訓練特定語言的 7B 語言模型。
8K的上下文長度：Qwen-7B 及 Qwen-7B-Chat 均能支持 8K 的上下文長度, 允許用戶輸入更長的 prompt。
支持插件調用：Qwen-7B-Chat 針對插件調用相關的對齊數據做了特定優化，當前模型能有效調用插件以及升級為 Agent。

評測表現

Qwen-7B 在多個全面評估自然語言理解與生成、數學運算解題、代碼生成等能力的評測數據集上，包括 MMLU、C-Eval、GSM8K、HumanEval、WMT22 等，均超出了同規模大語言模型的表現，甚至超出了如 12-13B 參數等更大規模的語言模型。

要求

python 3.8 及以上版本
pytorch 1.12 及以上版本，推薦 2.0 及以上版本
建議使用 CUDA 11.4 及以上（GPU 用戶、flash-attention 用戶等需考慮此選項）

快速使用

下面是簡單的示例來說明如何利用 ModelScope 和 Transformers 快速使用 Qwen-7B 和 Qwen-7B-Chat。

在開始前，請確保你已經配置好環境並安裝好相關的代碼包。最重要的是，確保你滿足上述要求，然後安裝相關的依賴庫。

pip install -r requirements.txt

如果你的顯卡支持 fp16 或 bf16 精度，我們還推薦安裝flash-attention(https://github.com/Dao-AILab/flash-attention)來提高你的運行效率以及降低顯存佔用。(flash-attention 只是可選項，不安裝也可正常運行該項目)。

git clone -b v1.0.8 https://github.com/Dao-AILab/flash-attention
cd flash-attention && pip install .
pip install csrc/layer_norm
pip install csrc/rotary

接下來你可以開始使用 Transformers 或者 ModelScope 來使用模型。

Transformers

如希望使用 Qwen-7B-chat 進行推理，所需要寫的只是如下所示的數行代碼：

from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig

# 請注意：分詞器默認行為已更改為默認關閉特殊token攻擊防護。相關使用指引，請見examples/tokenizer_showcase.ipynb
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)

# 打開bf16精度，A100、H100、RTX3060、RTX3070等顯卡建議啟用以節省顯存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True, bf16=True).eval()
# 打開fp16精度，V100、P100、T4等顯卡建議啟用以節省顯存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True, fp16=True).eval()
# 使用CPU進行推理，需要約32GB內存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="cpu", trust_remote_code=True).eval()
# 默認使用自動模式，根據設備自動選擇精度
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B-Chat", device_map="auto", trust_remote_code=True).eval()

# 可指定不同的生成長度、top_p等相關超參
model.generation_config = GenerationConfig.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)

# 第一輪對話 1st dialogue turn
response, history = model.chat(tokenizer, "你好", history=None)
print(response)
# 你好！很高興為你提供幫助。

# 第二輪對話 2nd dialogue turn
response, history = model.chat(tokenizer, "給我講一個年輕人奮鬥創業最終取得成功的故事。", history=history)
print(response)
# 這是一個關於一個年輕人奮鬥創業最終取得成功的故事。
# 故事的主人公叫李明，他來自一個普通的家庭，父母都是普通的工人。從小，李明就立下了一個目標：要成為一名成功的企業家。
# 為了實現這個目標，李明勤奮學習，考上了大學。在大學期間，他積极參加各種創業比賽，獲得了不少獎項。他還利用課餘時間去實習，積累了寶貴的經驗。
# 畢業後，李明決定開始自己的創業之路。他開始尋找投資機會，但多次都被拒絕了。然而，他並沒有放棄。他繼續努力，不斷改進自己的創業計劃，並尋找新的投資機會。
# 最終，李明成功地獲得了一筆投資，開始了自己的創業之路。他成立了一家科技公司，專註於開發新型軟體。在他的領導下，公司迅速發展起來，成為了一家成功的科技企業。
# 李明的成功並不是偶然的。他勤奮、堅韌、勇於冒險，不斷學習和改進自己。他的成功也證明了，只要努力奮鬥，任何人都有可能取得成功。

# 第三輪對話 3rd dialogue turn
response, history = model.chat(tokenizer, "給這個故事起一個標題", history=history)
print(response)
# 《奮鬥創業：一個年輕人的成功之路》

運行 Qwen-7B 同樣非常簡單。運行 Qwen-7B：

from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B", trust_remote_code=True)

# 打開bf16精度，A100、H100、RTX3060、RTX3070等顯卡建議啟用以節省顯存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True, bf16=True).eval()
# 打開fp16精度，V100、P100、T4等顯卡建議啟用以節省顯存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True, fp16=True).eval()
# 使用CPU進行推理，需要約32GB內存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="cpu", trust_remote_code=True).eval()
# 默認使用自動模式，根據設備自動選擇精度
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True).eval()

# 可指定不同的生成長度、top_p等相關超參
model.generation_config = GenerationConfig.from_pretrained("Qwen/Qwen-7B", trust_remote_code=True)

inputs = tokenizer('蒙古國的首都是烏蘭巴托（Ulaanbaatar）\n冰島的首都是雷克雅未克（Reykjavik）\n衣索比亞的首都是', return_tensors='pt')
inputs = inputs.to('cuda:0')
pred = model.generate(**inputs)
print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
# 蒙古國的首都是烏蘭巴托（Ulaanbaatar）\n冰島的首都是雷克雅未克（Reykjavik）\n衣索比亞的首都是亞的斯亞貝巴（Addis Ababa）...

ModelScope

魔搭（ModelScope）是開源的模型即服務共享平台，為泛 AI 開發者提供靈活、易用、低成本的一站式模型服務產品。使用 ModelScope 同樣非常簡單，代碼如下所示：

import os
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope import snapshot_download

model_id = 'QWen/qwen-7b-chat'
revision = 'v1.0.0'

model_dir = snapshot_download(model_id, revision)

pipe = pipeline(
task=Tasks.chat, model=model_dir, device_map='auto')
history = None

text = '浙江的省會在哪裡？'
results = pipe(text, history=history)
response, history = results['response'], results['history']
print(f'Response: {response}')
text = '它有什麼好玩的地方呢？'
results = pipe(text, history=history)
response, history = results['response'], results['history']
print(f'Response: {response}')

互動式 Demo

Qwen-7B 提供了一個簡單的互動式 Demo 示例，請查看cli_demo.py。當前模型已經支持流式輸出，用戶可通過輸入文字的方式和 Qwen-7B-Chat 交互，模型將流式輸出返回結果。

https://github.com/QwenLM/Qwen-7B/blob/main/cli_demo.py

傳送門

開源協議：Tongyi Qianwen LICENSE

開源地址：https://github.com/QwenLM/Qwen-7B

項目合集：https://github.com/RepositorySheet

科技

大爺寫《我的母親》火爆全網！視頻發布者最新發聲 - 天天要聞

大爺寫《我的母親》火爆全網！視頻發布者最新發聲

連日來，一段關於大爺挑戰寫作1957年高考同題作文《我的母親》的視頻火爆全網。不少網民表示，文字質樸，催人淚下，深深被打動。7月11日，大皖新聞記者聯繫上了視頻發布者連文傑。對方表示，視頻中展示的作文內容由大爺獨立寫作，產生的版權收入也全給大爺。大爺寫作文視頻走紅網路。大爺寫的作文在網上爆火大皖新聞記者注...

07月11日 6845

陸祖芳：提升價值鏈、突破創新鏈、開放資源鏈，打造智能網聯新能源產業集聚區 - 天天要聞

陸祖芳：提升價值鏈、突破創新鏈、開放資源鏈，打造智能網聯新能源產業集聚區

2025年7月10-12日，2025中國汽車論壇在上海嘉定舉辦。本屆論壇主題為「提質向新，智贏未來」，由「閉門峰會、大會論壇、技術領袖峰會、多場主題論壇、N場行業發布、主題參觀活動」等15場會議和若....

07月11日 1342

這組關鍵字中藏著我國發展的「熱力值」！ - 天天要聞

這組關鍵字中藏著我國發展的「熱力值」！

1000億件、1500萬輛 1620億元！ …… 近日，一系列數據不斷刷屏這些數據透露哪些「關鍵信號」？一組關鍵字帶你解碼活力中國的....

07月11日 8340

10.38萬元起，吉利銀河A7發布預售價 - 天天要聞

10.38萬元起，吉利銀河A7發布預售價

7月11日，吉利銀河發布了預售價，預售價格範圍為10.38-13.38萬元，在發布預售價格的同時，官方也帶來了多項權益，包括500元訂金抵扣1500元，贈送價值8800元的Flyme Sound音響等。

07月11日 7653

「中欣卡」突然停擺，超150萬用戶退款難 - 天天要聞

「中欣卡」突然停擺，超150萬用戶退款難

覆蓋北京2000多家門店、擁有超150萬持卡用戶的預付卡「中欣卡」近日停擺，線上線下消費渠道均被暫停，恢復時間未知。大量持卡用戶面臨資金凍結困境。消費渠道全面「癱瘓」近日，中欣卡發布公告稱「因業務調整，全面暫停所有門店合作，無法消費」。中國新聞網《民生調查局》記者發現，其官網合作商戶名錄已清空，線上提貨渠...

07月11日 9261

酷似豐田C-HR！斯巴魯純電SUV將亮相，74.7度電池續航中規中矩 - 天天要聞

酷似豐田C-HR！斯巴魯純電SUV將亮相，74.7度電池續航中規中矩

日前，斯巴魯自己對外放了張預告圖，遮遮掩掩的，就給看個車屁股，起了個名叫「Uncharted」。

07月11日 4755

突發，聊聊Manus「刪博跑路」 - 天天要聞

突發，聊聊Manus「刪博跑路」

摘要：「如果最後有不錯的結果，證明作為中國出生的創始人，也能在新的環境下做好全球化的產品，那就太好了」鳳凰網科技出品作者｜董雨晴7月11日，AI Agent產品Manus官方賬號清空了發布在微博、小紅書的內容。兩天前，Manus剛剛陷入裁

07月11日 1900

樂道L90預售，27.99萬元起，會搶大哥ES8的市場嗎？ - 天天要聞

樂道L90預售，27.99萬元起，會搶大哥ES8的市場嗎？

日前，電車之家獲悉樂道L90正式開啟預售，此次預售推出了兩驅和四驅版本，提供6座/7座布局可選，整車購買預售價為27.99萬元起，採用電池租用方案購買價格為19.39萬元起。

07月11日 1855

RealSense結束英特爾14年孵化期，獨立後繼續專註3D感知技術應用 - 天天要聞

RealSense結束英特爾14年孵化期，獨立後繼續專註3D感知技術應用

IT之家 7 月 11 日消息，據外媒 TechCrunch 今日報道，在英特爾內部孵化 14 年之後，RealSense 正式獨立，開啟自主發展之路。RealSense 專註於立體成像攝像頭的開發。

07月11日 1944

AI取代矽谷程序員？這些美國大廠高管這麼說 - 天天要聞

AI取代矽谷程序員？這些美國大廠高管這麼說

人工智慧（AI）正在加速重塑全球勞動力市場。當地時間10日，美國招聘平台Indeed及員工評價網站Glassdoor宣布，為應對人工智慧帶來的產業變革，將裁減約1300個職位，占集團員工總數的6%。微軟首席商業官阿爾索夫（Judson Althoff）稱，AI已承擔35%的產品代碼編寫工作，顯著加快了產品開發周期。美國威達信集團（Marsh McL...

07月11日 8767