阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗 – 藍點網

 人參與 | 時間:2025-11-23 22:41:51
#人工智能 阿里云推出通義千問 Qwen2 系列模型,阿里完全開源,云開源通義千提供 0.5B~72B 之間 5 個版本,問Q文測網上海徐匯找小姐全套按摩包夜服務電vx《365-2895》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達在各項評測中表現不俗。上下試中有興趣的表現不俗開發者現在就可以通過 GitHub 等平臺獲取最新模型。查看全文:https://ourl.co/104358

阿里云今天推出了通義千問人工智能模型的藍點重大升級版本:Qwen2,該模型提供 5 個不同的阿里尺寸、上下文長度最高支持 128K tokens,云開源通義千并且在各項測試中表現不俗。問Q文測網

Qwen2 的上下試中所有尺寸版本均已同步在 GitHub、HuggingFace 和 ModelScope 上開源,表現不俗有興趣的藍點開發者可以立即獲取模型進行測試。

阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗

此次發布的阿里新版本亮點包括:

  • 能力較此前版本有較大幅度提升,在開源模型測試中名列前茅
  • 提供 5 個預訓練和指令微調模型,云開源通義千包括 Qwen2-0.5B、問Q文測網上海徐匯找小姐全套按摩包夜服務電vx《365-2895》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B
  • 在編程領域和數學方面的能力顯著提高
  • 增加上下文長度,現在最高支持 128K tokens
  • 在中文和英語的基礎上,增加 27 種語言相關的數據進行訓練

阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗

在 Qwen1.5 系列模型中只有 32B 和 110B 版使用 GQA,而在 Qwen2 中所有模型都使用 Qwen2,使用 GQA 后有助于提升推理能力和降低顯存的占用。

同時諸如 Qwen2-0.5B 和 1.5B 版可以在性能更低的設備上運行,例如在智能手機本地運行 Qwen2-0.5B 而不需要云端處理,這種也是未來的趨勢,未來可能所有智能設備都會支持 AI,這就需要更小的模型為本地運行提供支持。

模型評估顯示 Qwen2 能力超過 Llama3:

目前人工智能開源 / 開放社區中最重要的兩個貢獻者就是 Meta 和阿里云,Meta 主要就是 Llama 系列模型最新版本為 Llama3。

在開源 / 開放模型能力評測中,Qwen2-72B 版在各方面超過 Llama3-70B,也超過了 Mixtral-8x22B,所以現在壓力給到了 Meta,不知道 Meta 什么時候發布新版本。

阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗

阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗

阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗

阿里云 AI 團隊表示:

大規模預訓練后,我們對模型進行精細的微調,以提升其智能水平,讓其表現更接近人類。這個過程進一步提升了代碼、數學、推理、指令遵循、多語言理解等能力。此外,模型學會對齊人類價值觀,它也隨之變得更加對人類有幫助、誠實以及安全。我們的微調過程遵循的原則是使訓練盡可能規模化的同時并且盡可能減少人工標注。我們探索了如何采用多種自動方法以獲取高質量、可靠、有創造力的指令和偏好數據,其中包括針對數學的拒絕采樣、針對代碼和指令遵循的代碼執行反饋、針對創意寫作的回譯、針對角色扮演的 scalable oversight、等等。在訓練方面,我們結合了有監督微調、反饋模型訓練以及在線 DPO 等方法。我們還采用了在線模型合并的方法減少對齊稅。這些做法都大幅提升了模型的基礎能力以及模型的智能水平。


限時活動推薦:軟購618多款正版軟件2折購、QQ超會15月108元、B站大會員88元、騰訊視頻128元、愛奇藝138元。

頂: 67331踩: 2