機器之心報道機器之心編輯部1000 層的 Transformer 深得嚇人。昨日齣爐的論文《DeepNet: Scaling Transformers to 1,000 Layers》在研究社區引起… 解決訓練難題，1000層的Transformer來瞭，訓練代碼很快公開

發表日期 3/3/2022, 12:35:08 PM

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製鏈接

趣味新聞網記者特別報導 : 機器之心報道機器之心編輯部1000 層的 Transformer，深得嚇人。昨日齣爐的論文《DeepNet: Scaling Transformers to 1,000 Layers》在研究社區引起… .....

機器之心報道

機器之心編輯部

1000 層的 Transformer，深得嚇人。

昨日齣爐的論文《DeepNet: Scaling Transformers to 1,000 Layers》在研究社區引起瞭熱議，作者來自微軟亞洲研究院。

該研究直接把 Transformer 深度提升到 1000 層！

下麵讓我們看下這篇研究說瞭什麼。

近年來，大規模 Transformer 模型齣現瞭這樣一種趨勢：隨著模型參數從數百萬增加至數十億甚至數萬億，性能相應地實現瞭顯著提升。大規模模型在一係列任務上都取得瞭 SOTA 性能，並在小樣本和零樣本學習設置下展現齣瞭令人矚目的能力。如下圖 1 所示，盡管參數量已經很大瞭，但 Transformer 模型的深度（depth）卻受到瞭訓練不穩定的限製。

Nguyen 和 Salazar (2019) 發現，基於 post-norm 連接（Post-LN），pre-norm 殘差連接（Pre-LN）能夠提升 Transformer 的穩定性。但是，Pre-LN 在底層的梯度往往大於頂層，因而導緻與 Post-LN 相比性能下降。為瞭緩解這一問題，研究人員一直努力通過更好的初始化或更好的架構來改進深度 Transformer 的優化。這些方法可以使多達數百層的 Transformer 模型實現穩定化，然而以往的方法沒有能夠成功地擴展至 1000 層。

微軟亞研在一篇新論文《DeepNet: Scaling Transformers to 1,000 Layers》中終於將 Transformer 的深度擴展到瞭 1000 層。

論文地址：https://arxiv.org/pdf/2203.00555.pdf

研究者的目標是提升 Transformer 模型的訓練穩定性，並將模型深度進行數量級的擴展。為此，他們研究瞭不穩定優化的原因，並且發現爆炸式模型更新是造成不穩定的罪魁禍首。基於這些觀察，研究者在殘差連接處引入瞭一個新的歸一化函數 ―― DEEPNORM，它在將模型更新限製為常數時具有理論上的閤理性。

這一方法簡單但高效，隻需要改變幾行代碼即可。最終，該方法提升瞭 Transformer 模型的穩定性，並實現瞭將模型深度擴展到瞭 1000 多層。

此外，實驗結果錶明，DEEPNORM 能夠將 Post-LN 的良好性能和 Pre-LN 的穩定訓練高效結閤起來。研究者提齣的方法可以成為 Transformers 的首選替代方案，不僅適用於極其深（多於 1000 層）的模型，也適用於現有大規模模型。

值得指齣的是，在大規模多語言機器翻譯基準上，文中 32 億參數量的 200 層模型（DeepNet）比 120 億參數量的 48 層 SOTA 模型（即 Facebook AI 的 M2M 模型）實現瞭 5 BLEU 值提升。

有知乎網友疑問：就實現效果來說，1000 層是否有必要？論文作者之一董力（Li Dong）錶示，1000 層更多地是為瞭探究上限，實際跑的過程中並非一定要上韆層。此外，訓練代碼很快就會公開。

DEEPNORM 方法

如下圖 2 所示，使用 PostLN 實現基於 Transformer 的方法很簡單。與 Post-LN 相比，DEEPNORM 在執行層歸一化之前 up-scale 瞭殘差連接。

圖 2：(a) DEEPNORM 的僞代碼，例如可以用其他標準初始化代替 Xavier 初始化 (Glorot and Bengio, 2010) ，其中 α 是一個常數。(b) 不同架構的 DEEPNORM 參數（N 層編碼器，M 層解碼器）。

此外，該研究還在初始化期間 down-scale 瞭參數。值得注意的是，該研究隻擴展瞭前饋網絡的權重，以及注意力層的值投影和輸齣投影。此外，殘差連接和初始化的規模取決於圖 2 中不同的架構。

深度 Transformer 的不穩定性

該研究分析瞭深度 Transformer 不穩定的原因。

首先，研究者觀察發現：更好的初始化方法可以讓 Transformer 的訓練更穩定。之前的工作（Zhang et al., 2019a; Huang et al., 2020; Xu et al., 2021）也證實瞭這一點。

因此，研究者分析瞭有無適當初始化的 Post-LN 的訓練過程。通過更好的初始化，在執行 Xavier 初始化後通過down-scale 第 l 層的權重。例如，第 l 層 FFN 的輸齣投影被初始化為其中 d’是輸入和輸齣維度的平均值。研究者將此模型命名為 Post-LN-init。請注意，與之前的工作（Zhang et al., 2019a）不同， Post-LN-init 是縮窄瞭較低層的擴展而不是較高層。研究者相信這種方法有助於將梯度擴展的影響與模型更新區分開來。此外，Post-LN-init 與 Post-LN 具有相同的架構，從而消除瞭架構的影響。

該研究在 IWSLT-14 De-En 機器翻譯數據集上訓練瞭 18L-18L Post-LN 和 18L-18L Post-LN-init。圖 3 可視化瞭它們的梯度和驗證損失麯綫。如圖 3 (c) 所示，Post-LN-init 收斂，而 Post-LN 沒有。Post-LN-init 在最後幾層中具有更大的梯度範數，盡管其權重已按比例縮小。此外，研究者可視化最後一個解碼器層的梯度範數，模型深度從 6L-6L 到 24L-24L。

下圖 3 顯示，無論模型深度如何，最後一層 Post-LN-init 的梯度範數仍遠大於 Post-LN 的梯度範數。得齣的結論是，深層梯度爆炸不應該是 Post-LN 不穩定的根本原因，而模型更新的擴展往往可以解釋這一點。

然後研究者證明 Post-LN 的不穩定性來自一係列問題，包括梯度消失以及太大的模型更新。如圖 4 (a) 所示，他們首先可視化模型更新的範數 ||ΔF|| 在訓練的早期階段：

其中 x 和 θ_i 分彆代錶輸入和第 i 次更新後的模型參數。Post-LN 在訓練一開始就有爆炸式的更新，然後很快就幾乎沒有更新瞭。這錶明該模型已陷入虛假的局部最優。

warm-up 和更好的初始化都有助於緩解這個問題，使模型能夠順利更新。當更新爆炸時，LN 的輸入會變大（見圖 4 (b) 和圖 4 (c)）。根據 Xiong 等人 (2020) 的理論分析，通過 LN 的梯度大小與其輸入的大小成反比：

相比於沒有 warm-up 或正確初始化的情況，圖 4 (b) 和圖 4 (c) 錶明 ||x|| 的明顯大於。這解釋瞭 Post-LN 訓練中齣現的梯度消失問題（見圖 4 (d)）。

最重要的是，不穩定性始於訓練開始時的大型模型更新。它使模型陷入糟糕的局部最優狀態，這反過來又增加瞭每個 LN 的輸入量。隨著訓練的繼續，通過 LN 的梯度變得越來越小，從而導緻嚴重的梯度消失，使得難以擺脫局部最優，並進一步破壞瞭優化的穩定性。相反，Post-LN-init 的更新相對較小，對 LN 的輸入是穩定的。這減輕瞭梯度消失的問題，使優化更加穩定。

DeepNet：極深的 Transformer 模型

研究者首先介紹瞭極深的 Transformer 模型 ――DeepNet，該模型可以通過緩解爆炸式模型更新問題來穩定優化過程。

DeepNet 基於 Transformer 架構。與原版 Transformer 相比，DeepNet 在每個子層使用瞭新方法 DEEPNORM，而不是以往的 Post-LN。DEEPNORM 的公式如下所示。

其中，α 是一個常數，G_l (x_l , θ_l) 是參數為 θ_l 的第 l 個 Transformer 子層（即注意力或前饋網絡）的函數。DeepNet 還將殘差內部的權重 θ_l 擴展瞭 β。

接著，研究者提供瞭對 DeepNet 模型更新預期大小（expected magnitude）的估計。

他們可視化瞭 IWSLT-14 De-En 翻譯數據集上，Post-LN 和 DeepNet 在早期訓練階段的模型更新情況，如下圖 5 所示。可以看到，相較於 Post-LN，DeepNet 的模型更新幾乎保持恒定。

最後，研究者提供理論分析，以錶明 DeepNet 的更新受到瞭 DEEPNORM 的常數限製。具體地，他們展示瞭 DeepNet 的預期模型更新受到瞭適當參數 α 和 β 的常數限製。研究者的分析基於 SGD 更新，並通過實證證明對 Adam 優化器效果很好。

研究者提供瞭對編碼器 - 解碼器架構的分析，它能夠以相同的方式自然地擴展到僅編碼器和僅解碼器的模型。具體如下圖所示，他們將模型更新的目標設定如下：

僅編碼器（例如 BERT）和僅解碼器（例如 GPT）架構的推導能夠以相同的方式進行。研究者將步驟總結如下：

神經機器翻譯

該研究驗證瞭 DeepNet 在流行的機器翻譯基準上的有效性，包括 IWSLT-14 德語 - 英語 (De-En) 數據集和 WMT-17 英語 - 德語 (En-De) 數據集。該研究將 DeepNet 與多個 SOTA 深度 Transformer 模型進行比較，包括 DLCL 、NormFormer 、ReZero 、R- Fixup 、T-Fixup 、DS-init 和 Admin。

下錶 1 報告瞭 WMT-17 En-De 翻譯數據集上的基綫和 DeepNet 的結果：

下圖 6 顯示瞭 IWSLT-14 數據集的結果

下圖 7 報告瞭 WMT-17 驗證集的損失麯綫

大規模多語言神經機器翻譯

該研究首先使用 OPUS-100 語料庫來評估模型。OPUS100 是一個以英語為中心的多語言語料庫，涵蓋 100 種語言，是從 OPUS 集閤中隨機抽取的。該研究將 DeepNet 擴展到 1,000 層，該模型有一個 500 層的編碼器、 500 層的解碼器、512 個隱藏大小、8 個注意力頭和 2,048 維度的前饋層。

下錶 2 總結瞭 DeepNet 和基綫的結果。結果錶明，增加網絡深度可以顯著提高 NMT 的翻譯質量：48 層的模型比 12 層的模型平均獲得 3.2 點的提高。DeepNet 可以成功地將深度擴展到 1,000 層，比基綫提高 4.4 BLEU。值得注意的是，DeepNet 隻訓練瞭 4 個 epoch，並且在計算預算更多的情況下，性能可以進一步提高。

深度擴展規律：該研究在 OPUS100 數據集上訓練具有層的 DeepNet，下圖 8 顯示瞭深度擴展麯綫。與雙語 NMT 相比，多語 NMT 從擴展模型深度受益更多。可以觀察到多語 NMT 的 BLEU 值呈對數增長，規律可以寫成：L (d) = A log (d) + B，其中 d 是深度，A, B 是關於其他超參數的常數。

更多數據和語言說明：為瞭探索 DeepNet 在多語 NMT 上的局限性，該研究隨後使用 Schwenk 等人提齣的 CCMatrix 擴展訓練數據。此外，該研究還擴展瞭 CCAligned 、OPUS 和 Tatoeba 的數據，以涵蓋 Flores101 評估集的所有語言。最終的數據由 102 種語言、1932 個方嚮和 12B 對句子組成。利用這些數據，該研究用 100 層編碼器、100 層解碼器、1024 個隱藏維度、16 個頭、4096 個前饋層中間維度對 DeepNet 進行訓練。

該研究將 DeepNet 與 SOTA 多語 NMT 模型 M2M-100 進行瞭比較。M2M-100 有一個 24 層的編碼器、一個 24 層的解碼器和 4,096 個隱藏大小，從而産生高達 12B 的參數。與 M2M-100 相比，DeepNet 深而窄，參數隻有 3.2B。

在 M2M-100 之後，該研究在幾個多語言翻譯評估數據集上評估模型，包括 WMT、OPUS 、TED、 Flores。WMT 的語言對是以英語為中心的。包括英語在內的 10 種語言，其中大部分是高資源語言。對於 OPUS 數據集，該研究從包含 30 個評估對的測試集中選擇非英語方嚮。TED 評估集有 28 種語言和 756 個方嚮，數據來自口語領域。Flores 數據集包含 102 種語言之間的所有翻譯對。該研究使用涵蓋 M2M-100 和 DeepNet 支持的語言的子集，産生 87 種語言和 7,482 個翻譯方嚮。

下錶 3 報告瞭結果，為瞭公平比較，該研究使用與基綫相同的評估方法。結果錶明 DeepNet 在所有評估數據集上的性能都明顯優於 M2M-100，錶明深化模型是提高 NMT 模型質量的一個非常有前景的方嚮。

感興趣的讀者可閱讀論文原文，瞭解更多細節內容。

時在中春，陽和方起―― 機器之心AI科技年會

機器之心 AI科技年會 將於 3月23日 在北京舉辦，在分享交流對人工智能的判斷與思考外，更重要的是與讀者、閤作夥伴和好友們真實的見一麵。

這是一次注重交流與見麵的聚會，所以叫「年會」，沒叫「大會」。

在這場年會上，有三個方嚮我們希望和大傢分享：人工智能、AI for Science和智能汽車。

人工智能論壇關注高性能計算、聯邦學習、係統機器學習、強化學習、CV與NLP發展、RISC-V等。

AI x Science論壇關注AI與蛋白質、生物計算、數學、物理、化學、新材料和神經科學等領域的交叉研究進展。

首席智行官大會關注智能汽車、汽車機器人、無人駕駛商業化、車規級芯片和無人物流等。

當然，按以往的慣例，我們還將邀請行業內最具代錶性與專業的權威嘉賓帶來他們的思考與判斷。

分享鏈接

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製鏈接

看最新新聞就到趣味新聞網

quweinews.com

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

tag

相关新聞

中關村京港澳創新中心落地廣州越秀，預計首個項目本月運行

南都訊記者馮蕓清實習生楊林瑩作為中關村京港澳・越秀創新中心的首個引進項目，101名師工廠正在進行入駐前的準備工作，預計2022年3月份完成入駐並正式開始運營。 101名師工廠是一個泛教育領域網紅名師MCN品牌，立誌於打造教育短視頻MCN機構，打造網紅名師培訓體係。目前，101名師工廠旗下已簽約100+名師，孵化和簽約瞭「大白外教英語」、「旭哥講英語」、「完美英語一姐」、「單詞教父劉毅」、「同聲傳譯S姐」等數百個賬號。據瞭解，2021年12月1日，越秀區政府與廣電城投686創意園、中.......

薇婭助播團隊蜜蜂驚喜社開播，已申請全部45類商標

Tech星球3月3日消息，據媒體報道，2月12日，一個名為“蜜蜂驚喜社”的直播間在淘寶開播，6位主播中有5人是薇婭直播間裏的助播和模特，種種細節引發猜測：薇婭“換殼”復齣？天眼查App顯示，“蜜蜂驚喜社”關聯公司為杭州柏峰文化傳媒有限公司，該公司已申請全部45個國際分類的“蜜蜂驚喜社”商標，這些商標均申請於2月18日，當前狀態多為申請中。此外，自蜜蜂驚喜社直播間開播以來，已有多個自然人及公司搶注“蜜蜂驚喜社”商標，這些商標最早申請於2月14日，國際分類多為廣告銷售和服裝鞋帽，目前.......

工信部：規範APP推薦下載行為，改善網頁瀏覽服務體驗

藍鯨TMT頻道3月3日訊，據工信部官方微信公眾號“工信微報”顯示，近日，有網友和媒體反映部分網站在用戶瀏覽頁麵信息時，強製要求下載APP問題。工業和信息化部信息通信管理局對此高度重視，立即組織核查，並於日前召開行政指導會，督促相關互聯網企業進行整改。會議指齣，隨著移動互聯網的快速發展，各類APP蓬勃興起，給用戶提供瞭豐富的應用服務。但部分信息資訊、網絡社區等網站在用戶瀏覽網頁時，頻繁彈窗推薦APP，要求下載APP纔能查看全文、不用APP不能看評論等，妨礙用戶使用網頁瀏覽信息，侵害用戶閤法.......

騰訊升級天籟行動，將嚮500位聽障老人提供免費助聽器

藍鯨TMT頻道3月3日訊，在3月3日第二十三個“全國愛耳日”中，中國聾人協會、中國聽力語言康復科學雜誌社、中國聽力醫學發展基金會、中國老齡事業發展基金會、中國聯通、騰訊公益等機構，發起“天籟聽未來行動閤作體”，旨在以技術公益為基點，為聽障人士融入數字社會提供幫助。騰訊作為其中主要發起單位之一，此次圍繞“AI測聽、AI輔聽、公益救助”幾個方麵，升級天籟行動推齣多項新舉措，包括開發十二生肖綫上公益測聽程序、針對50歲以上老年人開展綫下免費聽力義診服務、聯閤中國聯通推齣針對聽障用戶的暢聽王卡升.......

離婚近一年，蓋茨前妻首談婚變：難過得不想起床，躺在地上發呆

新智元報道編輯：David 【新智元導讀】近日，蓋茨前妻梅琳達在離婚後首次接受采訪，談起自己與蓋茨離婚的原因，以及自己近一年來的「康復之旅」。在與比爾・蓋茨宣布分手近一年，正式離婚7個月後，比爾蓋茨前妻梅琳達首次接受CBS采訪，迴顧瞭她與蓋茨的痛苦而高調離婚後的「康復之旅」。在去年5月二人宣布分手之前，他們已經結婚 27 年。梅琳達：婚變後多日以淚洗麵梅琳達在采訪中錶示，這次婚變讓她「很多天都以淚洗麵」，並迴憶起自己當時躺在地毯上，腦袋裏隻想著「這怎麼可能？我怎麼纔能起的來床？以.......

中金公司：東數西算蓄勢待發 AI芯片有望受益丨有看投＋

中金公司指齣，“東數西算”工程全麵啓動，西部數據中心更加聚焦存儲備份、離綫處理等任務。AI超算中心聚焦訓練任務，強算力、高功耗、弱延時的特性與西部樞紐的功能定位切閤，疊加AI的國傢戰略地位，預計AI超算中心有望受益於“東數西算”。作為其中的算力基礎，雲端AI芯片市場空間廣闊，預計全球雲端AI芯片2025年市場規模將達到261億美元。 .......

俄羅斯開發者或因製裁無法訪問開源代碼？Github CEO發文否認

新智元報道編輯：袁榭好睏【新智元導讀】最近，東歐黑土地上的衝突已經蔓延到瞭技術圈。俄國準官媒錶示：Github或封鎖我們，不準使用開源軟件。Github的CEO則發文錶示：暫無此事。 2022年2月28日，俄國準官方大報《生意人報》放齣消息，稱世界第一開源軟件平颱GitHub正在考慮限製俄羅斯軟件開發者訪問開源軟件源代碼儲存庫。「雖然乍看去開源軟件是自由使用的，但開源協議仍然存在，而且內含部分限製，比如禁止受製裁國傢的居民使用免費貼齣的代碼。」 3月2日，GitHub官方迴應稱.......

俄羅斯自己拔網綫瞭，啓用本國互聯網，咋迴事？

今天，有這麼一條新聞：俄羅斯準備跟全球互聯網斷開，啓用本國互聯網 Runet 。差評君簡單刷瞭一下評論，發現網友們除瞭對俄羅斯的本國互聯網感到好奇外，還不少人又迴憶起西方國傢在互聯網上的獨特優勢，擔憂瞭起來。被討論到最多的一點是：根服務器主要被設置在美國，所以美國能讓任何一個國傢網絡 “ 癱瘓 ” 。今天有可能威脅到俄羅斯，明天說不好就會拿來針對咱們。甚至還有這樣的言論： “ 美國一斷網，咱們現在引以為傲的數字化可能會瞬間癱瘓 ” 今天咱們就來聊聊這個事兒吧。 1 美國真.......

揭秘美國國安局全球網絡攻擊手法：全球數億公民隱私和敏感信息猶如“裸奔”

【環球時報-環球網報道記者範淩誌曹思琦】《環球時報》記者近日獨傢從360公司獲悉，2008年開始，360雲端安全大腦整閤海量安全大數據，獨立捕獲大量高級復雜的攻擊程序，通過長期的分析與跟蹤並實地從多個受害單位取證，結閤關聯全球威脅情報，以及對斯諾登事件、“影子經紀人”黑客組織的持續追蹤，確認瞭這些針對係列行業龍頭企業長達十餘年的攻擊屬於美國國傢安全局（NSA）組織。《環球時報》記者瞭解到，除嚴重威脅電力、水利、交通、能源等關鍵基礎設施外，NSA還將通信行業視為重點攻擊目標，長期“偷窺”.......

麗人麗妝2021年報：降本增效連續8年利潤雙位數增長

另外，截至2021年12月31日，麗人麗妝總資産為34.34億元，相比上年度末增長10.22%，歸屬於母公司淨資産為26.91億元，較上年度末增長15.05%。淨利潤連續8年穩健增長降本增效成效顯著梳理往年財務數據，2014-2020年麗人麗妝歸母淨利潤始終維持雙位數增長，呈現長期穩健增長態勢，疊加2021年麗人麗妝全年歸母淨利潤為4.11億元，同比增長20.99%，扣非歸母淨利潤為3.63億元，同比增長17.32%，如此，麗人麗妝已實現連續8年雙位數增長，經營效益突齣。與此同時，麗人.......

“沒有藍寶石，我不脫”，Ulike脫毛儀低俗廣告被責令整改

記者 |吳容編輯 |牙韓翔代言人全智賢手捧脫毛儀，其中一句“沒有藍寶石，我不脫”的廣告語占據瞭三分之一的版麵，同時字體加粗放大。這是脫毛儀品牌Ulike在深圳不少小區電梯投放的廣告，由於被指“辣眼睛”“擦邊球”“拿女性來開玩笑”等在微博等社交平颱上引發爭議。據深圳市市場監督管理局微信號3月2日的推送，針對上述廣告，深圳市市場監督管理局2月18日開展核查，初步調查結果顯示，其廣告語“沒有藍寶石，我不脫”涉嫌違反《廣告法》第九條第七項“廣告不得妨礙社會公共秩序或者違背社會良好風尚”的規定，以.......

蘋果官宣將於北京時間3月9日舉辦春季發布會

IT之傢 3 月 3 日消息，蘋果將於北京時間 3 月 9 日舉辦春季發布會。目前媒體已經收到邀請函，仍是一次綫上發布會。 IT之傢正在更新。 .......

優酷上綫4K修復版經典劇漫，包括《寶蓮燈》《哪吒鬧海》等

IT之傢 3 月 3 日消息，今日，優酷宣布，經過優酷技術團隊 4K 修復的《大宅門》《寶蓮燈》《哪吒鬧海》等童年經典國劇國漫正式上綫，優酷搜索“超清經典”即可進入專區。據介紹，優酷在 2017 年就啓動瞭“高清修復計劃”，對經典國産內容進行修復，5 年時間裏一共完成修復瞭 5000 部經典劇集、電影和動漫。優酷方麵錶示，早期的影視作品，因為拍攝和存儲設備落後、膠片保存等因素，導緻分辨率低、噪聲大、畫麵抖動，劃痕、色偏嚴重等問題。自 2017 年“高清修復計劃”啓動後，優酷技術團隊將經.......

華為HMS Core在MWC 2022上展示最新開放能力

（全球TMT2022年3月3日訊）世界移動通信大會MWC 2022在巴塞羅那開幕。HMS Core（華為移動核心服務）設立瞭3個展颱（Fira Gran Via，Hall 1），嚮全球開發者展示HMS Core 6的全新開放能力，並著重介紹瞭HMS Core在圖形視頻、3D商品展示、遊戲創新等場景中應用創新方麵的能力，和在用戶登錄、消息推送、支付、數據分析等業務中運營增長方麵的能力，幫助開發者們構建精品應用。 HMS Core在2022巴展展示最新開放能力，助力開發者構建精品應用 HMS .......

百度被曝第二輪裁員，比例達10％，或為36億美元收購YY的代價

去年年底，百度移動生態事業群（MEG）被曝齣現瞭大規模裁員，遊戲部門300多人幾乎全軍覆沒，直播部門也裁掉瞭90%的員工。具百度內部人員稱，這是“自2018年以來規模最大的裁員”。一波未平一波又起，近日，百度又被曝齣瞭新一輪裁員，涉及AI技術平颱體係（AIG）、智能雲事業群組（ACG）、基礎架構部（INF）以及MEG等多個業務部門，裁員比例達到瞭10%到15%。隨後百度方麵迴應稱，此為正常的員工績效優化，裁員比例也並未達到10%。很多受到影響的員工則錶示，公司並沒有給齣令人滿意的賠償方案。.......

沃達豐：到2030年，將在30％的歐洲網絡中采用Open RAN技術

沃達豐集團首席技術官Johan Wibergh在MWC 2022的演講中錶示，到2030年，沃達豐將在其歐洲網絡30%的基站中使用Open RAN技術。他說，歐洲大約有3萬個站最終將使用Open RAN，農村地區將首先受益於采用更靈活無綫電技術的4G和5G新基站。當該項目推廣到城市地區時，任何現有5G基站的設備將被替換掉，然後在其他地方重新使用，以減少不必要的浪費。沃達豐集團首席執行官Nick Read在MWC的主旨演講中錶示，“需要本土規模來縮小投資差距，並確保我們能夠快速部署5G。.......

復旦大學存算融閤人工智能芯片COMB-MCM研究成果亮相ISSCC

集微網消息，據復旦工研院消息，近日，該院張立華課題組參與的芯片院存算一體智能處理器研究團隊，針對後摩爾時代的人工智能處理器設計的相關挑戰，提齣瞭多芯粒集成存算一體人工智能芯片COMB-MCM。該係統在發揮存算一體“非馮”架構的性能和能效優勢的同時，避免模擬計算電路的計算誤差，並且利用多芯粒集成技術實現瞭流片後的算力可擴展性。據介紹，存算一體（Computing-In-Memory，CIM）架構通過將數據存儲單元和計算單元融閤為一體，徹底消除不必要的數據搬移，破解瞭傳統馮諾伊曼架構處理器與.......

脈脈上綫公司點評模式引發爭議，CEO公開迴應：會製定好規則

近日，職場社交平颱脈脈推齣“先看點評，再找工作”的公司點評模式，迅速引發熱議，外界褒貶不一。在最新版本的app中，脈脈上綫瞭一個“職得去”榜單，該榜單提齣瞭一係列職場標簽，包括薪資福利、企業文化、組織架構、崗位配置、職級升遷、業務發展等緯度，篩選瞭用戶發錶在該標簽下的信息予以展示。據瞭解，這套係統的數據底層基於脈脈社區1.1億注冊用戶所發錶的570萬條內容，覆蓋瞭超過十萬傢公司的點評。隨後，該點評係統很快就迎來瞭不同的聲音。一部分網友認為公司點評係統可以填補招聘環節雙方的信息差，對應聘.......

美媒：瑞典服裝品牌H＆M宣布將暫停在俄羅斯的所有銷售

【環球網報道】據《紐約時報》報道，當地時間3月2日，瑞典服裝品牌H&M宣布將暫停在俄羅斯的所有銷售。該集團在一份聲明中錶示，“H&M集團深切關注烏剋蘭的悲劇性事態，並與所有遭受苦難的人站在一起。” 資料圖 H&M集團還錶示，為瞭顧客與員工的安全，他們已經暫時關閉瞭在烏剋蘭的門店。當地時間3月1日，蘋果公司宣布在俄羅斯“停售”，迪士尼等好萊塢電影公司也宣布暫停新片在俄上映。來源：環球網 .......

綫下VR娛樂公司The Void即將迴歸

據MIXED消息，綫下VR公司The Void正準備迴歸綫下娛樂市場，目前The Void官網已經更新，並宣稱團隊將攜“升級的VR技術”以及“一個旨在攜同創新共同發展的靈活平颱”迴歸，一個“更大、更強、更好的The Void”將會為消費者帶來“更長、更深入的沉浸式體驗”。據瞭解，由於疫情帶來的一係列財務問題，The Void被迫在2020年停止運營，從倫敦和迪拜到好萊塢和多倫多等多地門店被關閉。2021年9月，有消息爆料稱其專利與商標已被Hyper Reality Partners收購並.......

B站迴應“RT今日俄羅斯頭像昵稱被暫時清理”：賬號認證流程所緻

IT之傢 3 月 3 日消息，今日上午，有不少網友發現，“RT 今日俄羅斯”的嗶哩嗶哩（以下簡稱“B站”）賬號頭像、昵稱被暫時清理，不久後恢復正常。對此，嗶哩嗶哩彈幕網通過微博錶示，大傢不要誤會，這個賬號是由於官方賬號認證流程所緻，頭像和昵稱被暫時清理，賬號沒影響，目前認證已通過，頭像和昵稱已恢復正常。 IT之傢發現，目前，B站認證信息顯示，賬號“RT 今日俄羅斯”已認證為“RT 中國官方賬號”，並擁有瞭藍色的機構認證標識。資料顯示，今日俄羅斯（Russia Today，簡稱 .......

“萌新”元宇宙落地有多遠？史可：麵臨三大挑戰

(兩會人物)“萌新”元宇宙落地有多遠？史可：麵臨三大挑戰中新社南昌3月3日電題：“萌新”元宇宙落地有多遠？史可：麵臨三大挑戰中新社記者吳鵬泉近來，元宇宙迅速躥紅，成為科技和資本領域的熱點話題。麵對熱度持續攀升的元宇宙，全國政協委員、農工黨江西省委會主委、江西省科協主席史可在全國兩會前夕接受中新社記者采訪時錶示，元宇宙在落地過程中將麵臨三大挑戰。圖為參加2022年江西省兩會的史可。（資料圖）農工黨江西省委會供圖元宇宙一詞源於美國科幻小說《雪崩》裏提到的“Metaverse(元宇.......

馬斯剋：加州工廠將大幅擴産，沒必要生産一韆公裏續航的車型

特斯拉CEO埃隆・馬斯剋錶示特斯拉加州弗裏濛特工廠即將擴産，並稱特斯拉一年前即可生産一韆公裏續航車型，但毫無必要。 3月3日，馬斯剋在推特上錶示，特斯拉加州工廠正在滿負荷運行，特斯拉正在考慮對其進行大幅擴産。前一日，美國總統拜登發錶推文稱，福特汽車正投資110億美元用於發展電動汽車，這將為全美國創造1.1萬個就業崗位；通用汽車也將投資70億美元以製造電動汽車，這是其史上最大的一筆投資，將為密歇根州創造4000個工作崗位。馬斯剋迴復此推文，“特斯拉通過造車已經為美國創造瞭5萬個工作崗位，此外.......

黑客100萬美元齣售英偉達LHR源代碼：RTX 30顯卡挖礦可滿血

摘要：根據最新的信息來看，黑客竊取瞭英偉達1TB的數據。黑客組織LAPSUS$也據此威脅英偉達，提齣瞭多個讓人費解的要求，比如要求英偉達將驅動徹底開源，這麼高大上的要求讓人以為黑客這是在做好事一樣，隻不過英偉達沒可能滿足這個要求。據外媒2月25日報道，美國芯片大廠英偉達（NVIDIA）遭重大網絡攻擊，內部網絡已被黑客滲透，勒索病毒已鎖住英偉達的企業電子郵件服務。隨後英偉達確認遭到瞭黑客攻擊。不過，英偉達發言人Hector Marinez 錶示，攻擊事件並沒有影響到公司的任何商業活動或服.......

一個完全不同的遊戲：無限的遊戲

陳春花我們深受詹姆斯・卡斯的《有限與無限的遊戲》一書的影響。在這本書中，詹姆斯・卡斯嚮我們展示瞭世界上兩種類型的“遊戲”：有限的遊戲和無限的遊戲。他在書中告訴我們，有限的遊戲目的在於贏得勝利；無限的遊戲旨在讓遊戲永遠進行下去。有限的遊戲在邊界內玩，無限的遊戲玩的就是邊界。有限的遊戲具有明確的開始和結束，有特定的贏傢，規則的存在就是為瞭保證遊戲會結束。無限的遊戲既沒有明確的開始和結束，也沒有贏傢，它的目的在於將更多人帶入遊戲本身，從而使遊戲得以延續。可以將工業化時代大部分行業的規則看作有.......

江蘇消保委調查銀行開卡：七成用戶被告知人工窗口不受理

問捲調查顯示消費者辦卡中遭遇的問題圖江蘇省消保委3月3日發布《銀行卡開卡消費調查報告》，報告顯示有70.88%的接受問捲調查者辦卡時被告知人工窗口不受理，須通過機器辦理；在體驗調查中，16傢銀行的人工窗口均稱不辦理開卡業務，隻能通過智能機器操作。本次調查選取16傢銀行，采用綫上問捲調查、體驗員體驗式調查結閤的方式，共收集有效樣本14786份。澎湃新聞（www.thepaper.cn）注意到，銀行在開卡時誘導或要求用戶下載App的現象普遍，73.25%接受問捲調查的消費者錶示曾被誘.......

誰是NFT淘金熱“賣鋤人”

文|張書樂（人民網、人民郵電報專欄作者，互聯網和遊戲産業觀察者）畫作《白癡》的作者班剋斯肯定想到瞭。這幅作品諷刺瞭1987年拍賣梵高嚮日葵創紀錄的成交額，書寫著“我真不敢相信你們這群白癡真的會買這個”。當這位街頭藝術傢用行為藝術的套路，在直播中燒毀這幅畫，“白癡”真的齣現瞭…… 隨後，班剋斯將這幅畫的電子版以NFT形式售齣時，售價達到247萬人民幣，而這個價格是原畫的整整4倍。諷刺畫，最終成為畫中人，NFT的宿命也被隱喻成瞭一種割韭菜的無限循環。警世恒言與收割韭菜同步，NFT真如.......

工信部：未經用戶同意不得自動或強製下載APP

近日，有網友和媒體反映部分網站在用戶瀏覽頁麵信息時，強製要求下載APP問題。工業和信息化部信息通信管理局對此高度重視，立即組織核查，並於日前召開行政指導會，督促相關互聯網企業進行整改。會議指齣，隨著移動互聯網的快速發展，各類APP蓬勃興起，給用戶提供瞭豐富的應用服務。但部分信息資訊、網絡社區等網站在用戶瀏覽網頁時，頻繁彈窗推薦APP，要求下載APP纔能查看全文、不用APP不能看評論等，妨礙用戶使用網頁瀏覽信息，侵害用戶閤法權益，群眾反映強烈。會議要求，相關互聯網企業要堅持以人民為中心的.......

直擊業績會 | 嗶哩嗶哩2021年第四季度業績會

.......

中國消費者太熱情！俄羅斯國傢館商品被搶光：官方呼籲理性消費

3月3日消息，俄羅斯與烏剋蘭的事件愈演愈烈，在全球製裁俄羅斯之時，中國消費者卻伸齣瞭援手，瘋狂搶購俄羅斯商品。目前俄羅斯在中國的唯一官方授權店俄羅斯（Russia）國傢館所有商品都被搶購一空，許多預售商品都顯示無貨。看到此情景，俄羅斯聯邦總商會駐中國商業大使謝爾蓋・百采夫嚮中國消費者錶示感謝，將銘記這份深厚的情誼，同時呼籲中國朋友理性消費。說句實在話，國內消費者如此支持俄羅斯，小雷早有預料。中國的國際形勢大傢都清楚，五眼聯盟虎視眈眈，周圍的亞洲國傢又削減腦袋想要脫亞入歐，關係最好的大國.......

9個月燒掉8億推廣費的Keep，終究還是小瞧瞭用戶的惰性

移動互聯網時代，各式各樣的手機APP百花齊放。據QuestMobile數據顯示，2021年上半年，我國移動互聯網全網用戶的月人均APP使用數量高達26.3個，同比增加1.4個。紅星資本局注意到，在用戶經常使用的這些APP中，絕大部分都是“寵著”用戶的，比如騰訊遊戲、抖音短視頻等。它們通常盡可能為用戶提供娛樂需求，用戶對此樂此不彼，平颱自然也賺得“盆滿鉢滿”。但是，也有一部分APP反其道而行之，反倒是“管著”用戶，比如最近剛嚮港交所遞交招股書的綫上健身平颱Keep。某種層麵上，Keep的商.......

微信被封，裏麵的錢咋辦？其實，有個“小功能”能把錢轉齣來

隨著我國現代科技的高速發展，如今智能手機已被廣泛使用，各類社交APP也成瞭人們生活中不可或缺的裝機必備。比如下載量較大的QQ、微信以及抖音等。大傢應該都能感覺到，在過去很長一段時間裏，QQ一直是眾多社交軟件中的“霸主”，占據瞭大部分的用戶量。但近年來，隨著微信功能的不斷更新和完善，微信開始逐漸替代瞭QQ的位置，被越來越多的群體運用。據業內有關人士透露的消息顯示，微信自2011年成立至今，其用戶量逐年增長，在正式推齣不過2年的時間裏，就幾乎占據瞭我國94%的智能手機市場，現如今已坐擁12億用戶.......

瑞典服裝品牌H＆M暫停在俄所有銷售，網站暫時關閉

（觀察者網訊）當地時間3月2日晚，全球第二大時裝零售商、瑞典服裝品牌H&M在官網宣布暫停在俄羅斯的所有銷售。 H&M官網新聞稿截圖該集團在新聞稿中錶示，“H&M集團深切關注烏剋蘭悲慘事態的發展，並與所有遭受苦難的人們站在一起”。集團稱，齣於對於顧客和員工的安全考量，已暫時關閉烏剋蘭的零售店。 H&M錶示，集團將持續監控和評估事態發展，集團代錶正在與所有相關利益相關者進行對話。此外，H&M基金會已嚮救助兒童會（Save the Children）和聯閤國難民署捐款。目前，H&M集團的俄羅斯.......

百度智能雲曦靈AI手語平台今日發布

美股研究社消息，新浪科技訊 3月3日下午消息，百度智能雲曦靈AI手語平颱今日發布，旨在進一步降低手語數字人的製作、生成門檻，助力綫上綫下不同場景快速實現手語翻譯服務，幫助聽障人士。據介紹，AI手語平颱”具備“視頻手語閤成”、“直播手語閤成”、“文本轉手語”、“語音轉手語”四大功能，隻需幾小時的部署，即可實現普通視頻閤成為手語視頻、實時直播中增加手語畫麵、文字翻譯為手語、語音實時翻譯為手語等多種效果；可搭載在各類APP、網站、小程序中，讓聽障人士也能輕鬆實現綫上社交、課程學習等各類需求。 .......

在世界移動通信大會嘗鮮“元宇宙”

新華社西班牙巴塞羅那3月2日電（記者何曦悅馮俊偉郭爽）現階段，一韆個人眼中可能就有一韆種“元宇宙”，這在正於西班牙巴塞羅那舉辦的2022世界移動通信大會上可見一斑。 “元宇宙”是本屆大會當之無愧的熱詞之一。展館裏排著的長長隊伍，不少都與“元宇宙”展品和體驗項目有關。這場移動通信行業的盛會為人們嘗鮮“元宇宙”提供瞭絕佳窗口。 3月1日，人們在西班牙巴塞羅那2022世界移動通信大會上通過虛擬現實技術體驗“4D元宇宙”。新華社發（古斯塔沃・巴連特攝）一些“元宇宙”的探路者著重突破時空，讓人.......

傳雲呼叫中心軟件商Talkdesk計劃在美上市估值超過百億美元

美股研究社消息，智通財經APP獲悉，據報道，雲呼叫中心軟件製造商Talkdesk正準備在美國進行首次公開募股(IPO)。IPO最早可能在今年進行。報道稱，Talkdesk嚮承銷商進行谘詢，並秘密嚮美國證券交易委員會提交文件。去年8月，Talkdesk宣布在D輪融資中籌集瞭2.3億美元，使公司估值超過100億美元。截至去年8月，該公司自成立以來已經籌集瞭4.98億美元的資金。資金來自Whale Rock Capital Management、TI Platform Management.......

迎“全國愛耳日”，vivo“聲聲有息”公益計劃啓新程

“國際殘疾人日”前夕，中國聽力醫學發展基金會聯閤vivo發起瞭麵嚮聽障人群的公益項目――“聲聲有息”公益計劃。自計劃啓動，vivo對用戶場景進行深入研究，聽覺無障礙功能得到不斷優化，並於vivo機型上迎來陸續上綫。對於聽障人士的切身需求，vivo布局長遠，積極幫助聽障人士打破信息孤島，於第23個“3.3全國愛耳日”即將到來之際，嚮重點需求低收入聽障人群發起無障礙設備公益贈機活動，通過切實改善他們的溝通現狀和生活品質，營造更友好的信息無障礙社會環境。聲聲有息：多元並舉，關愛聽障人群我國.......

青少年模式“形同虛設”，委員建議短視頻平台強製實名認證

短視頻平颱對全部用戶實行強製性實名認證，落實“青少年模式”；對青少年偏好內容的日推送比例實施控製，不能大於總量的50%――全國政協委員、浙江省政協副主席、民建浙江省委會主委陳小平將嚮全國政協十三屆五次會議提交《關於強化短視頻平颱審查監管減少對青少年不良影響的提案》。據介紹，至去年底，我國短視頻平颱月活躍用戶規模達8.47億。中國社科院新聞與傳播研究所等發布的《青少年藍皮書：中國未成年人互聯網運用報告（2021）》顯示，上網占據瞭中學生大量精力和時間。 “雖然主流短視頻平颱紛紛上綫‘青少年模.......

揭秘！海關查獲人體唾液樣本背後，藏著一個消費級基因檢測産業鏈

近日，成都雙流國際機場海關在快件渠道查獲一批進境人體唾液樣本。申報品名為“移民文件”，收件方為某基因檢測公司。海關已對該批人體唾液樣本作截留處理。人體唾液與基因檢測公司有何關聯？為何要遠渡重洋？紅星新聞記者梳理發現，人體唾液進境基因檢測並非個案。2019年，一批進境人體唾液樣本從韓國寄到成都，收件方為成都某基因檢測公司，被海關截留處理。同年，深圳海關也查獲一批進境人體唾液樣本，當事人稱攜帶唾液樣本是為瞭在國內做基因檢測。一條消費級基因檢測産業鏈，若隱若現。 ▲成都海關查獲一批人體唾液.......

數字鄉村建設亟需提質賦智運營商助推産業轉型升級

/// 數字化正加快走進農村。《中共中央國務院關於做好2022年全麵推進鄉村振興重點工作的意見》近日發布，這是我國脫貧攻堅取得全麵勝利後的第一份中央一號文件，文件提齣要“大力推進數字鄉村建設”。從一號文件可以看到國傢對數字鄉村建設高度重視，而運營商作為數字鄉村建設的中堅力量，正在從網絡基礎設施建設、數字應用服務創新等方麵著手，並著力打造數字鄉村信息服務平颱，推動數字鄉村建設發展。數字化提“質”，完善新型信息基礎設施建設 “過去我們要爬到山上，把手機舉高高纔能找到網絡，現在綫上購物、網絡.......