91久久国产精品若水,亚洲春暖花开AV无码区,国产成人无码免费一区二区三区

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

新智元報道

編輯：編輯部

【新智元導讀】AI target=_blank class=infotextkey>OpenAI開發者大會前夕，馬斯克來截胡了！xAI首個產品Grok炸裂發布，兩個月訓出330億參數大模型，以《銀河系漫游指南》為藍本，還有一股子馬斯克式幽默。

最近幾天，各家都是箭在弦上，磨刀霍霍。

OpenAI開發者大會在即，馬斯克忽然攔路狙擊，提前放出xAI的第一個產品Grok！

Grok的一大亮點，就是能從推特實時獲取信息。優質數據已成全球的稀缺資源，馬斯克去年豪擲440億美元收購推特后搞得雞飛狗跳大半年，原來是等在這兒呢。

Grok深深體現出馬斯克一直推崇的xAI公司的宗旨——一個探求「最大真理」和「宇宙本質」的AI，一個公正的AI。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

就在昨天，xAI的一位創始成員Toby Pohlen放出了Grok的UI界面——

Grok可以同時進行多任務處理，并排運行多個會話，還可以在多對話之間隨意切換。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

期間，我們可以對對話進行分支，來更好地探索Grok的回復。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

回復樹可以讓我們在各個分支之間來回切換。還有一些/commands命令可以讓我們減少點擊次數。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

我們可以在Markdown編輯器中打開Grok的回復，保存后繼續對話。它可以和分支以及分支樹協同工作。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

同時，我們也可以在VS Code編輯器中，打開所有生成的代碼片段。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

另外，跟自己的幽默人設呼應的是，點擊Grok圖標上彩蛋，就可以把Grok轉換為幽默模式了。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

對此，另一位創始人Greg Yang表示：毫無疑問，這是我用過最好的聊天用戶界面。

現在，由于候補名單的申請太過火爆，Grok的服務器直接宕機了。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

6個月前剛簽聯名信：暫停超強AI研究6個月

有趣的是，馬斯克此前也是「AI末日論」的強力擁躉，曾和Bengio、蘋果聯合創始人Steve Wozniak、Stability AI CEO、馬庫斯等人簽署了一封要求暫停發展比GPT-4更先進AI 6個月的公開信。

而眼下，AI大佬們正熱火朝天地激辯著AI監管必要性的議題，馬斯克卻已經在這當口悄悄訓練出Grok了，甚至還趕在OpenAI開發者大會前夕放出大招。

看來，大家都是心照不宣啊。

當然，馬斯克總能找到辦法自圓其說，xAI的官博這樣解釋道——

我們相信，AI智能具有巨大的潛力，可以為社會貢獻重要的科學和經濟價值，因此我們將努力制定可靠的保障措施，防止災難性的惡意使用。我們會盡最大努力，確保AI始終是一股向善的力量。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

甚至，馬斯克還放出這樣的豪言——未來特斯拉的算力，都會用于大模型的推理。即使有機器人駕駛出租車，汽車依然每周只會運行1/3時間，其余時間的算力，都會用來做SETI之類的分布式推理運算。

這樣，特斯拉將擁有地球上最多的模型推理算力！

馬斯克，果然在下一盤大棋。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

330億參數，8K上下文，Grok-1碾壓ChatGPT

僅僅四個月，Grok就經過多次迭代橫空出世。創始人團隊的效率高得驚人。

創始人之一Greg Yang感慨道：「當一小群積極進取的世界級人才朝著同一個方向前進，揮出的拳頭就遠遠超出了自身的重量。只有天空，只有宇宙，才是我們的極限！讓我們從每一瓦的電量中，讓計算得到最大優化！」

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

Grok意為「憑直覺深刻了解」，是美國科幻作家羅伯特·海因萊因在1961年出版的科幻小說《異鄉異客》中創造的詞匯。

xAI對于Grok的官方介紹是這樣的——

Grok是一個以《銀河系漫游指南》為藍本的 AI，因此幾乎可以回答任何事情，甚至還能建議我們該問什么問題。

Grok回答問題時，會不時抖個機靈，甚至比較叛逆，不喜歡幽默的人請遠離。

Grok的獨特優勢就在于，它可以通過X平臺（也即推特）實時了解世界上發生的各種事情。而且，很多AI會拒絕的敏感問題，它都不會拒絕。

現在，Grok還是一個早期的測試版產品，這已經是2個月的訓練后能達到的最好程度了。因此，xAI希望能在用戶的幫助下，讓它每周都能迅速改進。

語調陰陽怪氣，幾句一爆梗，Grok確實是有點子幽默在身上的。

哦，我親愛的人類，我有好消息要告訴你！我們的朋友Sam Bankman-Fried被認定所有罪名成立。你能相信嗎？陪審團只用了8個小時就弄清了所謂的世界上最聰明、最優秀的風險投資人多年來都無法弄清的事實：他犯下了普通的欺詐罪。這真是一次瘋狂的旅程，不是嗎？

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

2個月，訓練出Grok-1

Grok背后的核心引擎便是Grok-1。

這是用時4個月研發的大模型，并經過了多次迭代升級。

據了解，Grok訓練時間僅僅2個月。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

在宣布xAI成立之后，研究團隊最先訓練了一個330億參數的原型大模型——Grok-0。

早期模型Grok-0在標準的LM基準測試中，性能與LLaMA 2（70B）接近，但只使用了一半的訓練資源。

過去的2個月中，xAI大模型在推理和編碼方面取得了重大改進，并迭代到了Grok-1。

同樣，Grok-1是一個基于Transformer的自回歸模型，在Grok-0模型基礎上進行了微調，上下文長度為8192。

訓練數據來自互聯網（截止到2023年第三季度），以及AI導師提供的數據。

能力大幅提升的Grok-1刷新了多項SOTA，在HumanEval編碼任務中達到了63.2%，在MMLU上達到73%。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

如下是xAI研究團隊對Grok-1在衡量數學和推理能力的標準機器學習基準進行了一系列評估。

- GSM8k：中學數學單詞問題，使用思維鏈提示。

- MMLU：多學科多項選擇題，提供了5次上下文示例。

- HumanEval：Python/ target=_blank class=infotextkey>Python代碼完成任務，pass@1評估為零樣本。

- MATH：用LaTeX編寫的初中和高中數學問題，用固定的4次示例作為提示。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

在這些基準測試中，Grok-1展現出強大的能力，超越了ChatGPT-3.5、Inflection-1等模型。

實際上，只有像GPT-4這樣使用大量訓練數據和計算資源進行訓練的模型，才能超越Grok-1。

這展現了研究人員在xAI項目中以異常高效的方式，訓練LLM方面正在取得的快速進步。

另外，剛剛提到的數學基準測試，模型可能通過網絡訪問到，所以結果可能受到影響。

為了更公平地評估，研究人員手動收集了「2023年匈牙利全國高中數學期末考試」數據集，以測試Grok-1、 Claude-2和GPT-4的能力。

結果發現，Grok以C（59%）通過了考試，而 Claude-2 獲得了相同的成績C （55%），GPT-4 以 68% 的成績獲得了B。

所有模型均在溫度為0.1和相同提示下進行評估。必須指出的是，研究人員沒有為這次評估做出任何調整。

這樣，可以更好地反映模型在真實情況下的能力，評估模型在沒經過調優的新數據上的泛化能力。

如下，研究人員在模型卡中提供了Grok-1重要技術細節的摘要。

就局限性來看，Grok-1不具備獨立搜索網絡的能力。在Grok中部署時，搜索工具和數據庫增強了模型的功能和真實性。盡管可以訪問外部信息源，但模型仍會產生幻覺。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

xAI工程設計：不是Python，是Rust

在深度學習研究的前沿，可靠的基礎設施和數據集、學習算法一樣重要。

為了創建Grok，xAI構建了一個基于Kube.NETes、Rust和JAX的自定義訓練和推理堆棧。

大語言模型的訓練就像一列全速前進的貨運火車，如果一節車廂脫軌，整列火車都會被拖下軌道，很難再次糾正方向。

GPU可能失敗的方式有很多種：制造缺陷、連接松動、配置錯誤、內存芯片退化、偶爾的隨機位翻轉等等。

在訓練時，xAI連續數月在數以萬計的GPU之間同步計算，由于規模龐大，這些故障頻繁出現。

為了克服這些挑戰，他們便采用了一套定制的「分布式系統」，確保立即識別并自動處理每種類型的故障。

在xAI，研究人員把最大化每瓦特計算效率作為工作重點。

在過去的幾個月里，基礎設施使團隊最小化了停機時間，即使硬件不可靠，也能保持較高的模型計算利用率（MFU）。

當前，Rust已被證明是，構建可擴展、可靠、可維護的基礎設施的理想選擇。它提供了高性能、豐富的生態系統，并預防分布式系統中的大多數錯誤。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

對于像xAI這樣規模較小的團隊來說，基礎設施的可靠性至關重要，否則維護會影響創新。

Rust可以讓代碼修改和重構更加可靠，編寫的程序可以在少量監管下穩定運行數月。

xAI團隊表示，「我們正在為模型能力的下一次飛躍做準備，這將需要可靠地協調數以萬計的加速器上的訓練運行，需要運行互聯網規模的數據pipeline，并在Grok中構建新的功能和工具。

在這里，xAI為自己團隊招募做了一波宣傳。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

就技術要求這一欄，需要程序員們能夠具備能力包括：

Rust

因為xAI所有的后端服務和所有數據處理都是在Rust中實現的。而且團隊還是Rust語言的忠實擁護者，并相信它是高效、安全和可擴展應用程序的最佳選擇。它還提供了與Python的輕松互操作性。

JAX和XLA

xAI模型的神經網絡是在JAX中實現的，并且xAI有許多自定義XLA操作來提高它們的效率。

Triton和CUDA

為了充分利用計算資源，大規模運行大型神經網絡，同時最大限度地提高計算效率至關重要。因此，xAI定期在Triton或原始C++ CUDA中編寫定制內核。

Type, React & Angular

xAI前端代碼完全是使用React或Angular在Type中編寫的，后端通信通過gRPC-web API實現類型安全。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

對于這個招聘要求，業內人士總結道——

具有高MFU的單GPU，是高生產力的人；具有高MFU的單節點，是高效的小團隊；具有高MFU的數千個GPU集群，是高生產率的公司。

現在，擴展有用產出/人的難度，從一個人增加到100K，而xAI正在尋找的，是10倍的工程師......

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

xAI的研究方向

雖然Grok可以訪問搜索工具和實時信息，但跟所有LLM一樣，Grok仍然無法避免大模型的通病——幻覺問題。

xAI認為，解決當前系統局限性最重要的方向，就是實現可靠的推理。

在xAI看來，以下是幾個最有前途的研究方向——

通過工具輔助實現可擴展的監督

可能Grok還很難提供一致且準確的反饋，尤其是處理長代碼或復雜推理時。

這種情況下，可以讓AI通過查找不同來源的參考資料、使用外部工具驗證中間步驟、尋求人類反饋等，來協助進行可擴展的監督。

集成形式驗證，確保安全性、可靠性和接地

xAI計劃更準確、更可驗證的情況下發展AI的推理技能。這樣就能在沒有人類反饋或現實世界交互的情況下，評估系統。

采用這種方法最直接的目標，就是保證代碼的準確性，特別是在形式上驗證AI的安全性。

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

長上下文理解和檢索

一個能在特定環境中有效地發現有用知識的模型，是產生真正智能系統的核心。xAI正在致力于研究如何讓AI在需要時去發現和檢索信息。

對抗性魯棒性

許多示例表明，無論是訓練期間還是使用期間，AI系統中的漏洞都會導致它們犯嚴重的錯誤。而這些漏洞，就是深度學習模型長期存在的弱點。

xAI致力于提高LLM、獎勵模型和監控系統的魯棒性。

多模態功能

目前Grok還沒有配備視覺和聽覺功能，xAI會致力于發展它的多模態功能，實現更廣泛的應用。

參考資料：

https://x.ai

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

11人狂訓2個月，馬斯克精準狙擊OpenAI！xAI首個大模型Grok炸場，330億參數每月16刀

數獨大挑戰2018-06-03

答題星2018-06-03

全階人生考試2018-06-03

運動步數有氧達人2018-06-03

每日養生app2018-06-03

體育訓練成績評定2018-06-03