日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

我最近有時候我覺得很累,過去我很少出現信息過載的狀況,我認為我每天讀的東西基本都能給消化掉,但最近我經常覺得信息過載,而所有的信息過載都是來自ChatGPT。通過這樣的信息過載,但這個過程其實也是一個讓人既興奮又焦慮的這樣的一個過程。ChatGPT的出現震驚了世界。尤其是最近兩個月,人機交互的機器人帶給大家的一個非常大的變化。

一個屬于人工智能的大時代突然就來了

首先,這是人工智能與人機交互基點臨近的以此突破。上次人工智能對大家的顛覆和影響,還是2016年的AlphaGo。它在韓國擊敗了李世石,之后又打敗了柯潔。但之后幾年,關于人工智能到底能夠多么像人類、人工智能能夠替我們做什么之類的爭論就慢慢平息下來。因為像下圍棋這些事都不足以真正撼動我們作為一個人與機器在大部分場景之下的交互方式。

但是我們每個人都在說話,我們中很多人每天都在生成文字,甚至很多人賴以為生。所以我們看到ChatGTP和類似于 Midjourney 這樣的東西在過去幾個月展現出的能力。基于自然語義的人工智能的這種能力的涌現之后,人們會直觀感受到這種能力的驚艷。

這對于人的挑戰是非常深遠的,讓我們非常有壓迫感。我覺得這個其實是人類文明發展到今天,我們非常意想不到的這樣一個時刻就突然來了。

然后他是我們自然語言達模型的普及應用一個開端,以及神經網絡處理 natural language processing(NLP)的一個最高的水準。

過去這么多年我們做過很多事情,然后很多公司都在搞各種各樣的大模型,包括NLP用于其他的很多領域,比如自動駕駛、客服機器人等。它們做了很多的事情,但從來沒有一個像ChatGPT這樣的東西。它其實是神經網絡的處理的一個最高的水準,每一個獨立的個體都可以用,它是一個非常有意思的開端。

在GPT 4它發布之后,只同時配套發布了一篇論文。當時我覺得天哪,怎么回事?這樣一個成果難道就只值一篇論文嗎?還是你自己隱藏了很多東西?

后來一想的確到了這個階段,論文研究不是最重要的,工程是最重要的。

什么是工程?就是你用多少條的芯片、多少算力,多少臺服務器,用怎樣的這種基于約束的調優和這種調參的模式,早期建模怎么去做?一次次的反復的嘗試,這種不斷去做調優調參這樣的一個過程。

它是一個工程學的實踐,它不是靠我們做了多少基礎研發的突破,它是不斷的試出來,所以所以這個事特別有意思。就工程實踐這件事情,第一個靠錢,第二個靠意志力,第三個靠團隊,也就是靠人。

有人形容這個事像是煉丹,你喂的那些藥草就像語料,火爐的熔爐就是建模模型。加火的過程就是訓練指令集調參調優的過程。這中間不斷嘗試的一個過程,非常的像煉丹。

我覺得寫Prompt這事像念咒,我不太會煉丹,但我現在正在學會去念咒。煉丹的過程,其實上是人工智能工程實現的一個奇跡。

這也是工業革命以來人類生產力最強大的一個效率革命。過去經常說人類已經經歷了四次產業革命。第一次是蒸汽機,第二次是電力,第三次是計算機革命,第四次當前年代的智能革命。

但我認為18世紀末開啟的蒸汽機革命一直到20世紀中期開啟的信息革命是一個階段。而智能革命其實是一個新的階段。大語言模型的廣泛應用,讓人們意識到人們的經驗、智力、智能在很多時候可能也是不夠用的,可能也是需要一個更強大的東西與人去配合去工作。

我們去想效率革命這個事情,它極大的提升了我們的效率,也能夠激發我們在創造力方面的能力。他會創造一些新的工作機會,或者讓人們去重新地認識自己的社會價值和商業價值。

最近我們公司要搞一個prompt day活動。讓所有人去分成兩個組,圖片組和文字組,可能會請幾個人命題,讓團隊來參與生成內容。我們現在內部有很多團隊都開始接觸 AI內容生成。比如視頻團隊,他們現在也開始用 Midjourney 畫畫了。然后要聞團隊也開始用這個東西寫一些微博的推廣文案,寫一些快速的要聞。商務團隊,市場團隊現在已經在用它去寫一些文案,跟客戶進行溝通了。當然做深度報道和深度內容的團隊,暫時這個東西還替代不了。

我們搞這個東西,不是要嚇唬大家,我們要讓大家知道這個事能夠提高多少效率,激發我們多干多少事情。能夠探索我們作為個體能提升多少生產力,我覺得這是非常有意義的事情。我認為她的確是重新定義職業腦力勞動和體力勞動之間的關系。

中國為什么需要自己的 ChatGPT公司?

為什么中國需要自己的大語言模型產品。文心一言已經發布了,阿里達摩院也帶來了通義千問,接下來幾周還會有很多類似的產品推出。中國為什么需要自己的 ChatGPT公司,他們不做行不行?不做會不會死?

我覺得這個事情其實也是我近期思考比較多的東西。

首先我認為自然語言大模型的本質是基于語言的文化話語權。大家都知道這個世界上尤其是互聯網上的主要內容,90%以上的內容是英文內容,中文內容只占其中非常少一個比例。

這就意味著無論是 OpenAI 的GPT也好,谷歌的Bard 也好,還是其他的大語言模型也好。都是基于英文以及自己特定預料語料構建起來的一個模型。建模的過程既是選擇語料、調優和調參的過程,也是他們在這個過程當中形成一個自然語言模型的價值觀的過程。

它是基于語言的文化話語權,這也意味著基于英語語言的文化霸權,有可能會通過人工智能和人機交互機器人的方式得到進一步的強化。

所以全球自然語義處理框架不僅需要中文語義基礎和中國語料,也需要中國價值體系與中國解決方案。

前不久其實我接受過一個調研,問我們怎么能夠把大語言模型做好。當時我說首先要在語料庫上下功夫,我們要訓練好的優質的高質量的中文語料。

其次,我認為應該形成一個更互動的產學研結合的方式。公司有動力去做模型,而高校有研究人才和研發資源,然后政府有集中這樣的資源,為這個事情把握方向的這樣一個能力。

最后就是說我們要訓練好的中文語料,我們也要訓練英文語料,把英文語料通過我們的模型調優調參訓練成輸出的方式,成為帶有我們的價值體系和解決方案的東西。

再一個,我認為大語言模型背后是芯片軟件和云計算構成的系統。中國是世界上除了美國幾乎唯一有能力獨立開發的國家。當然要承認,我們算力可能不如人家,系統能力不如人家,投的錢不如人家多。

但從另外一個維度來看,這個世界上有沒有第三個國家的科研機構、企業能夠跳出來講我們來做自己的大模型?沒有,是不喜歡嗎?其實就是因為這個東西不是所有的國家都有能力去做的。

芯片我們現在肯定是不是最強的,我們肯定是相對落后的,而且現在隨著一些這種不合理的制裁,就這個領域我們可能還要再繼續的落后下去一段時間。但是云計算這個領域中國的實力是擺在這里的,我們既然有能力去做,有能力哪怕是世界上的老二,我們就沒有理由不去做這件事情。

我認為自然語言大模型的圣杯之戰是中美科技實力競爭的一個重要的維度。我認為人文社會科學就是文化觀念的輸出,它的載體是語言,到最后本身就是語言的符號化和數學化,其實也是會讓它走向桂冠的這樣一個過程,這個東西其實我們現在形成的就是一種自然語言的這種模型的研究。這個也是基于前面這個點上非常重要的一個維度。

最后一個,是我們文化安全、數據安全、國家安全發展安全的重要保障。主要是所謂的安全發展。

自然語言大模型激發的數據再生產將創造前所未有的數據價值。我們中國過去這么多年積累下來的各個產業的垂直產業的數據,沉浸在各個行業的公司服務器和數據中心。那么這些數據有的是死的數據,但也有很多活的數據,它是可以拿出來被再研究和被用來人機交互和人機溝通的數據。

其次就是就是基于垂直產業的人工智能的發展邏輯與通用人工智能的化學反應。我前不久寫過一篇文章,叫《是誰拖了中國ChatGTP的后腿》,我把責任主要扣到了中國的VC的身上。我為什么這么講?如果我們回到2016年那個時間節點,中國和美國在這種人工智能的基礎的一些東西上面其實水平差距沒有那么大的。但當時的一些做大語言模型的初創團隊基本都拿不到很多的投資。

這個文章出來之后很多投資人都表示反對,說這個東西是投多少錢都見不了底,但這些人現在也都去投這個東西。

我想講一個基本的邏輯,通過我們做煉丹的過程產生這種人機交互和對話生成的結果,其實是可以支持更多小模型和小場景發展垂直的人工智能產業發展模型。我們現在會用到很多的小模型,和機器人產生對話,但這些對話目前還是太小了。

但如果我們去想,他是基于大的模型的語料分析、調參最后形成的人機交互的成果,它是不是有可能真的能夠幫你解決更具體、更切實,更能夠幫助你的一些問題。

國內最近有兩個趨勢,第一個就是類似于像文心一言,包括像阿里達摩院這樣的機構,他們這樣的巨頭公司及其下屬機構在推出自然語言大模型的測試。此外,他們也正在積極的在去做一些基于產業、基于垂直領域結合的一些東西。其他比如科大訊飛也好,京東也好,他們也在試圖基于打的一些平臺上的數據去做一些更大的模型,實現一些更具體的場景。

這點我們有自信,中國人在做原生產品上可能不是最強的,但是我們落到產業、落到場景上可能會產生一個更好的成果。

那么這個東西既然這么重要,它會反向激發中國在半導體、云計算操作系統等自主關鍵領域的創新。如果我們這種自然語言大模型起來了,其實它會反向的去激發很多在半導體領域,在云計算領域,在操作系統里的這種進化和升級,對我們基礎的這種架構的數據相應是一個非常有意義的事情。

最后我特別想講的一個點,它將推動更廣泛意義上的數字平等,而不是更廣泛的不平等。大語言模型給了很多人機會,他比你學編程要容易,他給了很多的機會讓人們去創造更好的東西。當所有人的當一個事情彌合了人們更多的知識差異和技能差異的時候,其他會推動更廣泛意義上的數字平等,而不是制造更不平等。

最后還想多說一句話的話,就是說還是想給中國的LLM領域和產業鼓一把勁,這個領域能夠誕生出很多的新的機會,如果我們把它當做是下一次工業革命去看待的話,它可能意味著更多的東西。

【來源:品玩】

分享到:
標簽:模型 人工智能 語料 中國 東西 自然語言 語言 自己的
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定