久久久久久久Av麻豆果冻,女仆色成人网电影在线观看,久久亚洲欧美国产

近幾個月，幾乎每個行業(yè)的小伙伴都了解到了ChatGPT的可怕能力。你知道么，ChatGPT之所以如此厲害，是因為它用到了幾萬張NVIDA Tesla A100顯卡做AI推理和圖形計算。

本文就簡單分享下GPU的相關(guān)內(nèi)容，歡迎閱讀。

GPU是什么？

GPU的英文全稱Graphics Processing Unit，圖形處理單元。

說直白一點： GPU是一款專門的圖形處理芯片，做圖形渲染、數(shù)值分析、金融分析、密碼破解，以及其他數(shù)學計算與幾何運算的。GPU可以在PC、工作站、游戲主機、手機、平板等多種智能終端設(shè)備上運行。

GPU和顯卡的關(guān)系，就像是CPU和主板的關(guān)系。前者是顯卡的心臟，后者是主板的心臟。有些小伙伴會把GPU和顯卡當成一個東西，其實還有些差別的，顯卡不僅包括GPU，還有一些顯存、VRM穩(wěn)壓模塊、MRAM芯片、總線、風扇、外圍設(shè)備接口等等。

GPU和CPU誰最強呢？

這個其實不好說，好點的GPU內(nèi)部的晶體管數(shù)量可以超過CPU，CPU的強項是做邏輯運算，GPU的強項是做數(shù)學運算和圖形渲染。這就ChatGPT用大量高性能顯卡做AI推理的原因。

接下來，我們做個簡單的對比。

CPU和GPU都是運算的處理器，在架構(gòu)組成上都包括3個部分：運算單元ALU、控制單元Control和緩存單元Cache。

但是，三者的組成比例卻相差很大。

在CPU中緩存單元大概占50%，控制單元25%，運算單元25%；

在GPU中緩存單元大概占5%，控制單元5%，運算單元90%。

結(jié)構(gòu)組成上的巨大差異說明：CPU的運算能力更加均衡，但是不適合做大量的運算；GPU更適合做大量運算。

這倒不是說GPU更牛X，實際上GPU更像是一大群工廠流水線上的工人，適合做大量的簡單運算，很復雜的搞不了。但是簡單的事情做得非常快，比CPU要快得多。

相比GPU，CPU更像是技術(shù)專家，可以做復雜的運算，比如邏輯運算、響應(yīng)用戶請求、網(wǎng)絡(luò)通信等。但是因為ALU占比較少、內(nèi)核少，所以適合做相對少量的復雜運算。

在CPU里面，大概50%是緩存單元，并且是四級緩存結(jié)構(gòu)；而在GPU中，緩存是一級或者二級的。

CPU性能更加注重線程的性能，在控制部分做的事情較多，這樣做就是為了確保控制指令不能中斷，在浮點計算上功耗少。

相較于CPU，GPU的結(jié)構(gòu)更為簡單，基本上它也只做單精度或雙精度浮點運算。GPU的運算速度更快，吞吐量也更高。

CPU基本上是實時響應(yīng)，采用多級緩存來保障多個任務(wù)的響應(yīng)速度。

GPU往往采用的是批處理的機制，即：任務(wù)先排好隊，挨個處理。

GPU對于圖形處理

這還是高清的情況下，如果是1090*1080、2K、4K甚至8K的視頻渲染，可想而知，這個計算量是何其巨大。尤其是在像游戲這樣的實時渲染場景下，顯然僅僅依靠CPU渲染是會超時的。

實際上，在屏幕中顯示的三維物體都要經(jīng)過多重的坐標變換，并且物體的表面會受到環(huán)境中各種光線的影響，呈現(xiàn)不同的顏色和陰影。這就包括了光線的漫射、折射、透射、散射等。

接下來，我們以英偉達NVIDIA RTX3090 為例，看下GPU是如何進行渲染的。

RTX3090的流式多處理器有10496個，每個內(nèi)核都有具備整數(shù)運算和浮點運算的部分，還有用于在操作數(shù)中排隊和收集結(jié)果的部分。

所謂流式多處理器可以認為是一個獨立的任務(wù)處理單元，也可以認為一顆GPU包含了10496個CPU同時處理各個圖片處理任務(wù)。

如下圖所示，在GPU中會劃分為多個流式處理區(qū)，每個處理區(qū)包含數(shù)百個內(nèi)核，每個內(nèi)核相當于一顆簡化版的CPU，具備整數(shù)運算和浮點運算的功能，以及排隊和結(jié)果收集功能。

注意，除了流處理器CUDA以外，影響GPU性能的還有

緩存不同
浮點運算方式不同
響應(yīng)方式不同
1. 核心頻率：頻率越高，性能越強、功耗也越高。
2. 顯示位寬：單位是bit，位寬決定了顯卡同時可以處理的數(shù)據(jù)量，越大越好。
3. 顯存容量：顯存容量越大，代表能緩存的數(shù)據(jù)就越多。
4. 顯存頻率：單位是MHz或bps，顯存頻率越高，圖形數(shù)據(jù)傳輸速度就越快。
總結(jié)
一言以蔽之，GPU不管是處理圖形渲染、數(shù)值分析，還是處理AI推理。底層邏輯都是將極為繁重的數(shù)學進行任務(wù)拆解，化繁為簡。

然后，利用GPU多流處理器的機制，將大量的運算拆解為一個個小的、簡單的運算，并行處理。我們也可以認為一個GPU就是一個集群，里面每個流處理器都是一顆CPU，這樣就容易理解了。

以上是關(guān)于GPU概念、工作原理的簡要介紹。說是簡單，其實在圖形處理方面，還有很多深層次的處理邏輯沒有展開，比如像素位置變換、三角原理等等。感興趣的小伙伴可以深入研究下。

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡