曾經以為諸如手機這樣的移動設備,單核處理器已經足夠搞定它們了,哪怕不夠提高一點頻率肯定是沒問題的,曾經以為雙核只是PC上的神器,手機無論如何也很難與其沾邊;然而,很多我們曾經以為的東西在一轉眼間之間都變成了現實,單核處理器不再完全滿足手機需要,出現在PC上的雙核處理器也同樣出現在了手機上,并且大有加速趕超的意思。

年初Tegra 2處理器率先揭開了雙核手機大幕,于是在今年一年的時間里我們看到了大批雙核手機登場,可以說2011年定義為雙核手機元年一點也不過分;現如今,作為雙核手機元年的2011尚還有一段時間才正式結束,但是我們已經能嗅到四核手機的味道了,來自于NVIDIA的Tegra 3處理器已經蓄勢待發。

尋求性能與功耗的平衡
Tegra 3處理器最明顯的特征是它擁有比Tegra 2更多的核心,也是目前首個基于移動設備設計的四核處理器,或者更準確的說應該是4+1核處理器,因此它在四顆主核心的基礎上加入了一顆協處理器,以達到降低功耗和保持續航的目的。4+1處理器?聽起來似乎有些噱頭,這樣的設計理念和思路是什么?它和Tegra 2處理器相比能帶來哪些改變和提升?它能保持性能和功耗的平衡點嗎?帶著這一連串的疑問,我們不妨來深入了解一下全球首款四核移動處理器Tegra 3。
4顆主核心+1顆協核心尋求性能功耗平衡點
待機、續航時間短一直是智能手機用戶比較發愁的一件事,特別是在大屏橫行的當下更是如此,在雙核處理器面世之初就有不少人擔心它的功耗和續航問題,如今Tegra 3的處理核心更多了,功耗和續航問題再次成為人們關注的重點,Tegra 3如何保持性能功耗平衡點,下面我們來了解一下Tegra 3的架構圖以及設計思路和方案。

Tegra 3處理器核心圖
Tegra 3處理器采用“Kal-El”作為核心代號,從上面的核心圖中可以看到Tegra 3一共有五顆處理核心,單獨位于最上端的處理器就是4+1處理器中的1,也就是前面提到的協處理器,而就是NVIDIA專門為保持功耗和性能的平衡所采用的可變對稱多重處理(vSMP)技術。

4+1核心設計
可變對稱多重處理(vSMP)技術是指第五顆協核心利用專門的低功耗硅工藝制造而成,能夠以低頻率運行活動待機模式下的任務、音樂播放乃至視頻播放;四顆主要芯片以標準的硅工藝制造而成,可以達到更高的頻率,同時在運行諸多任務時比雙核解決方案功耗更低。這五顆CPU核心均采用ARM Cortex A9架構,它們可以根據工作負荷而單獨地啟動和關閉。協核心對于操作系統是透明的,這與當前的異步SMP架構不同,這意味著操作系統和應用程序均不知道這個核心的存在,然而卻能夠自動利用。

根據負載打開不同的處理器
情況一,當機器處于待機、音頻播放、視頻播放等簡單應用時,系統將只調用協處理器,主頻從0到500Mhz;
情況二,當機器處于簡單網頁瀏覽、簡單2D游戲時,系統將調用一顆標準核心,其他核心休眠;主頻從0到1.4GHz;
情況三,當機器處于Flash網頁瀏覽以及多任務處理以及視頻聊天等,系統將調用兩顆標準核心,其他核心休眠,主頻從0到1.3GHz;
情況四,當機器處于全負荷的情況下,四個標準核心全部啟動,主頻從0到1.3GHz。
●低功耗協核心
協核心是利用低功耗工藝技術設計而成的,卻擁有和Cortex A9 CPU相同的內部架構,因為他利用低功耗工藝技術制造,以低頻率模式運行,所以功耗低于采用高速工藝技術制造的主CPU核心,協核心在500MHz以下工作時可實現高于主核心的每瓦特性能,因此協核心的最高工作頻率不高于500MHz。

移動CPU功耗——性能曲線圖
協核心主要用于移動設備處于活動待機狀態及執行后臺任務,同時它還用于不需要強勁CPU處理能力的應用程序;與協核心不同,CPU主核心需要極高頻以保證高性能,因此它采用高工藝技術制造而成,這種技術讓主核心能夠在較低的工作電壓下將頻率提升至比較高的水平,因此主核心能夠在不大幅增加動態功耗的情況先實現高性能。
●操作系統透明化
Android 3.x (Honeycomb) 操作系統內置了針對多重處理的支持,而且能夠利用多個CPU核心的性能。 然而,該操作系統會假定所有可用的CPU核心均能夠實現相同的性能,并且根據這一假設來為可用的核心調度任務。 因此,為了讓操作系統隨時掌握協核心和主核心的管理過程,Kal-El 處理器針對協核心和主要的四個CPU核心既采用了基于硬件的管理,又采用了基于低級軟件的管理。

功耗曲線
專利的硬件與軟件CPU管理邏輯單元不斷監控CPU的工作負荷,以便自動而動態地啟用和禁用CPU協核心和主核心。 打開和關閉協核心以及主核心的決定完全取決于當前的CPU工作負荷水平以及CPU頻率控制子系統所得出的CPU工作頻率推薦值。該子系統嵌入在操作系統內核之中。 該項技術不需要對應用程序或操作系統進行任何改動。
Tegra 3帶來更好的用戶使用體驗
前面介紹了Tegra 3處理器在架構上的優化改進及優勢,這些對于我們普通消費者來說可能并不直觀,下面我們就通過數據對比的方式來給大家展示四核Tegra 3得應用優勢。
更快地網頁載入速度
目前不少瀏覽器采用了多線程技術,能夠產生多個并發進程,這樣瀏覽器中的每個標簽頁均為一個單獨的進程,每個進程又管理著各自的多個線程,因此標簽式瀏覽器會占用比較大的CPU資源,下面我們通過幾組數據來了解在網絡瀏覽時CPU的使用情況,以及四核對比雙核處理器的優勢所在。

CPU網絡瀏覽時四核CPU系統中的 CPU 使用情況
從圖中可以看到,瀏覽器使用了四核CPU的全部四個核心,而這種并行處理的效果是,與采用雙核CPU的移動設備相比,網絡瀏覽體驗快多了。 對于這些支持標簽式瀏覽的瀏覽器,四核CPU還能夠發揮出更高的性能。

標簽式網絡瀏覽期間四核CPU的使用情況

Moonbat JavaScript 基準測試程序上的四核性能優勢
圖中顯示了當網絡瀏覽器打開多個標簽頁時,四個CPU核心的使用情況。 事實上,標簽式瀏覽形式會占用相當大的CPU處理能力,而且如圖所示,這種瀏覽可能會占用四核CPU的全部四個核心。
更好地滿足高性能應用需求
多核處理器的一個重要優勢是能夠為高要求應用以及使用場合提供更強的性能,例如照片編輯、視頻轉碼、網絡瀏覽以及多線程游戲。下面通過兩組數據來了解一下四核Tegra 3在這方面的優勢。

Coremark多核 CPU基準測試結果
Coremark 是一款流行的移動CPU基準測試程序,該程序的測試結果體現了運行多媒體應用時的性能情況,Coremark 顯示,四核CPU的性能幾乎是雙核CPU移動處理器的 2 倍、幾乎是單核CPU的4倍。

Photaf 3D Panorama照片處理應用程序上的性能提升
Photaf 3D Panorama是一款評價很高的Android應用程序,該程序讓用戶能夠自動拍攝3D全景照片并將捕捉到的圖像拼接起來以備即時查看。在檢測邊緣以及拼接圖像的過程中會涉及大量圖像處理,從性能測試結果顯示,該處理器在處理和顯示所捕捉的全景圖像方面幾乎比雙核CPU移動設備快2倍。

多線程 Linpack CPU基準測試程序上的性能提升
Linpack是一款使用比較廣泛的CPU基準測試程序,當處理器運行媒體處理等極耗CPU資源的任務時,該程序可以很好地測量處理器性能。多線程Linpack基準測試程序的測試結果顯示,四核處理器的性能幾乎比同等雙核處理器高出60%,而專為四核處理器而優化的實際應用程序在四核處理器上能夠實現更大的性能提升。
更強大的多任務處理能力
移動設備用戶一般會同時運行多個應用程序,在這種任務量繁重的多任務處理情況下,單核CPU不僅被多個任務耗盡了處理能力,而且還必須以峰值頻率工作才能應付繁重的工作負荷,而在基于四核CPU的移動設備上,操作系統能夠根據當前的CPU負荷以及任務/活動的優先級,將工作負荷動態分配給合適的CPU核心。當同時運行多個任務時,如果有多個核心能夠用來執行這些任務中排隊的請求,那么便可以更快地完成這些請求的執行。
4+1核心架構的優勢所在
高速緩存一致性: 因為 vSMP 技術不允許協核心與主核心同時啟用,所以在這些以不同頻率運行的核心之間不涉及高速緩存同步的補償問題。 協核心與主核心共享同一個二級高速緩存,我們通過對該高速緩存進行編程,使其以相同的速度為協核心和主核心返回數據。
操作系統效率:Android 操作系統假定所有可用的CPU核心均相同,能夠實現相近的性能,操作系統按照這一假定的情形來為這些核心調度工作負荷。 當多個CPU核心中的每一個都以不同的異步頻率運行時,就會導致這些核心能夠實現不同的性能。 這樣會造成操作系統在任務調度上效率不高。 與之相比,vSMP 技術則始終讓所有活動的核心均保持相近的同步工作頻率,從而實現優化的操作系統任務調度。 即便當 vSMP 從協核心切換至另一個或多個主核心時,CPU管理邏輯單元也會確保無縫的過渡,最終用戶完全覺察不到這種過渡,而且這種過渡也不會造成操作系統的調度補償。

功耗優化:在基于異步時鐘的CPU架構中,每個核心一般均處于不同的電源層上,以便根據工作頻率來調整每個核心的電壓。 這會導致整個電壓層的信號線以及電源線噪聲增大,會對性能造成負面影響。 因為每個電壓層均可能需要自己的穩壓器,所以這些架構并不像增加CPU核心數量那樣易于擴展。 增加穩壓器會提高材料單 (BOM) 成本以及功耗。 如果所有核心均使用同一個電壓軌,那么每個核心將以最快核心所需的電壓運行,如此一來,便失去了可降低功耗的“電壓平方”效應優勢
比雙核更低的功耗、更高的功耗性能比
在我們的印象中多核處理器因為核心數量的增加,相應地在功耗上也要比單核處理器更大,不過對功耗管理來說,核心數量多勝過核心數量少。 例如,四核 CPU 在所有性能水平上均比雙核 CPU 的功耗低。之所以會出現這種結果是因為,四個核心能夠以更低的頻率運行,因此與雙核 CPU 相比,在處理同樣的任務量時,四核的電壓更低。 因為功耗與電壓的平方成比例,所以 CPU 整體功耗可實現大幅下降,然而卻依然能夠完成相同的任務量。



即便在全部四個 CPU 核心均以1GHz 頻率運行時,Kal-El 處理器也比雙核處理器競爭產品的功耗更低。因為 Kal-El 中的高性能 CPU 核心采用高速工藝技術,所以這四個核心在工作電壓比競爭處理器更低的情況下,依然能夠以更高的頻率工作。因為動態功耗與工作電壓的平方成比例,所以Kal-El處理器即便在以更高的頻率工作時,也能夠大幅節省電力。
游戲性能更出色:GPU核心8顆提升至12顆
圖形處理可謂是NVIDIA的老本行了,因此GPU對于NVIDIA來說可謂是駕輕就熟,Tegra 2內置的GPU具備8個處理核心,這次Tegra 3內置的GPU處理核心由之前的8顆升級到了12顆,由此帶來了圖形性能的成倍增長,并且NVIDIA將很多在桌面顯卡上的技術應用到了這里。

GPU中擁有12個核心

Tegra 3將支持3D技術
3倍到底是個什么概念?我們用實際例子展現新型GPU帶來的變化。如下面兩張圖所示,倘若使用搭載Tegra 3處理器的產品進行游戲娛樂,游戲中的水波紋、物理特效、陰影效果都會更加突出、明顯,用戶會身處一個更加逼真的使用環境中。

游戲效果更加出色

游戲效果更加出色
從另一個大家熟悉的游戲幀數方面來對比,Tegra 3的優勢同樣十分明顯。

高級游戲從四核移動處理器中獲得的性能效益
游戲體驗越來越出色,隨之而來需要下載的內容肯定也是與日俱增,過大的下載量肯定會讓很多潛在用戶選擇放棄。為此,Tegra 3提供實時動態紋理生成技術,該技術允許游戲開發者編寫游戲代碼,以使游戲中所需的紋理根據游戲的情節和狀態實時創建。由于是即時生成紋理的,因此不必在購買時提供。通過這項技術,游戲開發者可以將游戲文件的大小減小幾個數量級。這個實時動態紋理生成對性能要求非常高,要求具備多核CPU的性能,這一點,Tegra 3的四核優勢就不用多說了。

游戲中的場景變化全部動態生成
基于四核CPU移動設備的推出,或許會成為移動游戲的一個拐點,更加逼真的體驗效果將會樹立移動游戲體驗的新標竿,而這一切新標竿都由Tegra 3設定。
online評測室總結
關于Tegra 3處理器我想可以總結為三點:一是更多的處理核心,更優化的設計方案;二是更好的功耗控制;三是更好更快的使用體驗。對于移動處理器來說,功耗待機是一個非常重要的問題,Tegra 3在增加處理器核心的基礎上采用協處理器這種4+1的設計方案,既保持了處理器對于高性能的需求,同時協處理器的出現也平衡了在低負載時候手機的耗電。


Tegra 3的優勢所在
五倍于Tegra 2的性能更低的處理器功耗,三倍的GPU處理器速度,立體3D顯示技術這些都是Tegra 3所具備的優勢。

更低的功耗更長的續航
Tegra 3在整體續航時間方面相比Tegra 2都有提升,不過從上面的功耗圖中可以看到在視頻播放方面Tegra 3的續航要比Tegra 2高出61%,可以連續播放12個小時的視頻。
前面我們在文章提到Tegra 3的4顆主核心和協核心是不能同時打開的,并且主核心只能以單核、雙核和四核得方式打開,看起來非常智能的Tegra 3似乎還可以更加智能一些,如果主核心和協核心能夠同時打開,并且根據需要實現任意組合搭配,這樣的設計方案是否更節能呢?當然,這只是筆者的想法而已。

多核移動處理器還在繼續
從NVIDIA未來產品規劃圖中可以看到,NVIDIA對于未來移動處理器已經規劃到了2014年,從目前Tegra 3擁有多達四顆處理核心來看,未來移動設備處理器似乎大有趕超PC處理器的趨勢。

















