覆蓋面采樣抗鋸齒
鋸齒是出現在圖像上的鋸齒狀邊緣,而這些區域本應顯示為流暢的線條或邊緣;抗鋸齒 (AA)技術在計算機圖形中用于讓這些鋸齒線條更加平滑。當高清晰度圖像在較低分辨率的 顯示器 上顯示時,或者當較高分辨率的圖像轉換為較低分辨率的圖像時便會出現鋸齒效果。
通常,GPU使用多重采樣抗鋸齒(MSAA)和超級采樣抗鋸齒(SSAA)技術減少鋸齒效果。在之前的抗鋸齒技術中,覆蓋面始終與“實際”采樣類型相關聯,而覆蓋面采樣與此不同。在SSAA中,每個實際采樣都有其獨特的顏色和Z值,并且在4xAA的情況下,著色器程序會運行四次,并獲取四個紋理 ‐ 每個樣本一個紋理(或者在多紋理的情況會更多)。采用4xAA時,幀緩沖區要比未使用抗鋸齒時大四倍,并且會經過向下過濾,以創建最終像素顏色。
CSAA可以將簡單的覆蓋面采樣從顏色/z/模板/覆蓋面采樣中解耦出來,進一步優化抗鋸齒流程,從而較 MSAA和SSAA減少帶寬和存儲成本。CSAA 使用更多覆蓋面樣本來計算指定像素區域中的多邊形的覆蓋面水平,從而實現更高質量的抗鋸齒效果,而不會由于處理額外的實際顏色和Z樣本而產生內存和功耗成本。
高級各向異性過濾
各向異性過濾是一種用于提高表面上處于斜視角的紋理的圖像質量的技術。 通常,屏幕上的每個像素都需要從內存的紋理貼圖中獲取多個紋理元素,經過過濾并應用于像素以改變其顏色。從正面看表面時(垂直于鏡頭或觀眾),通常會使用方形采樣模式為每個像素采樣同等數量的紋理元素。但是,在極端視角下(即屏幕上的圖像從一個軸延伸至另一軸),從紋理貼圖中為每個軸提取相同數量的樣本會導致紋理沿延伸至水平方向的軸出現模糊。
通過各向異性過濾得到改善的紋理質量
可以看到接近地平線處的跑道部分的紋理細節出現了模糊。 各向異性過濾技術可以智能地沿該延伸軸采集更多的紋理樣本,并保留沿該軸的紋理細節。GeForce支持高達16倍各向異性過濾。它采用自適應過濾算法和高效紋理緩存管理技術來提供高紋理質量,同時不會顯著增加內存操作。
優化的內存控制器
Tegra 2)處理器包括經過全新設計的GPU和內存控制器(MC)內核,GPU內核的性能極度依賴于MC交付帶寬的效率以及圖形處理延遲要求。由于GPU和MC均采用了內部開發,因此MC針對GeForce的特定需求進行了高度調優,同時還增強了GPU性能和降低了功耗。
MC控制器設計的一些關鍵優化包括:
動態時鐘速度控制(DCSC): DCSC支持內存控制器迅速提高工作頻率以響應來自GPU內核的高級指標便于系統內存訪問,以及在 GPU 完成其內存訪問后將工作頻率迅速降低至節能水平。由于采用了嚴密的內部設計流程,因此MC可以直接接入GPU內核硬件,主動預測GPU需求和管理其工作水平,以滿足GPU需求。
以GPU為中心的內存仲裁: 系統內存是移動處理器中最寶貴的資源之一。CPU、GPU、視頻和音頻等各種內核都需要能夠以高帶寬、高度響應性的形式訪問系統內存。MC實現了高級仲裁機制,可有效確保多個客戶端訪問系統內存。
MC內核具有關于來自GPU客戶端的內存訪問請求的類型和緊急性的深入信息,并且實現了一種高度優化的仲裁機制,可滿足呈現器和幾何請求對帶寬的苛刻要求,以及滿足對服務高優級級延遲敏感的顯示和CPU請求在低延遲方面的苛刻要求。MC還掌握GPU內核生成的各請求的優先級的信息,并且可進一步優化其性能以滿足這些請求的需求。
GPU請求分組: 片外系統內存設備在任何特定時間都只能打開特定數量的內存條。當內存的請求訪問區不包含在當前打開的內存條中時,MC需要關閉當前打開的內存條,然后激活包含所需內存單元或區域的新內存條。這一過程不僅會影響延遲和帶寬,同時對功耗的需要也較高。
GeForce掌握當前的系統配置,并且會對訪問模式進行優化,而不會發起多個不同的訪問內存子系統的不同部分中的隨機內存條的內存請求。GPU可以將訪問相同內存條的內存請求組合在一起。MC控制器還可以根據內存條訪問模式對獨立內存請求進行重新排序。這些功能可以提供更加高效的內存訪問,并通過限制頻繁的內存條切換來降低功耗。