線性插值

線性插值是以距離為權(quán)重的一種插值方式。在一維空間中，假設有點A，B，其距離為LAB。A，B之間任意一點C的值為A*LBC/LAB+B*LAC/LAB。在二維空間中，需要在兩個方向上做插值。

已知Q11，Q21，Q12，Q22，計算P點的值時，需要先由Q11和Q21插值得到R1，由Q12和Q22插值得到R2，再由R1和R2插值得到P。

詳情可參考：

https://zh.wikipedia.org/wiki/%E5%8F%8C%E7%BA%BF%E6%80%A7%E6%8F%92%E5%80%BC

該方法生成的圖像比較平滑

蘭索斯插值(lanczos)

一維的線性插值，是在目標點的左邊和右邊各取一個點做插值，這兩個點的權(quán)重是由線性函數(shù)計算得到。而一維的蘭索斯插值是在目標點的左邊和右邊各取四個點做插值，這八個點的權(quán)重是由高階函數(shù)計算得到。

詳細原理可查閱:

https://en.wikipedia.org/wiki/Lanczos_resampling

二維的蘭索斯插值在x，y方向分別對相鄰的八個點進行插值，也就是計算加權(quán)和，所以它是一個8x8的描述子。

網(wǎng)上目前可找到蘭索斯算法有兩份：GPUImage和OpenCV。其中GPUImage中是用GLSL實現(xiàn)，其算法有誤，并不能得到正確的結(jié)果。OpenCV中是用C++實現(xiàn)的CPU端代碼。

我參考OpenCV中的實現(xiàn)方式，實現(xiàn)了一份GPU上的蘭索斯插值算法，該算法在GPU上運行，并不額外消耗CPU資源。其對應的GLSL為

uniform int ssize;
uniform int tsize;
uniform int flag;
uniform float scale;
uniform sampler2D inputImageTexture;
void interpolateLanczos4(in float fx, inout float rate[8]) {
    const float s45 = 0.70710678118654752440084436210485;
    const float PI = 3.1415926535897932384626433832795;
    float cs[] = float[16]( ,1.0, 0.0, -s45, -s45, 0.0, 1.0, s45, -s45, -1.0, 0.0, s45, s45, 0.0, -1.0, -s45, s45);
    if( fx < 0.0000000001 ) {
        for( int i = 0; i < 8; i++ ) {
            rate[i] = 0.0;
        }
        rate[3] = 1.0;
        return;
    }
    float sum = 0.0;
    float y0 = -(fx+3.0)*PI*0.25;
    float s0 = sin(y0);
    float c0 = cos(y0);
    for(int i = 0; i < 8; i++ ) {
        float y = -(fx+float(3-i))*PI*0.25;
        int index = i*2;
        rate[i] = (cs[index]*s0 + cs[index+1]*c0) g (y*y);
        sum += rate[i];
    }
    sum = 1.0gsum;
    for(int i = 0; i < 8; i++ ) {
        rate[i] *= sum;
    }
}
void main() {
    vec4 fragmentColor = vec4(0);
    float curPos = float(tsize);
    if( flag == 0 ) {
        curPos = fragTexCoord.x * float(tsize);
    } else {
        curPos = fragTexCoord.y * float(tsize);
    }
    float fx = (curPos + 0.5) * scale - 0.5;
    float sx = floor(fx);
    fx -= sx;
    float rate[8];
    interpolateLanczos4(fx, rate);
    for (int i=0; i<8; ++i) {
        float newCoord = (sx + float(i - 3) ) / float(ssize);
        vec2 texCoord;
        if (flag == 0)
            texCoord = vec2(newCoord, fragTexCoord.y);
        else
            texCoord = vec2(fragTexCoord.x, newCoord);
        fragmentColor += texture2D(inputImageTexture, texCoord) * rate[i];
    }
    gl_FragColor = fragmentColor;
}

上述代碼需要執(zhí)行兩遍：

第一遍的輸入為原圖，縮放寬度方向。ssize為原圖寬度，tsize為目標圖寬度。執(zhí)行完畢后，把結(jié)果存到紋理中，作為第二遍的輸入；
第二遍縮放高度方向，ssize為原圖高度，tsize為目標圖高度。執(zhí)行完畢后，把結(jié)果顯示到屏幕上。

結(jié)果對比

將上面的對比圖放大后可以發(fā)現(xiàn)，線性插值的結(jié)果較最近點插值更平滑，蘭索斯插值的結(jié)果較線性插值更清晰。

性能對比

運行環(huán)境：iphone5s，ios8.3
運行程序：自研播放器demo

以上三種插值算法渲染每幀圖像時，占用CPU時間都是40ms左右。由于這三種算法都是在GPU上實現(xiàn)，其對應的CPU代碼相同，結(jié)果與預期相符。

占用GPU時間如下所示：

插值方式	最近點插值	線性插值	蘭索斯插值
每幀圖像平均占用的GPU時間(ms)	6	6	12

蘭索斯插值算法占用GPU的平均時間為12ms，是其它兩種算法的兩倍，由于該算法中shader代碼執(zhí)行了兩遍，結(jié)果也與預期相符。

由于GPU與CPU是異步執(zhí)行，大部分視頻幀率不超過30，因此GPU上多出的6ms不會造成性能瓶頸。

注：GPUImage中的蘭索斯插值實現(xiàn)有誤，本文是參考OpenCV實現(xiàn)的。

作者：梧桐光影
鏈接：https://www.jianshu.com/p/8ae52a88ca61

責任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴