doc/Ptex/PtexSeparableKernel_8cpp_source.html

/*

PTEX SOFTWARE

Copyright 2014 Disney Enterprises, Inc.  All rights reserved


Redistribution and use in source and binary forms, with or without

modification, are permitted provided that the following conditions are

met:


  * Redistributions of source code must retain the above copyright

    notice, this list of conditions and the following disclaimer.


  * Redistributions in binary form must reproduce the above copyright

    notice, this list of conditions and the following disclaimer in

    the documentation and/or other materials provided with the

    distribution.


  * The names "Disney", "Walt Disney Pictures", "Walt Disney Animation

    Studios" or the names of its contributors may NOT be used to

    endorse or promote products derived from this software without

    specific prior written permission from Walt Disney Pictures.


Disclaimer: THIS SOFTWARE IS PROVIDED BY WALT DISNEY PICTURES AND

CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING,

BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY, FITNESS

FOR A PARTICULAR PURPOSE, NONINFRINGEMENT AND TITLE ARE DISCLAIMED.

IN NO EVENT SHALL WALT DISNEY PICTURES, THE COPYRIGHT HOLDER OR

CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,

EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,

PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR

PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND BASED ON ANY

THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT

(INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE

OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGES.

*/

#include "PtexPlatform.h"

#include "PtexUtils.h"

#include "PtexHalf.h"

#include "PtexSeparableKernel.h"


PTEX_NAMESPACE_BEGIN


namespace {

    // apply to 1..4 channels (unrolled channel loop) of packed data (nTxChan==nChan)

    template<class T, int nChan>

    void Apply(PtexSeparableKernel& k, float* result, void* data, int /*nChan*/, int /*nTxChan*/)

    {

        float* rowResult = (float*) alloca(nChan*sizeof(float));

        int rowlen = k.res.u() * nChan;

        int datalen = k.uw * nChan;

        int rowskip = rowlen - datalen;

        float* kvp = k.kv;

        T* p = static_cast<T*>(data) + (k.v * k.res.u() + k.u) * nChan;

        T* pEnd = p + k.vw * rowlen;

        while (p != pEnd)

        {

            float* kup = k.ku;

            T* pRowEnd = p + datalen;

            // just mult and copy first element

            PtexUtils::VecMult<T,nChan>()(rowResult, p, *kup++);

            p += nChan;

            // accumulate remaining elements

            while (p != pRowEnd) {

                // rowResult[i] = p[i] * ku[u] for i in {0..n-1}

                PtexUtils::VecAccum<T,nChan>()(rowResult, p, *kup++);

                p += nChan;

            }

            // result[i] += rowResult[i] * kv[v] for i in {0..n-1}

            PtexUtils::VecAccum<float,nChan>()(result, rowResult, *kvp++);

            p += rowskip;

        }

    }


    // apply to 1..4 channels (unrolled channel loop) w/ pixel stride

    template<class T, int nChan>

    void ApplyS(PtexSeparableKernel& k, float* result, void* data, int /*nChan*/, int nTxChan)

    {

        float* rowResult = (float*) alloca(nChan*sizeof(float));

        int rowlen = k.res.u() * nTxChan;

        int datalen = k.uw * nTxChan;

        int rowskip = rowlen - datalen;

        float* kvp = k.kv;

        T* p = static_cast<T*>(data) + (k.v * k.res.u() + k.u) * nTxChan;

        T* pEnd = p + k.vw * rowlen;

        while (p != pEnd)

        {

            float* kup = k.ku;

            T* pRowEnd = p + datalen;

            // just mult and copy first element

            PtexUtils::VecMult<T,nChan>()(rowResult, p, *kup++);

            p += nTxChan;

            // accumulate remaining elements

            while (p != pRowEnd) {

                // rowResult[i] = p[i] * ku[u] for i in {0..n-1}

                PtexUtils::VecAccum<T,nChan>()(rowResult, p, *kup++);

                p += nTxChan;

            }

            // result[i] += rowResult[i] * kv[v] for i in {0..n-1}

            PtexUtils::VecAccum<float,nChan>()(result, rowResult, *kvp++);

            p += rowskip;

        }

    }


    // apply to N channels (general case)

    template<class T>

    void ApplyN(PtexSeparableKernel& k, float* result, void* data, int nChan, int nTxChan)

    {

        float* rowResult = (float*) alloca(nChan*sizeof(float));

        int rowlen = k.res.u() * nTxChan;

        int datalen = k.uw * nTxChan;

        int rowskip = rowlen - datalen;

        float* kvp = k.kv;

        T* p = static_cast<T*>(data) + (k.v * k.res.u() + k.u) * nTxChan;

        T* pEnd = p + k.vw * rowlen;

        while (p != pEnd)

        {

            float* kup = k.ku;

            T* pRowEnd = p + datalen;

            // just mult and copy first element

            PtexUtils::VecMultN<T>()(rowResult, p, nChan, *kup++);

            p += nTxChan;

            // accumulate remaining elements

            while (p != pRowEnd) {

                // rowResult[i] = p[i] * ku[u] for i in {0..n-1}

                PtexUtils::VecAccumN<T>()(rowResult, p, nChan, *kup++);

                p += nTxChan;

            }

            // result[i] += rowResult[i] * kv[v] for i in {0..n-1}

            PtexUtils::VecAccumN<float>()(result, rowResult, nChan, *kvp++);

            p += rowskip;

        }

    }

}


PtexSeparableKernel::ApplyFn

PtexSeparableKernel::applyFunctions[] = {

    // nChan == nTxChan

    ApplyN<uint8_t>,  ApplyN<uint16_t>,  ApplyN<PtexHalf>,  ApplyN<float>,

    Apply<uint8_t,1>, Apply<uint16_t,1>, Apply<PtexHalf,1>, Apply<float,1>,

    Apply<uint8_t,2>, Apply<uint16_t,2>, Apply<PtexHalf,2>, Apply<float,2>,

    Apply<uint8_t,3>, Apply<uint16_t,3>, Apply<PtexHalf,3>, Apply<float,3>,

    Apply<uint8_t,4>, Apply<uint16_t,4>, Apply<PtexHalf,4>, Apply<float,4>,


    // nChan != nTxChan (need pixel stride)

    ApplyN<uint8_t>,   ApplyN<uint16_t>,   ApplyN<PtexHalf>,   ApplyN<float>,

    ApplyS<uint8_t,1>, ApplyS<uint16_t,1>, ApplyS<PtexHalf,1>, ApplyS<float,1>,

    ApplyS<uint8_t,2>, ApplyS<uint16_t,2>, ApplyS<PtexHalf,2>, ApplyS<float,2>,

    ApplyS<uint8_t,3>, ApplyS<uint16_t,3>, ApplyS<PtexHalf,3>, ApplyS<float,3>,

    ApplyS<uint8_t,4>, ApplyS<uint16_t,4>, ApplyS<PtexHalf,4>, ApplyS<float,4>,

};


PTEX_NAMESPACE_END

PtexHalf.h
Half-precision floating-point type.

PtexPlatform.h
Platform-specific classes, functions, and includes.

PtexSeparableKernel.h

PtexUtils.h

PTEX_NAMESPACE_END
#define PTEX_NAMESPACE_END
Definition PtexVersion.h:62

PtexSeparableKernel
Definition PtexSeparableKernel.h:48

PtexSeparableKernel::u
int u
Definition PtexSeparableKernel.h:51

PtexSeparableKernel::kv
float * kv
Definition PtexSeparableKernel.h:54

PtexSeparableKernel::res
Res res
Definition PtexSeparableKernel.h:50

PtexSeparableKernel::ApplyFn
void(* ApplyFn)(PtexSeparableKernel &k, float *dst, void *data, int nChan, int nTxChan)
Definition PtexSeparableKernel.h:470

PtexSeparableKernel::applyFunctions
static ApplyFn applyFunctions[40]
Definition PtexSeparableKernel.h:472

PtexSeparableKernel::vw
int vw
Definition PtexSeparableKernel.h:52

PtexSeparableKernel::v
int v
Definition PtexSeparableKernel.h:51

PtexSeparableKernel::ku
float * ku
Definition PtexSeparableKernel.h:53

PtexSeparableKernel::uw
int uw
Definition PtexSeparableKernel.h:52

PTEX_NAMESPACE_BEGIN
Definition PtexSeparableKernel.cpp:42

PTEX_NAMESPACE_BEGIN::ApplyN
void ApplyN(PtexSeparableKernel &k, float *result, void *data, int nChan, int nTxChan)
Definition PtexSeparableKernel.cpp:105

PTEX_NAMESPACE_BEGIN::ApplyS
void ApplyS(PtexSeparableKernel &k, float *result, void *data, int, int nTxChan)
Definition PtexSeparableKernel.cpp:75

PTEX_NAMESPACE_BEGIN::Apply
void Apply(PtexSeparableKernel &k, float *result, void *data, int, int)
Definition PtexSeparableKernel.cpp:45

PtexUtils::VecAccumN
Definition PtexUtils.h:247

PtexUtils::VecAccum
Definition PtexUtils.h:233

PtexUtils::VecMultN
Definition PtexUtils.h:270

PtexUtils::VecMult
Definition PtexUtils.h:256