d1/dea/Slp_8cl_8c_source.html

#pragma OPENCL EXTENSION cl-fast-relaxed-math : enable

#pragma OPENCL EXTENSION pod-pushconstant : enable


#if __ae2f_MACRO_GENERATED

#define ae2fVK_clspv_IS_OPENCL 1

#endif


#include "./Slp.auto.h"


#define ae2f_NEED_CLASS 0


#ifndef ACT

#define ACT(r, y, i, c)     *(r) = (y)[i];

#endif


#ifndef ACT_DERIV

#define ACT_DERIV(r, y, i, c)       1

#endif


#ifndef LOSS_DERIV

#define LOSS_DERIV(r, y, y_desired, i, c) *(r) = (y)[i] - (y_desired)[i];

#endif


/** Magic numbers */

#define p_weight    glob

#define p_bias      (glob + (osz * isz))

#define p_inp       ((p_bias) + (osz))

#define p_out       ((p_inp) + (isz))

#define p_delta     ((p_out) + osz)

#define p_goal      ((p_delta) + osz)


#define loc     CAST(__local ae2f_float_t*, _loc)


const ae2f_structdef(struct, lr_t) {

    host_float_t    m_weight;

    host_float_t    m_bias;

};


/**

 * @brief

 *

 * get_global_id(0) : oidx  \n

 *

 * Global: \n

 *  , ae2f_float_t[Out][Inp] : Weight   \n

 *  , ae2f_float_t[Out] : Bias      \n

 *  , ae2f_float_t[Inp]         \n

 *  , ae2f_float_t[Out]         \n

 *

 * */

__kernel void kPredict(__global host_float_t* restrict glob, const uint unused) {

    const size_t

        oidx = get_global_id(0)

        , osz = get_global_size(0)

        , iidx = get_global_id(1)

        , isz = get_global_size(1);


    _clAtomAddF_t(__global, host_float_t)   v_predict;


    _clSlpPredict(

            __global

            , v_predict

            , p_out[oidx]

            , p_out

            , p_inp

            , p_weight

            , p_bias

            , iidx

            , isz

            , oidx

            , osz

            , ACT

            );

}


/**

 * @brief

 *

 * get_global_id(0) : oidx  \n

 * get_local_id(0) : iidx   \n

 *

 * Global: \n

 *  ae2f_float_t[Out][Inp] : Weights    \n

 *  , ae2f_float_t[Out] :   Bias        \n

 *  , ae2f_float_t[Inp]         \n

 *  , ae2f_float_t[Out]         \n

 *  , ae2f_float_t[Out] : Delta     \n

 *  , ae2f_float_t[Out] : Goal      \n

 *

 * Local: \n

 *  ae2f_float_t[Out]       \n

 * */

__kernel void kTrain(lr_t lr, __global host_float_t* restrict glob, __local uint* restrict _loc) {

    const size_t

        oidx = get_global_id(0)

        , osz = get_global_size(0)

        , iidx = get_global_id(1)

        , isz = get_global_size(1)

        ;


    ae2f_float_t        v_tmp = 0;

    _clAtomAddF_t(__local, ae2f_float_t)    slppredict;

#define delta   slppredict.m_atom[0].m_f

#define v_tmp1  slppredict.m_atom[1].m_f


    _clSlpPredict(__local, slppredict, v_tmp, loc, p_inp, p_weight, p_bias, iidx, isz, oidx, osz, ACT);


    if(iidx == 0) {

        p_out[oidx] = v_tmp;

        loc[oidx] = v_tmp;


        __ae2f_AnnSlpFetchDeltaOne_imp(

                delta

                , &v_tmp, &v_tmp1

                , loc                       /** out */

                , p_goal                    /** out_desired */

                , oidx, osz

                , ACT_DERIV, LOSS_DERIV

                );


        __ae2f_AnnSlpFollowOneB_imp(

                p_bias[oidx] /** r_bias */

                , delta /** delta */

                , lr.m_bias

                );


        p_delta[oidx] = delta;

    }


    delta = p_delta[oidx];

    v_tmp = p_inp[iidx];


    __ae2f_AnnSlpFollowOneW_imp(

            v_tmp

            , delta /** delta */

            , glob /** weight */

            , lr.m_weight

            , isz

            , iidx

            , osz

            , oidx

            );


#undef v_tmp1

#undef delta

}


/**

 * @brief

 *

 * get_global_id(0) : oidx  \n

 * get_local_id(0) : iidx   \n

 *

 * Global: \n

 *  ae2f_float_t[Out][In] : Weights \n

 *  , ae2f_float_t[Out] : Bias  \n

 *  , ae2f_float_t[Inp]     \n

 *  , ae2f_float_t[Out]     \n

 *  , ae2f_float_t[Out] : Delta \n

 *  , ae2f_float_t[Out] : Goal  \n

 *

 * */

__kernel void kFit(lr_t lr, __global host_float_t* restrict glob) {

    const size_t

        oidx = get_global_id(0)

        , osz = get_global_size(0)

        , iidx = get_global_id(1)

        , isz = get_global_size(1)

        ;


    ae2f_float_t    delta, v_tmp, v_tmp1;


    if(iidx == 0) {

        __ae2f_AnnSlpFetchDeltaOne_imp(

                delta /** retdelta */

                , &v_tmp, &v_tmp1

                , p_out /** out */

                , p_goal /** out_desired */

                , oidx, osz

                , ACT_DERIV

                , LOSS_DERIV

                );


        /** delta */


        __ae2f_AnnSlpFollowOneB_imp(

                p_bias[oidx]    /** r_bias */

                , delta     /** delta */

                , lr.m_bias

                );


        p_delta[oidx] = delta;

    }


    delta = p_delta[oidx];

    __ae2f_AnnSlpFollowOneW_imp(

            p_inp[iidx] /** inp */

            , delta /** delta */

            , p_weight /** weight */

            , lr.m_weight

            , isz

            , iidx

            , osz

            , oidx

            );

}


/**

 * @brief

 * get_global_id(0):    oidx

 * get_local_id(0): iidx

 *

 * Global: \n

 *  ae2f_float_t[Out][In] : Weights \n

 *  , ae2f_float_t[Out] : Bias  \n

 *  , ae2f_float_t[Inp]     \n

 *  , ae2f_float_t[Out] : Delta \n

 * */

__kernel void kFollow(lr_t lr, __global host_float_t* restrict glob) {

    const size_t

        oidx = get_global_id(0)

        , osz = get_global_size(0)

        , iidx = get_global_id(1)

        , isz = get_global_size(1)

        ;


    __ae2f_AnnSlpFollowOneW_imp(

            p_inp[iidx] /** inp */

            , p_delta[oidx] /** delta */

            , p_weight /** weight */

            , lr.m_weight

            , isz

            , iidx

            , osz

            , oidx

            );


    if(iidx == 0) {

        __ae2f_AnnSlpFollowOneB_imp(

                p_bias[oidx] /** r_bias */

                , p_delta[oidx] /** delta */

                , lr.m_bias

                );

    }

}

ae2f_structdef
#define ae2f_structdef(key, name)
Definition Cast.h:110

loc
#define loc
Definition Mlp.cl.c:81

p_weight
#define p_weight
Definition Mlp.cl.c:46

p_goal
#define p_goal
Definition Mlp.cl.c:55

p_bias
#define p_bias
Definition Mlp.cl.c:49

p_inp
#define p_inp
Definition Mlp.cl.c:43

p_delta
#define p_delta
Definition Slp.cl.c:29

delta
#define delta

v_tmp1
#define v_tmp1

p_out
#define p_out
Definition Slp.cl.c:28

__global
#define __global
Definition addrspec.h:8

__local
#define __local
Definition addrspec.h:10

__kernel
#define __kernel
Definition addrspec.h:7

__ae2f_AnnSlpFetchDeltaOne_imp
#define __ae2f_AnnSlpFetchDeltaOne_imp(rret, ptr_tmp0, ptr_tmp1, prm_out, prm_out_desired, prm_oidx, prm_osz, fn_actderiv, fn_lossderiv)
Definition Slp.auto.h:528

__ae2f_AnnSlpFollowOneW_imp
#define __ae2f_AnnSlpFollowOneW_imp(inp, delta, weight, learningrate, inp_sz, inp_idx, out_sz, out_idx)
Definition Slp.auto.h:381

__ae2f_AnnSlpFollowOneB_imp
#define __ae2f_AnnSlpFollowOneB_imp(rret_bias, prm_delta, prm_learningrate_bias)
Definition Slp.auto.h:400

size_t
#define size_t
Definition mac.h:20

CAST
#define CAST(t, x)
Definition mac.h:16

host_float_t
#define host_float_t
Definition mac.h:9

uint
#define uint
Definition sclr.h:11

_clAtomAddF_t
#define _clAtomAddF_t(__global, host_float_t)
Definition Slp.auto.h:24

_clSlpPredict
#define _clSlpPredict(__global, v_mem, ret, loc, p_inp, p_weight, p_bias, iidx, isz, oidx, osz, ACT)
Definition Slp.auto.h:81