docs/user_guide/FFTLIB__LINALG__matrixMatrixMultiply__ixX__ixX__oxX__cn_8cpp_source.html

 /*******************************************************************************

 **+--------------------------------------------------------------------------+**

 **|                            ****                                          |**

 **|                            ****                                          |**

 **|                            ******o***                                    |**

 **|                      ********_///_****                                   |**

 **|                      ***** /_//_/ ****                                   |**

 **|                       ** ** (__/ ****                                    |**

 **|                           *********                                      |**

 **|                            ****                                          |**

 **|                            ***                                           |**

 **|                                                                          |**

 **|         Copyright (c) 2016 Texas Instruments Incorporated                |**

 **|                        ALL RIGHTS RESERVED                               |**

 **|                                                                          |**

 **| Permission to use, copy, modify, or distribute this software,            |**

 **| whether in part or in whole, for any purpose is forbidden without        |**

 **| a signed licensing agreement and NDA from Texas Instruments              |**

 **| Incorporated (TI).                                                       |**

 **|                                                                          |**

 **| TI makes no representation or warranties with respect to the             |**

 **| performance of this computer program, and specifically disclaims         |**

 **| any responsibility for any damages, special or consequential,            |**

 **| connected with the use of this program.                                  |**

 **|                                                                          |**

 **+--------------------------------------------------------------------------+**

 *******************************************************************************/


 #include "FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h"


 FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_init_cn(

                                                                      FFTLIB_kernelHandle handle,

                                                                      const FFTLIB_bufParams2D_t *src0_addr,

                                                                      const FFTLIB_bufParams2D_t *src1_addr,

                                                                      const FFTLIB_bufParams2D_t *dst_addr,

                                                                      const FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_InitArgs *pKerInitArgs)

 {

    FFTLIB_STATUS status = FFTLIB_SUCCESS;


    // store parameters

    FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs *pKerPrivArgs =

    (FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs*) handle;

    pKerPrivArgs->M = src0_addr->dim_y;

    pKerPrivArgs->K = src0_addr->dim_x;

    pKerPrivArgs->N = src1_addr->dim_x;


    return status;

 }


 template <typename dataType, typename accumulateType>

 FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn(FFTLIB_kernelHandle handle,

                                                                      const void * src0,

                                                                      const void * src1,

                                                                      void *dst)

 {

    FFTLIB_STATUS    status = FFTLIB_SUCCESS;

    int32_t m, k, n;

    accumulateType product, sum;


    FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs *pKerPrivArgs = (FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs *)handle;


    int32_t M = pKerPrivArgs->M;

    int32_t K = pKerPrivArgs->K;

    int32_t N = pKerPrivArgs->N;

    int32_t strideA = pKerPrivArgs->strideAElements;

    int32_t strideB = pKerPrivArgs->strideBElements;

    int32_t strideC = pKerPrivArgs->strideCElements;


    int8_t shift = pKerPrivArgs->initArgs.shift;


    const dataType *A = (const dataType *)src0;

    const dataType *B = (const dataType *)src1;

    dataType *C = (dataType *)dst;


    for (m = 0; m < M; m++) {

       for (n = 0; n < N; n++) {

          sum = 0;

          for (k = 0; k < K; k++){

             product = FFTLIB_UTIL_mult(A[k + m*strideA], B[n + k*strideB]);

             sum = sum + product;

          }

          C[n + m*strideC] = FFTLIB_UTIL_shiftAndRound<accumulateType, dataType>(sum, shift);


 #if defined(FFTLIB_INDUCE_NATURALC_ERROR)

          C[n + m*StrideC] = 77;

 #endif

       }

    }

    return (status);

 }


 // explicit instantiation for the different data type versions

 template FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn<int8_t, int32_t> (FFTLIB_kernelHandle handle,

                                                                                   const void * src0,

                                                                                   const void * src1,

                                                                                   void *dst);


 template FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn<int16_t, int64_t> (FFTLIB_kernelHandle handle,

                                                                                    const void * src0,

                                                                                    const void * src1,

                                                                                    void *dst);


 template FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn<int32_t, FFTLIB_int128_t> (FFTLIB_kernelHandle handle,

                                                                                            const void * src0,

                                                                                            const void * src1,

                                                                                            void *dst);

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn
FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn(FFTLIB_kernelHandle handle, const void *src0, const void *src1, void *dst)
This function is the main execution function for the natural C implementation of the matrix-matrix mu...
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_cn.cpp:52

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn< int32_t, FFTLIB_int128_t >
template FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn< int32_t, FFTLIB_int128_t >(FFTLIB_kernelHandle handle, const void *src0, const void *src1, void *dst)

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn< int16_t, int64_t >
template FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn< int16_t, int64_t >(FFTLIB_kernelHandle handle, const void *src0, const void *src1, void *dst)

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_init_cn
FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_init_cn(FFTLIB_kernelHandle handle, const FFTLIB_bufParams2D_t *src0_addr, const FFTLIB_bufParams2D_t *src1_addr, const FFTLIB_bufParams2D_t *dst_addr, const FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_InitArgs *pKerInitArgs)
This function is the initialization function for the natural C implementation of the kernel.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_cn.cpp:32

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn< int8_t, int32_t >
template FFTLIB_STATUS FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_exec_cn< int8_t, int32_t >(FFTLIB_kernelHandle handle, const void *src0, const void *src1, void *dst)

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h
Header file for kernel's internal use. For the kernel's interface, please see FFTLIB_LINALG_matrixMat...

FFTLIB_kernelHandle
void * FFTLIB_kernelHandle
Handle type for FFTLIB operations.
Definition: FFTLIB_types.h:217

FFTLIB_STATUS_NAME
FFTLIB_STATUS_NAME
The enumeration of all status codes.
Definition: FFTLIB_types.h:172

FFTLIB_SUCCESS
@ FFTLIB_SUCCESS
Definition: FFTLIB_types.h:173

FFTLIB_UTIL_mult
static void FFTLIB_UTIL_mult(int64_t *ph, int64_t *pl, int64_t a, int64_t b)
Definition: FFTLIB_utility.h:93

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_InitArgs
This structure holds all the initialization parameters for matrix- matrix multiplication.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX.h:126

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_InitArgs::shift
int8_t shift
Output shift value.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX.h:129

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs
This structure holds all private arguments.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:56

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::strideBElements
int32_t strideBElements
Row stride for the B matrix.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:64

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::K
int32_t K
Number of blocks in the horizontal dimension of the first input matrix. In the case of natural C code...
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:60

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::M
int32_t M
Number of blocks in the vertical dimension of the first input matrix. In the case of natural C code,...
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:59

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::strideCElements
int32_t strideCElements
Row stride for the C matrix.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:65

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::strideAElements
int32_t strideAElements
Row stride for the A matrix.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:63

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::N
int32_t N
Number of blocks in the horizontal dimension of the second input matrix. In the case of natural C cod...
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:61

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_PrivArgs::initArgs
FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_InitArgs initArgs
Structure holding initialization parameters.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_priv.h:57

FFTLIB_bufParams2D_t
A structure for a 2 dimensional buffer descriptor.
Definition: FFTLIB_bufParams.h:92

FFTLIB_bufParams2D_t::dim_y
uint32_t dim_y
Height of buffer in Y dimension in elements.
Definition: FFTLIB_bufParams.h:96

FFTLIB_bufParams2D_t::dim_x
uint32_t dim_x
Width of buffer in X dimension in elements.
Definition: FFTLIB_bufParams.h:95