docs/user_guide/FFTLIB__FFT__dftLarge__ixX__cxX__oxX__ci_8cpp_source.html

 /******************************************************************************/

 /* Copyright (C) 2017 Texas Instruments Incorporated - https://www.ti.com/

  *

  * Redistribution and use in source and binary forms, with or without

  * modification, are permitted provided that the following conditions

  * are met:

  *

  *    Redistributions of source code must retain the above copyright

  *    notice, this list of conditions and the following disclaimer.

  *

  *    Redistributions in binary form must reproduce the above copyright

  *    notice, this list of conditions and the following disclaimer in the

  *    documentation and/or other materials provided with the

  *    distribution.

  *

  *    Neither the name of Texas Instruments Incorporated nor the names of

  *    its contributors may be used to endorse or promote products derived

  *    from this software without specific prior written permission.

  *

  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS

  * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT

  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR

  * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT

  * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,

  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT

  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,

  * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY

  * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT

  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE

  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.

  *

  ******************************************************************************/


 /*******************************************************************************

  *

  * INCLUDES

  *

  ******************************************************************************/


 #include "../FFTLIB_FFT_dftLarge_ixX_cxX_oxX_priv.h"

 #include "../../../common/c71/FFTLIB_inlines.h"


 /*******************************************************************************

  *

  * DEFINES

  *

  ******************************************************************************/

 void FFTLIB_FFT_dftLarge_ixX_cxX_oxX_perfEst(FFTLIB_kernelHandle handle,

    const FFTLIB_bufParams1D_t *bufParamsX,

    const FFTLIB_bufParams1D_t *bufParamsY,

    const FFTLIB_bufParams1D_t *bufParamsW,

    uint32_t fftSize,

    uint32_t batchSize,

    uint64_t *archCycles,

    uint64_t *estCycles)

 {

    FFTLIB_bufParams2D_t bufParamsMatrixData, bufParamsMatrixW;

    int32_t caseNumber;

    int32_t startupCycles, teardownCycles;


    bufParamsMatrixData.dim_x = fftSize*2;

    bufParamsMatrixData.dim_y = batchSize;

    bufParamsMatrixData.stride_y = fftSize*2*FFTLIB_sizeof(bufParamsX->data_type);

    bufParamsMatrixData.data_type = bufParamsX->data_type;

    bufParamsMatrixW.dim_x = fftSize*2;

    bufParamsMatrixW.dim_y = fftSize*2;

    bufParamsMatrixW.stride_y = fftSize*2*FFTLIB_sizeof(bufParamsW->data_type);

    bufParamsMatrixW.data_type = bufParamsW->data_type;


    startupCycles =

       3; // dftLarge exec()


    FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_perfEst(handle,

                                                           &bufParamsMatrixData,

                                                           &bufParamsMatrixW,

                                                           &bufParamsMatrixData,

                                                           archCycles,

                                                           estCycles,

                                                           &caseNumber);


    teardownCycles =

       3; // dftLarge exec()


    *archCycles = startupCycles + *archCycles + teardownCycles;

    *estCycles  = startupCycles + *estCycles + teardownCycles;


    return;

 }


 template <uint32_t dataType>

 FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes(

    const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs * pKerInitArgs,

    FFTLIB_bufParams1D_t * bufParamsX,

    FFTLIB_bufParams1D_t * bufParamsW,

    FFTLIB_bufParams1D_t * bufParamsY)

 {

     uint32_t fftSize = pKerInitArgs->fftSize;

     uint32_t batchSize = pKerInitArgs->batchSize;

     uint32_t MMA_SIZE;

     FFTLIB_STATUS status  = FFTLIB_SUCCESS;


     if (dataType == FFTLIB_INT32) {

        MMA_SIZE = FFTLIB_MMA_SIZE_32_BIT;

     } else if (dataType == FFTLIB_INT16) {

        MMA_SIZE = FFTLIB_MMA_SIZE_16_BIT;

     } else {

        status = FFTLIB_ERR_NOT_IMPLEMENTED;

     }


     if (fftSize <= MMA_SIZE/2) {

        status = FFTLIB_ERR_INVALID_DIMENSION;

     }


     if (status == FFTLIB_SUCCESS) {

        bufParamsX->dim_x = batchSize*fftSize*2;

        bufParamsY->dim_x = batchSize*fftSize*2;

        bufParamsW->dim_x = fftSize*2*fftSize*2;

     }


     return status;

 }


 template FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes<

    FFTLIB_INT16>(

    const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs * pKerInitArgs,

    FFTLIB_bufParams1D_t * bufParamsX,

    FFTLIB_bufParams1D_t * bufParamsW,

    FFTLIB_bufParams1D_t * bufParamsY);

 template FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes<

    FFTLIB_INT32>(

    const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs * pKerInitArgs,

    FFTLIB_bufParams1D_t * bufParamsX,

    FFTLIB_bufParams1D_t * bufParamsW,

    FFTLIB_bufParams1D_t * bufParamsY);


 template <typename dataType>

 FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_twGen(

    const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs * pKerInitArgs,

    void *restrict pW,

    const FFTLIB_bufParams1D_t * bufParamsW)

 {

     FFTLIB_STATUS    status = FFTLIB_SUCCESS;

     uint32_t j, k;

     const FFTLIB_D64 PI = 3.141592654;

     FFTLIB_D64 twF2sScale;

     FFTLIB_bufParams1D_t bufParamsXLocal, bufParamsYLocal, bufParamsWLocal;

     dataType *pWLocal = (dataType *)pW;

     uint32_t fftSize = pKerInitArgs->fftSize;

     uint32_t interleave = pKerInitArgs->interleave;


     if (sizeof(dataType) == 4) {

        status = FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes<FFTLIB_INT32>(pKerInitArgs,

                                                                        &bufParamsXLocal,

                                                                        &bufParamsWLocal,

                                                                        &bufParamsYLocal);

     } else if (sizeof(dataType) == 2) {

        status = FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes<FFTLIB_INT16>(pKerInitArgs,

                                                                        &bufParamsXLocal,

                                                                        &bufParamsWLocal,

                                                                        &bufParamsYLocal);

     } else {

        status = FFTLIB_ERR_NOT_IMPLEMENTED;

     }


     if (bufParamsW->dim_x != bufParamsWLocal.dim_x) {

         status = FFTLIB_ERR_INVALID_DIMENSION;

     }


     if (status == FFTLIB_SUCCESS) {

        twF2sScale = ((uint32_t)1 << ((uint32_t)(sizeof(dataType)*8-2))) - 1;

        twF2sScale += ((uint32_t)1 << ((uint32_t)(sizeof(dataType)*8-2)));

        twF2sScale += 0.5;

        if (interleave) {

            for (j = 0; j < fftSize; j++) {

                for (k = 0; k < fftSize; k++) {

                    pWLocal[j*2*fftSize*2+k*2]      =

                        FFTLIB_UTIL_cos_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                    pWLocal[j*2*fftSize*2+k*2+1]    =

                        -FFTLIB_UTIL_sin_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                }

                for (k = 0; k < fftSize; k++) {

                    pWLocal[(j*2+1)*fftSize*2+k*2]   =

                        FFTLIB_UTIL_sin_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                    pWLocal[(j*2+1)*fftSize*2+k*2+1]   =

                        FFTLIB_UTIL_cos_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                }

            }

        } else {

            for (j = 0; j < fftSize; j++) {

                for (k = 0; k < fftSize; k++) {

                    pWLocal[j*fftSize*2+k]      =

                        FFTLIB_UTIL_cos_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                    pWLocal[j*fftSize*2+fftSize+k]    =

                        -FFTLIB_UTIL_sin_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                }

                for (k = 0; k < fftSize; k++) {

                    pWLocal[fftSize*fftSize*2+j*fftSize*2+k]   =

                        FFTLIB_UTIL_sin_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                    pWLocal[fftSize*fftSize*2+j*fftSize*2+fftSize+k]   =

                        FFTLIB_UTIL_cos_i64f_oxX<dataType>(

                           2*PI*j*k/fftSize, twF2sScale);

                }

            }

        }

     }


     return status;

 }


 template FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_twGen<

    int16_t>(

    const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs * pKerInitArgs,

    void *restrict pW,

    const FFTLIB_bufParams1D_t * bufParamsW);


 template FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_twGen<

    int32_t>(

    const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs * pKerInitArgs,

    void *restrict pW,

    const FFTLIB_bufParams1D_t * bufParamsW);


FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes< FFTLIB_INT16 >
template FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes< FFTLIB_INT16 >(const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs *pKerInitArgs, FFTLIB_bufParams1D_t *bufParamsX, FFTLIB_bufParams1D_t *bufParamsW, FFTLIB_bufParams1D_t *bufParamsY)

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes< FFTLIB_INT32 >
template FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes< FFTLIB_INT32 >(const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs *pKerInitArgs, FFTLIB_bufParams1D_t *bufParamsX, FFTLIB_bufParams1D_t *bufParamsW, FFTLIB_bufParams1D_t *bufParamsY)

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_twGen
FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_twGen(const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs *pKerInitArgs, void *restrict pW, const FFTLIB_bufParams1D_t *bufParamsW)
This is a utility function that generates the DFT computational matrix into the provided buffer.
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX_ci.cpp:143

FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_perfEst
void FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_perfEst(FFTLIB_kernelHandle handle, const FFTLIB_bufParams2D_t *src0_addr, const FFTLIB_bufParams2D_t *src1_addr, const FFTLIB_bufParams2D_t *dst_addr, uint64_t *archCycles, uint64_t *estCycles, int32_t *caseNumber)
This function estimates the cycles consumed for the kernel execution.
Definition: FFTLIB_LINALG_matrixMatrixMultiply_ixX_ixX_oxX_ci.cpp:71

FFTLIB_INT16
@ FFTLIB_INT16
Definition: FFTLIB_bufParams.h:44

FFTLIB_INT32
@ FFTLIB_INT32
Definition: FFTLIB_bufParams.h:45

FFTLIB_sizeof
static int32_t FFTLIB_sizeof(uint32_t type)
Inline function returns number of bytes per element given a type of _FFTLIB_data_type_e.
Definition: FFTLIB_bufParams.h:145

FFTLIB_D64
double FFTLIB_D64
Double precision floating point.
Definition: FFTLIB_types.h:168

FFTLIB_kernelHandle
void * FFTLIB_kernelHandle
Handle type for FFTLIB operations.
Definition: FFTLIB_types.h:217

FFTLIB_STATUS_NAME
FFTLIB_STATUS_NAME
The enumeration of all status codes.
Definition: FFTLIB_types.h:172

FFTLIB_ERR_NOT_IMPLEMENTED
@ FFTLIB_ERR_NOT_IMPLEMENTED
Definition: FFTLIB_types.h:179

FFTLIB_ERR_INVALID_DIMENSION
@ FFTLIB_ERR_INVALID_DIMENSION
Definition: FFTLIB_types.h:177

FFTLIB_SUCCESS
@ FFTLIB_SUCCESS
Definition: FFTLIB_types.h:173

FFTLIB_MMA_SIZE_16_BIT
#define FFTLIB_MMA_SIZE_16_BIT
type is 16-bit integers
Definition: c7100/FFTLIB_types.h:100

FFTLIB_MMA_SIZE_32_BIT
#define FFTLIB_MMA_SIZE_32_BIT
type is 32-bit integers
Definition: c7100/FFTLIB_types.h:104

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes
FFTLIB_STATUS FFTLIB_FFT_dftLarge_ixX_cxX_oxX_getSizes(const FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs *pKerInitArgs, FFTLIB_bufParams1D_t *bufParamsX, FFTLIB_bufParams1D_t *bufParamsW, FFTLIB_bufParams1D_t *bufParamsY)
This is a query function to calculate the sizes of input, output and the DFT computational matrix buf...
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX_ci.cpp:97

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_perfEst
void FFTLIB_FFT_dftLarge_ixX_cxX_oxX_perfEst(FFTLIB_kernelHandle handle, const FFTLIB_bufParams1D_t *bufParamsX, const FFTLIB_bufParams1D_t *bufParamsY, const FFTLIB_bufParams1D_t *bufParamsW, uint32_t fftSize, uint32_t batchSize, uint64_t *archCycles, uint64_t *estCycles)
This is a utility function that gives an estimate of the cycles consumed for the kernel execution.
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX_ci.cpp:53

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs
Structure containing the parameters for DFT computation.
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX.h:118

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs::interleave
uint32_t interleave
Flag to indicate if the real and imaginary parts of data are interleaved or not. A value of 1 indicat...
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX.h:130

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs::batchSize
uint32_t batchSize
Size of the batch in terms of number of channels of DFT's.
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX.h:125

FFTLIB_FFT_dftLarge_ixX_cxX_oxX_InitArgs::fftSize
uint32_t fftSize
Size of each channel's data in terms of number of complex points.
Definition: FFTLIB_FFT_dftLarge_ixX_cxX_oxX.h:123

FFTLIB_bufParams1D_t
A structure for a 1 dimensional buffer descriptor.
Definition: FFTLIB_bufParams.h:83

FFTLIB_bufParams1D_t::data_type
uint32_t data_type
Values are of type FFTLIB_data_type_e.
Definition: FFTLIB_bufParams.h:84

FFTLIB_bufParams1D_t::dim_x
uint32_t dim_x
Width of buffer in X dimension in elements.
Definition: FFTLIB_bufParams.h:86

FFTLIB_bufParams2D_t
A structure for a 2 dimensional buffer descriptor.
Definition: FFTLIB_bufParams.h:92

FFTLIB_bufParams2D_t::dim_y
uint32_t dim_y
Height of buffer in Y dimension in elements.
Definition: FFTLIB_bufParams.h:96

FFTLIB_bufParams2D_t::dim_x
uint32_t dim_x
Width of buffer in X dimension in elements.
Definition: FFTLIB_bufParams.h:95

FFTLIB_bufParams2D_t::stride_y
int32_t stride_y
Stride in Y dimension in bytes.
Definition: FFTLIB_bufParams.h:98

FFTLIB_bufParams2D_t::data_type
uint32_t data_type
Values are of type FFTLIB_data_type_e.
Definition: FFTLIB_bufParams.h:93