프로세서

코어 벤치마크

이 표의 벤치마크 결과는 싱글 코어에 대한 것입니다. 멀티코어 성능은 디바이스 벤치마크를 참조하십시오.

프로세서 코어
C66x DSP 코어
C674x DSP 코어
ARM® Cortex®-A15
사용된 하드웨어 플랫폼 C6657 EVM C6748 LCDK AM5728 EVM
벤치마킹된 코어를 사용하는 장치

C66x DSP

66AK2x DSP

Sitara AM57x SoC

OMAP-L138

C6748

66AK2x DSP

Sitara AM57x SoC

벤치마킹된 기능 C66x 실행 시간 C674x 실행 시간 ARM Cortex-A15 실행 시간2 관련된 TI 라이브러리
C66x 사이클 C66x μS @ 1GHz C674x 사이클 C674x μS @ 456Mhz Cortex-A15 사이클 Cortex-A15 μS @ 1GHz2
복소 FFT(256pt) - SP 부동 소수점1 1782 1.78 2401 5.27 8644 8.64 DSPLIB
복소 FFT(1kpt) - SP 부동 소수점1 6269 6.27 10950 24.01 43916 43.92 DSPLIB
실수 블록 FIR - 고정 소수점 128개 샘플, 계수 16 262 0.26 386 0.85 2152 2.15 DSPLIB
실수 블록 FIR - SP 부동 소수점 128개 샘플, 계수 16 1345 1.35 1406 3.08 6971 6.97 DSPLIB
실수 블록 FIR - SP 부동 소수점 256개 샘플, 계수 16 2625 2.63 2735 6 13879 13.88 DSPLIB
복소 블록 FIR - SP 부동 소수점 64개 샘플, 계수 16 1334 1.33 2221 4.87 13039 13.04 DSPLIB
복소 블록 FIR - SP 부동 소수점 128개 샘플, 계수 16 2646 2.65 4397 9.64 26072 26.07 DSPLIB
실수 행렬 SGEMM 16x16 2405 2.41 3505 7.69 14662 14.66 DSPLIB
복소 행렬 SGEMM 16x16 4113 4.11 10884 23.87 26388 26.39 DSPLIB
행렬 수학 DGEMM 16x16 5061 5.06
no
no
14669 14.67 DSPLIB
자동 상관 - 부동 소수점 N=32, IMG_corr_3x3_i16s_c16s 140 0.14 189 0.41 946 0.95 IMGLIB
ArcTan2 - SP 부동 소수점 24 0.02 31 0.07 49 0.05 MATHLIB
Log10 - 단일 정밀도 14 0.01 18 0.04 56 0.06 MATHLIB
제곱근 - 단일 정밀 부동 소수점 6 0.01 6 0.01 5 0.01 MATHLIB

모든 벤치마크 결과는 L2 SRAM에 있는 데이터를 사용하여 측정되었습니다.

1  벤치마크한 C66x FFT 코드는 L2 메모리를 사용한 FFTLIB의 FFT 커널 코드를 최적화한 버전입니다.

2  A15 벤치마크는 OCMC RAM의 데이터를 사용합니다. 데이터 및 프로그램 캐시가 사용되었습니다. ARM Neon 최적화에 사용된 컴파일러 플래그는 -mfpu = vfpv4 –mfloat-abi = hard -03입니다. A15 출력은 정확도와 정밀도가 검증되지 않았습니다. 직접 작성된 인트린직은 코드에 사용되지 않았습니다

이러한 차트는 위 벤치마크 정보를 기반으로 선택된 루틴에 대한 상대적 코어 성능을 나타냅니다.

C66x DSP 코어와 C674x DSP 코어의 성능을 비교한 아래 차트의 경우 C674x의 성능을 1로 정규화했습니다. 표시된 C66x 코어의 성능은 C674x에 상대적인 것입니다. 이 비교는 프로세서 속도를 감안한 것입니다.

TI DSP 벤치마킹 애플리케이션 노트를 다운로드하여 TI 하드웨어에서 이러한 벤치마크를 재현하는 방법을 알아보십시오.

C66x DSP 코어와 C674x DSP 코어의 성능 비교

* 복소 FFT, 1k개 포인트, 단일 정밀도, 부동 소수점.
** 복소 블록 FIR, 단일 정밀도, 부동 소수점, 128개 샘플, 계수 16.
*** 복소 행렬 SGEMM 16x16.

C66x DSP 코어, C674x DSP 코어와 Arm®Cortex®-A15 코어의 성능을 비교한 아래 차트의 경우 Cortex®-A15의 성능을 1로 정규화했습니다. C66x 코어 성능과 C674x 코어 성능은 Cortex®-A15에 상대적으로 표시됩니다. 이 비교는 프로세서 속도를 감안한 것입니다.

C66x DSP 코어, C674x DSP 코어 및 Arm® Cortex®-A15 코어의 성능 비교

* 복소 FFT, 1k개 포인트, 단일 정밀도, 부동 소수점.
** 복소 블록 FIR, 단일 정밀도, 부동 소수점, 128개 샘플, 계수 16.
*** 복소 행렬 SGEMM 16x16.