eigen/AVX512_2TypeCasting_8h_source.html

 // This file is part of Eigen, a lightweight C++ template library

 // for linear algebra.

 //

 // Copyright (C) 2019 Rasmus Munk Larsen <rmlarsen@google.com>

 //

 // This Source Code Form is subject to the terms of the Mozilla

 // Public License v. 2.0. If a copy of the MPL was not distributed

 // with this file, You can obtain one at http://mozilla.org/MPL/2.0/.


 #ifndef EIGEN_TYPE_CASTING_AVX512_H

 #define EIGEN_TYPE_CASTING_AVX512_H


 #include "../../InternalHeaderCheck.h"


 namespace Eigen {


 namespace internal {


 template <>

 struct type_casting_traits<float, bool> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 1

   };

 };


 template <>

 struct type_casting_traits<bool, float> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 1

   };

 };


 template<> EIGEN_STRONG_INLINE Packet16b pcast<Packet16f, Packet16b>(const Packet16f& a) {

   __mmask16 mask = _mm512_cmpneq_ps_mask(a, pzero(a));

   return _mm512_maskz_cvtepi32_epi8(mask, _mm512_set1_epi32(1));

 }


 template<> EIGEN_STRONG_INLINE Packet16f pcast<Packet16b, Packet16f>(const Packet16b& a) {

   return _mm512_cvtepi32_ps(_mm512_and_si512(_mm512_cvtepi8_epi32(a), _mm512_set1_epi32(1)));

 }


 template<> EIGEN_STRONG_INLINE Packet16i pcast<Packet16f, Packet16i>(const Packet16f& a) {

   return _mm512_cvttps_epi32(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16f pcast<Packet16i, Packet16f>(const Packet16i& a) {

   return _mm512_cvtepi32_ps(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16f pcast<Packet8d, Packet16f>(const Packet8d& a, const Packet8d& b) {

   return  cat256(_mm512_cvtpd_ps(a), _mm512_cvtpd_ps(b));

 }


 template<> EIGEN_STRONG_INLINE Packet16i pcast<Packet8d, Packet16i>(const Packet8d& a, const Packet8d& b) {

   return  cat256i(_mm512_cvttpd_epi32(a), _mm512_cvttpd_epi32(b));

 }


 template<> EIGEN_STRONG_INLINE Packet8i pcast<Packet8d, Packet8i>(const Packet8d& a) {

   return _mm512_cvtpd_epi32(a);

 }

 template<> EIGEN_STRONG_INLINE Packet8f pcast<Packet8d, Packet8f>(const Packet8d& a) {

   return _mm512_cvtpd_ps(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16i preinterpret<Packet16i, Packet16f>(const Packet16f& a) {

   return _mm512_castps_si512(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16f preinterpret<Packet16f, Packet16i>(const Packet16i& a) {

   return _mm512_castsi512_ps(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8d preinterpret<Packet8d, Packet16f>(const Packet16f& a) {

   return _mm512_castps_pd(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16f preinterpret<Packet16f, Packet8d>(const Packet8d& a) {

   return _mm512_castpd_ps(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8f preinterpret<Packet8f, Packet16f>(const Packet16f& a) {

   return _mm512_castps512_ps256(a);

 }


 template<> EIGEN_STRONG_INLINE Packet4f preinterpret<Packet4f, Packet16f>(const Packet16f& a) {

   return _mm512_castps512_ps128(a);

 }


 template<> EIGEN_STRONG_INLINE Packet4d preinterpret<Packet4d, Packet8d>(const Packet8d& a) {

   return _mm512_castpd512_pd256(a);

 }


 template<> EIGEN_STRONG_INLINE Packet2d preinterpret<Packet2d, Packet8d>(const Packet8d& a) {

   return _mm512_castpd512_pd128(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16f preinterpret<Packet16f, Packet8f>(const Packet8f& a) {

   return _mm512_castps256_ps512(a);

 }


 template<> EIGEN_STRONG_INLINE Packet16f preinterpret<Packet16f, Packet4f>(const Packet4f& a) {

   return _mm512_castps128_ps512(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8d preinterpret<Packet8d, Packet4d>(const Packet4d& a) {

   return _mm512_castpd256_pd512(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8d preinterpret<Packet8d, Packet2d>(const Packet2d& a) {

   return _mm512_castpd128_pd512(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8i preinterpret<Packet8i, Packet16i>(const Packet16i& a) {

   return _mm512_castsi512_si256(a);

 }

 template<> EIGEN_STRONG_INLINE Packet4i preinterpret<Packet4i, Packet16i>(const Packet16i& a) {

   return _mm512_castsi512_si128(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8h preinterpret<Packet8h, Packet16h>(const Packet16h& a) {

   return _mm256_castsi256_si128(a);

 }


 template<> EIGEN_STRONG_INLINE Packet8bf preinterpret<Packet8bf, Packet16bf>(const Packet16bf& a) {

   return _mm256_castsi256_si128(a);

 }


 #ifndef EIGEN_VECTORIZE_AVX512FP16


 template <>

 struct type_casting_traits<half, float> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 1

   };

 };


 template<> EIGEN_STRONG_INLINE Packet16f pcast<Packet16h, Packet16f>(const Packet16h& a) {

   return half2float(a);

 }


 template <>

 struct type_casting_traits<float, half> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 1

   };

 };


 template<> EIGEN_STRONG_INLINE Packet16h pcast<Packet16f, Packet16h>(const Packet16f& a) {

   return float2half(a);

 }


 #endif


 template <>

 struct type_casting_traits<bfloat16, float> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 1

   };

 };


 template<> EIGEN_STRONG_INLINE Packet16f pcast<Packet16bf, Packet16f>(const Packet16bf& a) {

   return Bf16ToF32(a);

 }


 template <>

 struct type_casting_traits<float, bfloat16> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 1

   };

 };


 template<> EIGEN_STRONG_INLINE Packet16bf pcast<Packet16f, Packet16bf>(const Packet16f& a) {

   return F32ToBf16(a);

 }


 #ifdef EIGEN_VECTORIZE_AVX512FP16


 template <>

 struct type_casting_traits<half, float> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 1,

     TgtCoeffRatio = 2

   };

 };


 template <>

 struct type_casting_traits<float, half> {

   enum {

     VectorizedCast = 1,

     SrcCoeffRatio = 2,

     TgtCoeffRatio = 1

   };

 };


 template<> EIGEN_STRONG_INLINE Packet16h preinterpret<Packet16h, Packet32h>(const Packet32h& a) {

   return _mm256_castpd_si256(_mm512_extractf64x4_pd(_mm512_castph_pd(a), 0));

 }

 template<> EIGEN_STRONG_INLINE Packet8h preinterpret<Packet8h, Packet32h>(const Packet32h& a) {

   return _mm256_castsi256_si128(preinterpret<Packet16h>(a));

 }


 template <>

 EIGEN_STRONG_INLINE Packet16f pcast<Packet32h, Packet16f>(const Packet32h& a) {

   // Discard second-half of input.

   Packet16h low = _mm256_castpd_si256(_mm512_extractf64x4_pd(_mm512_castph_pd(a), 0));

   return _mm512_cvtxph_ps(_mm256_castsi256_ph(low));

 }


 template <>

 EIGEN_STRONG_INLINE Packet32h pcast<Packet16f, Packet32h>(const Packet16f& a, const Packet16f& b) {

   __m512d result = _mm512_undefined_pd();

   result = _mm512_insertf64x4(result, _mm256_castsi256_pd(_mm512_cvtps_ph(a, _MM_FROUND_TO_NEAREST_INT|_MM_FROUND_NO_EXC)), 0);

   result = _mm512_insertf64x4(result, _mm256_castsi256_pd(_mm512_cvtps_ph(b, _MM_FROUND_TO_NEAREST_INT|_MM_FROUND_NO_EXC)), 1);

   return _mm512_castpd_ph(result);

 }


 template <>

 EIGEN_STRONG_INLINE Packet8f pcast<Packet16h, Packet8f>(const Packet16h& a) {

   // Discard second-half of input.

   Packet8h low = _mm_castps_si128(_mm256_extractf32x4_ps(_mm256_castsi256_ps(a), 0));

   return _mm256_cvtxph_ps(_mm_castsi128_ph(low));

 }


 template <>

 EIGEN_STRONG_INLINE Packet16h pcast<Packet8f, Packet16h>(const Packet8f& a, const Packet8f& b) {

   __m256d result = _mm256_undefined_pd();

   result = _mm256_insertf64x2(result, _mm_castsi128_pd(_mm256_cvtps_ph(a, _MM_FROUND_TO_NEAREST_INT|_MM_FROUND_NO_EXC)), 0);

   result = _mm256_insertf64x2(result, _mm_castsi128_pd(_mm256_cvtps_ph(b, _MM_FROUND_TO_NEAREST_INT|_MM_FROUND_NO_EXC)), 1);

   return _mm256_castpd_si256(result);

 }


 template <>

 EIGEN_STRONG_INLINE Packet4f pcast<Packet8h, Packet4f>(const Packet8h& a) {

   Packet8f full = _mm256_cvtxph_ps(_mm_castsi128_ph(a));

   // Discard second-half of input.

   return _mm256_extractf32x4_ps(full, 0);

 }


 template <>

 EIGEN_STRONG_INLINE Packet8h pcast<Packet4f, Packet8h>(const Packet4f& a, const Packet4f& b) {

   __m256 result = _mm256_undefined_ps();

   result = _mm256_insertf128_ps(result, a, 0);

   result = _mm256_insertf128_ps(result, b, 1);

   return _mm256_cvtps_ph(result, _MM_FROUND_TO_NEAREST_INT|_MM_FROUND_NO_EXC);

 }


 #endif


 } // end namespace internal


 } // end namespace Eigen


 #endif // EIGEN_TYPE_CASTING_AVX512_H

a
ArrayXXi a
Definition: Array_initializer_list_23_cxx11.cpp:1

b
Array< int, 3, 1 > b
Definition: Array_variadic_ctor_cxx11.cpp:2

bool

Eigen::internal::Packet2d
v2f64 Packet2d
Definition: MSA/PacketMath.h:820

Eigen::internal::preinterpret< Packet8i, Packet16i >
Packet8i preinterpret< Packet8i, Packet16i >(const Packet16i &a)
Definition: AVX512/TypeCasting.h:117

Eigen::internal::pzero
Packet8f pzero(const Packet8f &)
Definition: AVX/PacketMath.h:677

Eigen::internal::Packet4i
__vector int Packet4i
Definition: AltiVec/PacketMath.h:33

Eigen::internal::preinterpret< Packet4d, Packet8d >
Packet4d preinterpret< Packet4d, Packet8d >(const Packet8d &a)
Definition: AVX512/TypeCasting.h:93

Eigen::internal::preinterpret< Packet8f, Packet16f >
Packet8f preinterpret< Packet8f, Packet16f >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:85

Eigen::internal::pcast< Packet16bf, Packet16f >
Packet16f pcast< Packet16bf, Packet16f >(const Packet16bf &a)
Definition: AVX512/TypeCasting.h:171

Eigen::internal::F32ToBf16
Packet8bf F32ToBf16(Packet4f p4f)
Definition: AltiVec/PacketMath.h:1675

Eigen::internal::pcast< Packet16i, Packet16f >
Packet16f pcast< Packet16i, Packet16f >(const Packet16i &a)
Definition: AVX512/TypeCasting.h:50

Eigen::internal::preinterpret< Packet8h, Packet16h >
Packet8h preinterpret< Packet8h, Packet16h >(const Packet16h &a)
Definition: AVX512/TypeCasting.h:124

Eigen::internal::pcast< Packet16f, Packet16bf >
Packet16bf pcast< Packet16f, Packet16bf >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:184

Eigen::internal::Packet8d
__m512d Packet8d
Definition: AVX512/PacketMath.h:35

Eigen::internal::Bf16ToF32
Packet8f Bf16ToF32(const Packet8bf &a)
Definition: AVX/PacketMath.h:2098

Eigen::internal::Packet16b
eigen_packet_wrapper< __m128i, 1 > Packet16b
Definition: SSE/PacketMath.h:50

Eigen::internal::preinterpret< Packet4f, Packet16f >
Packet4f preinterpret< Packet4f, Packet16f >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:89

Eigen::internal::preinterpret< Packet4i, Packet16i >
Packet4i preinterpret< Packet4i, Packet16i >(const Packet16i &a)
Definition: AVX512/TypeCasting.h:120

Eigen::internal::pcast< Packet16h, Packet16f >
Packet16f pcast< Packet16h, Packet16f >(const Packet16h &a)
Definition: AVX512/TypeCasting.h:143

Eigen::internal::Packet16bf
eigen_packet_wrapper< __m256i, 2 > Packet16bf
Definition: AVX512/PacketMath.h:39

Eigen::internal::preinterpret< Packet8bf, Packet16bf >
Packet8bf preinterpret< Packet8bf, Packet16bf >(const Packet16bf &a)
Definition: AVX512/TypeCasting.h:128

Eigen::internal::preinterpret< Packet16f, Packet8f >
Packet16f preinterpret< Packet16f, Packet8f >(const Packet8f &a)
Definition: AVX512/TypeCasting.h:101

Eigen::internal::pcast< Packet8d, Packet8f >
Packet8f pcast< Packet8d, Packet8f >(const Packet8d &a)
Definition: AVX512/TypeCasting.h:65

Eigen::internal::preinterpret< Packet16f, Packet4f >
Packet16f preinterpret< Packet16f, Packet4f >(const Packet4f &a)
Definition: AVX512/TypeCasting.h:105

Eigen::internal::Packet8bf
eigen_packet_wrapper< __vector unsigned short int, 0 > Packet8bf
Definition: AltiVec/PacketMath.h:41

Eigen::internal::float2half
Packet8h float2half(const Packet8f &a)
Definition: AVX/PacketMath.h:1848

Eigen::internal::pcast< Packet8d, Packet8i >
Packet8i pcast< Packet8d, Packet8i >(const Packet8d &a)
Definition: AVX512/TypeCasting.h:62

Eigen::internal::pcast< Packet8d, Packet16f >
Packet16f pcast< Packet8d, Packet16f >(const Packet8d &a, const Packet8d &b)
Definition: AVX512/TypeCasting.h:54

Eigen::internal::half2float
Packet8f half2float(const Packet8h &a)
Definition: AVX/PacketMath.h:1838

Eigen::internal::Packet16i
__m512i Packet16i
Definition: AVX512/PacketMath.h:34

Eigen::internal::pcast< Packet16b, Packet16f >
Packet16f pcast< Packet16b, Packet16f >(const Packet16b &a)
Definition: AVX512/TypeCasting.h:42

Eigen::internal::preinterpret< Packet8d, Packet4d >
Packet8d preinterpret< Packet8d, Packet4d >(const Packet4d &a)
Definition: AVX512/TypeCasting.h:109

Eigen::internal::Packet8i
eigen_packet_wrapper< __m256i, 0 > Packet8i
Definition: AVX/PacketMath.h:34

Eigen::internal::preinterpret< Packet16f, Packet8d >
Packet16f preinterpret< Packet16f, Packet8d >(const Packet8d &a)
Definition: AVX512/TypeCasting.h:81

Eigen::internal::pcast< Packet16f, Packet16b >
Packet16b pcast< Packet16f, Packet16b >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:37

Eigen::internal::cat256i
Packet16i cat256i(Packet8i a, Packet8i b)
Definition: AVX512/PacketMath.h:569

Eigen::internal::cat256
Packet16f cat256(Packet8f a, Packet8f b)
Definition: AVX512/PacketMath.h:565

Eigen::internal::pcast< Packet16f, Packet16i >
Packet16i pcast< Packet16f, Packet16i >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:46

Eigen::internal::preinterpret< Packet8d, Packet16f >
Packet8d preinterpret< Packet8d, Packet16f >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:77

Eigen::internal::preinterpret< Packet8d, Packet2d >
Packet8d preinterpret< Packet8d, Packet2d >(const Packet2d &a)
Definition: AVX512/TypeCasting.h:113

Eigen::internal::preinterpret< Packet16f, Packet16i >
Packet16f preinterpret< Packet16f, Packet16i >(const Packet16i &a)
Definition: AVX512/TypeCasting.h:73

Eigen::internal::preinterpret< Packet16i, Packet16f >
Packet16i preinterpret< Packet16i, Packet16f >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:69

Eigen::internal::preinterpret< Packet2d, Packet8d >
Packet2d preinterpret< Packet2d, Packet8d >(const Packet8d &a)
Definition: AVX512/TypeCasting.h:97

Eigen::internal::pcast< Packet16f, Packet16h >
Packet16h pcast< Packet16f, Packet16h >(const Packet16f &a)
Definition: AVX512/TypeCasting.h:156

Eigen::internal::Packet4f
__vector float Packet4f
Definition: AltiVec/PacketMath.h:32

Eigen::internal::Packet8f
__m256 Packet8f
Definition: AVX/PacketMath.h:33

Eigen::internal::Packet16h
eigen_packet_wrapper< __m256i, 1 > Packet16h
Definition: AVX512/PacketMath.h:37

Eigen::internal::Packet32h
__m512h Packet32h
Definition: PacketMathFP16.h:19

Eigen::internal::Packet4d
__m256d Packet4d
Definition: AVX/PacketMath.h:35

Eigen::internal::pcast< Packet8d, Packet16i >
Packet16i pcast< Packet8d, Packet16i >(const Packet8d &a, const Packet8d &b)
Definition: AVX512/TypeCasting.h:58

Eigen::internal::Packet8h
eigen_packet_wrapper< __m128i, 2 > Packet8h
Definition: AVX/PacketMath.h:37

Eigen::internal::Packet16f
__m512 Packet16f
Definition: AVX512/PacketMath.h:33

Eigen
: InteropHeaders
Definition: Core:139

internal
Definition: Eigen_Colamd.h:50

Eigen::bfloat16
Definition: BFloat16.h:100

Eigen::half
Definition: Half.h:142