Converting fixed float type into template type for TensorContraction.

2024-12-15 07:10:37 +08:00 · 2017-02-24 18:13:30 +00:00 · 2017-02-24 18:13:30 +00:00 · 0b7875f137
commit 0b7875f137
parent 89dfd51fae
1 changed files with 4 additions and 4 deletions
--- a/unsupported/Eigen/CXX11/src/Tensor/TensorContractionSycl.h
+++ b/unsupported/Eigen/CXX11/src/Tensor/TensorContractionSycl.h
@ -230,13 +230,13 @@ typename HostExpr::Index LocalThreadSizeM, typename HostExpr::Index LocalThreadS
      const Index nGroupId = itemID.get_group(1); // Work-group ID localCol
      const Index linearLocalThreadId = nLocalThreadId*LocalThreadSizeM + mLocalThreadId; // linear local thread ID
      // Allocate register space
-      float privateLhs;
+      LhsScalar privateLhs;
-      float privateRhs[WorkLoadPerThreadN];
+      RhsScalar privateRhs[WorkLoadPerThreadN];
-      float privateRes[WorkLoadPerThreadM][WorkLoadPerThreadN];
+      OutScalar privateRes[WorkLoadPerThreadM][WorkLoadPerThreadN];
      // Initialise the privateResumulation registers
      for (Index wLPTM=0; wLPTM<WorkLoadPerThreadM; wLPTM++) {
          for (Index wLPTN=0; wLPTN<WorkLoadPerThreadN; wLPTN++) {
-              privateRes[wLPTM][wLPTN] = 0.0f;
+              privateRes[wLPTM][wLPTN] = static_cast<OutScalar>(0);
          }
      }