Writing a performance-portable matrix multiplication

First Page		Document Content
Date: 2016-01-27 04:16:13 Parallel computing GPGPU Numerical linear algebra Computational science Programming paradigms OpenCL General-purpose computing on graphics processing units Basic Linear Algebra Subprograms Automatic vectorization Compute kernel Kernel Matrix multiplication algorithm		Writing a performance-portable matrix multiplication Add to Reading List Source URL: www.des.udc.es Download Document from Source Website File Size: 445,49 KB Share Document on Facebook

	Writing a performance-portable matrix multiplication DocID: 1p8i5 - View Document
	Journal of Instruction-Level ParallelismSubmitted 6/07; published 6/08 Dynamic Parallelization and Vectorization of Binary Executables on Hierarchical Platforms DocID: 1fArT - View Document
	Transparent Parallelization of Binary Code Benoît Pradelle Alain Ketterlin Philippe Clauss DocID: 17wGi - View Document
	Optimization opportunities based on the polyhedral model in GRAPHITE How much impact has GRAPHITE already? Tobias Grosser University of Passau DocID: 14Zbg - View Document
	The Thermoflow60 Finite-Element Program Ulrich Wepler 1, Dieter an Mey2, Thomas Haarmann3, Wolfgang Koschel4 1) German Aerospace Center (DLRCenter for Computing and Communication, Aachen University (RWTH) DocID: 13wiM - View Document