Changes

Happy Valley

226 bytes added, 08:52, 9 April 2018

→‎Assignment 3

==== Switching to shared memory ====

VISUAL PROFILER suggested few ideas for optimization:

- Concurrent Kernel Execution

- Low Memcpy/Compute Overlap

Concurrent Kernel Execution can let CUDA programmers launch several kernels asynchronously. Unfortunately

''' Source Code '''

68

edits