C++ AMP programozási nyelv
Memóriakezelés
Memóriakezelés
GPU architektúrája
- Kis cache
- Több száz mag (szál)
- A szálak csoportokba rendeződnek (AMD: warps, NVIDIA: wavefronts), amelyek szekvenciálisan érik el a közös cache-t
- A lokális memóriát 4 óra jel alatt olvasható, a globális 400-600 alatt.
Tile
- A tile-ok segítségével felosztható a feldolgozandó tömb egyenlő méretű területekre.
- Egy-egy tile-t egy warp fog feldolgozni
- A tile méretet ezért érdemes a warp magjainak számának egészszámú többszörösének választani.
- Segítségével egyszerűbb a warp-ok lokális memóriáját kihasználni.