Benim sorum biraz aşırıya kaçabilir fakat kusura bakmayın

Delphi de yazdığımız kodlarımızı CPU değilde GPU üzerinden çalıştırabilme olanağımız var mıdır ?
Buradaki en önemli husus şu WIN API leri de GPU veya OPENCL C tarafından çalıştırabilir miyiz ?
Amacım işlemleri CPU üzerinden değilde GPU üzerinden çalıştırıp tabiri caizse ışık hızında bir hız kazanmak ?
Örnek olarak veriyorum; BitBlt API'sı bu API kopyalamada biraz yavaş GPU veya OPENCL C, CUDA PhysX, DirectCompute kullanarak bunu hızlandırabilir miyiz ? Yada alternatifler nelerdir ?
(Özellikle grafiksel işlemler için soruyorum...)