llama.cpp

Files

T

Oliver Simons b1a5bd4e0c CUDA: better coalesce data-access for contiguous concat (#22330 )

Also, distribute all elements across CTAs evenly instead of launching
one CTA per dim

2026-04-26 09:21:45 +02:00

2026-04-09 16:42:19 +02:00

2026-04-15 15:58:40 +02:00

2026-04-26 09:21:45 +02:00

.gitignore

2024-07-13 18:12:39 +02:00

CMakeLists.txt

2026-04-23 02:34:31 +02:00