Historie revizí

Autor SHA1 Zpráva Datum
  agray3 928e0b7013 Reset schedule earlier to allow overlap with ggml graph computation on device (#6933) před 1 rokem
  Dave Airlie e931888d50 ggml : fix calloc argument ordering. (#6820) před 1 rokem
  Georgi Gerganov b9cc76d87e ggml : fix ggml_backend_cpu_supports_op() for CPY (#0) před 1 rokem
  slaren 280345968d cuda : rename build flag to LLAMA_CUDA (#6299) před 1 rokem
  slaren 5e1b7f94a0 backend : set max split inputs to GGML_MAX_SRC (#6137) před 1 rokem
  slaren 2bf8d0f7c4 backend : offload large batches to GPU (#6083) před 1 rokem
  slaren f30ea47a87 llama : add pipeline parallelism support (#6017) před 1 rokem
  Michael Podvitskiy 9fa2627347 ggml : introduce ggml_status (ggml/750) před 1 rokem
  UEXTM.com 5f70671856 Introduce backend GUIDs (ggml/743) před 1 rokem
  Kawrakow bd2d4e393b 1.5 bit quantization (#5453) před 1 rokem
  Georgi Gerganov 8f1be0d42f ggml : add ALiBi support for ggml_soft_max_ext (#5488) před 1 rokem
  Ananta Bastola 6e4e973b26 ci : add an option to fail on compile warning (#3952) před 1 rokem
  AT f5ca054855 Early return for zero size calls to get_tensor. (#5482) před 1 rokem
  Georgi Gerganov 3b169441df sync : ggml (#5452) před 1 rokem
  Michael Podvitskiy 4633d93af0 ggml : add abort_callback for cpu backend (ggml/725) před 1 rokem
  Jared Van Bortel fbf1ddec69 Nomic Vulkan backend (#4456) před 2 roky
  0cc4m 2307523d32 ggml : add Vulkan backend (#2059) před 2 roky
  Abhilash Majumder 0f648573dd ggml : add unified SYCL backend for Intel GPUs (#2690) před 2 roky
  slaren 62fead3ea0 cuda : fix tensor size calculation for non-split buffer (#5145) před 2 roky
  slaren 6df465a91d llama : run all KQV ops on the CPU with no KV offload (#5049) před 2 roky
  Georgi Gerganov 38566680cd ggml : add IQ2 to test-backend-ops + refactoring (#4990) před 2 roky
  Georgi Gerganov 44a1a4a41a backend : add eval callback (#4935) před 2 roky
  Justine Tunney a0b3ac8c48 ggml : introduce GGML_CALL function annotation (#4850) před 2 roky
  slaren fa5c1fb44a backend_sched : fix assignments před 2 roky
  slaren e7e4df031b llama : ggml-backend integration (#4766) před 2 roky
  Finn Voorhees 1bf681f90e ggml : add error handling to graph_compute (whisper/1714) před 2 roky
  bssrdf afc8c19291 ggml : fix some mul mat cases + add tests for src1 F16 (ggml/669) před 2 roky
  slaren 5bf3953d7e cuda : improve cuda pool efficiency using virtual memory (#4606) před 2 roky
  slaren d232aca5a7 llama : initial ggml-backend integration (#4520) před 2 roky
  Georgi Gerganov fe680e3d10 sync : ggml (new ops, tests, backend, etc.) (#4359) před 2 roky