Historial de Commits

Autor SHA1 Mensaje Fecha
  Xuan Son Nguyen 6b91b1e0a9 docker : add build for SYCL, Vulkan + update readme (#5228) hace 2 años
  Meng, Hengyu e805f0fa99 [SYCL] get MAX_MEM_ALLOC from device property (#5270) hace 2 años
  Neo Zhang Jianyu af3ba5d946 [SYCL] update guide of SYCL backend (#5254) hace 2 años
  Ian Bull e1e721094d llama : fix memory leak in llama_batch_free (#5252) hace 2 años
  Neo Zhang Jianyu 128dcbd3c9 add --no-mmap in llama-bench (#5257) hace 2 años
  0cc4m 4d0924a890 Vulkan Phi Fix for AMD Proprietary Drivers (#5260) hace 2 años
  slaren 8ca511cade cuda : fix LLAMA_CUDA_F16 (#5262) hace 2 años
  Ali Nehzat d71ac90985 make : generate .a library for static linking (#5205) hace 2 años
  Guoteng ce32060198 llama : support InternLM2 (#5184) hace 2 años
  Eve 1cfb5372cf Fix broken Vulkan Cmake (properly) (#5230) hace 2 años
  Georgi Gerganov d3bac7d584 llama : reorder build_orion() at correct place (#5118) hace 2 años
  Georgi Gerganov 5cb04dbc16 llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240) hace 2 años
  Georgi Gerganov efb7bdbbd0 metal : add im2col F32 dst support (#5132) hace 2 años
  JidongZhang-THU 15606309a0 llava : add MobileVLM support (#5132) hace 2 años
  Neo Zhang Jianyu b2b9f025e7 format license text, restore apache license by legal suggestion (#5233) hace 2 años
  slaren dabcc5b471 ggml : limit n_threads to the max n_tasks (#5238) hace 2 años
  0cc4m f8e9140cb4 Vulkan Fixes (#5223) hace 2 años
  Yiming Cui d62520eb2c Fix typos of IQ2_XXS and IQ3_XXS in llama.cpp (#5231) hace 2 años
  Neo Zhang Jianyu 01684139c3 support SYCL backend windows build (#5208) hace 2 años
  Jared Van Bortel e8dc55d006 kompute : llama-bench support and ggml_cpu_has_kompute() (#5226) hace 2 años
  Georgi Gerganov e0085fdf7c Revert "server : change deps.sh xxd files to string literals (#5221)" hace 2 años
  Georgi Gerganov e6f291d158 server : fix context shift (#5195) hace 2 años
  JohnnyB 4003be0e5f server : change deps.sh xxd files to string literals (#5221) hace 2 años
  Kawrakow fea4fd4ba7 ggml : fix IQ3_XXS on Metal (#5219) hace 2 años
  Georgi Gerganov 8f8ddfcfad sync : ggml (#0) hace 2 años
  Georgi Gerganov 6fb50ebbf0 gguf : fix comparison (ggml/715) hace 2 años
  John Balis 625a699b54 `ggml_cuda_cpy` support for 4d tensors and float16->float32 upcasting (ggml/686) hace 2 años
  Georgi Gerganov a4b07c057a gguf : add input validation, prevent integer overflows (ggml/709) hace 2 años
  Georgi Gerganov 549a1e6cd5 ci : fix yolo URLs + fix metal capture (ggml/712) hace 2 años
  Jack Mousseau 5f14ee0b0c metal : add debug capture backend function (ggml/694) hace 2 años