Commit History

Автор SHA1 Съобщение Дата
  Guoteng ce32060198 llama : support InternLM2 (#5184) преди 2 години
  Eve 1cfb5372cf Fix broken Vulkan Cmake (properly) (#5230) преди 2 години
  Georgi Gerganov d3bac7d584 llama : reorder build_orion() at correct place (#5118) преди 2 години
  Georgi Gerganov 5cb04dbc16 llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240) преди 2 години
  Georgi Gerganov efb7bdbbd0 metal : add im2col F32 dst support (#5132) преди 2 години
  JidongZhang-THU 15606309a0 llava : add MobileVLM support (#5132) преди 2 години
  Neo Zhang Jianyu b2b9f025e7 format license text, restore apache license by legal suggestion (#5233) преди 2 години
  slaren dabcc5b471 ggml : limit n_threads to the max n_tasks (#5238) преди 2 години
  0cc4m f8e9140cb4 Vulkan Fixes (#5223) преди 2 години
  Yiming Cui d62520eb2c Fix typos of IQ2_XXS and IQ3_XXS in llama.cpp (#5231) преди 2 години
  Neo Zhang Jianyu 01684139c3 support SYCL backend windows build (#5208) преди 2 години
  Jared Van Bortel e8dc55d006 kompute : llama-bench support and ggml_cpu_has_kompute() (#5226) преди 2 години
  Georgi Gerganov e0085fdf7c Revert "server : change deps.sh xxd files to string literals (#5221)" преди 2 години
  Georgi Gerganov e6f291d158 server : fix context shift (#5195) преди 2 години
  JohnnyB 4003be0e5f server : change deps.sh xxd files to string literals (#5221) преди 2 години
  Kawrakow fea4fd4ba7 ggml : fix IQ3_XXS on Metal (#5219) преди 2 години
  Georgi Gerganov 8f8ddfcfad sync : ggml (#0) преди 2 години
  Georgi Gerganov 6fb50ebbf0 gguf : fix comparison (ggml/715) преди 2 години
  John Balis 625a699b54 `ggml_cuda_cpy` support for 4d tensors and float16->float32 upcasting (ggml/686) преди 2 години
  Georgi Gerganov a4b07c057a gguf : add input validation, prevent integer overflows (ggml/709) преди 2 години
  Georgi Gerganov 549a1e6cd5 ci : fix yolo URLs + fix metal capture (ggml/712) преди 2 години
  Jack Mousseau 5f14ee0b0c metal : add debug capture backend function (ggml/694) преди 2 години
  Kawrakow 8e14e3ddb3 Faster AVX2 dot product for IQ2_XS (#5187) преди 2 години
  Kawrakow f4d7e54974 SOTA 3-bit quants (#5196) преди 2 години
  0cc4m 2256f36b79 Vulkan Windows APU Memory Handling (#5199) преди 2 години
  Vladimir Malyutin 7359016c7c quantize : fix typo (#5211) преди 2 години
  divinity76 813416991a main : allow empty --prompt-cache file (#5176) преди 2 години
  Romain Neutron 5589921ef8 readme : minor (#5204) преди 2 години
  Georgi Gerganov 49f44b5c55 readme : update hot topics преди 2 години
  Wu Jian Ping 6685cc41c2 server : improve README (#5209) преди 2 години