Historie revizí

Autor SHA1 Zpráva Datum
  pockers21 fb0471d175 context : do not clear output buffer on reserve (#13152) před 8 měsíci
  Xuan-Son Nguyen d2b2031e5f llama : (mrope) allow using normal 1D position for text token (#13138) před 8 měsíci
  Xuan-Son Nguyen 5fa9e63be8 clip : refactor set input for cgraph + fix qwen2.5vl input (#13136) před 8 měsíci
  Akarshan Biswas a4c340f974 SYCL: Add all missing unary kernels (#13074) před 8 měsíci
  Georgi Gerganov d0a417f3c7 readme : update hot topics (#13150) před 8 měsíci
  Georgi Gerganov 43f2b07193 common : fix noreturn compile warning (#13151) před 8 měsíci
  Xuan-Son Nguyen e5d6c2554e llama-chat : fix typo GML --> GLM (#13143) před 8 měsíci
  R0CKSTAR f0dd6a1926 musa: fix typo in cc control (#13144) před 8 měsíci
  Johannes Gäßler 69699be48a CUDA: fix q_nope_absorbed prec for DS 2 Lite f16 (#13137) před 8 měsíci
  Xuan-Son Nguyen 85f36e5e71 arg : fix unused variable (#13142) před 8 měsíci
  4onen c0a97b762e llama-bench : Add `--override-tensors` arg (#12922) před 9 měsíci
  matteo ced44be342 llama-chat : fix wrong template in GLM4-0414 (#13140) před 9 měsíci
  R0CKSTAR e291450b76 musa: fix build warning (#13129) před 9 měsíci
  LostRuins Concedo 59e991c23c Fixes Qwen2.5VL segfault during inference with https://github.com/ggml-org/llama.cpp/pull/12402 as has_qwen2vl_merger migration was incomplete (#13133) před 9 měsíci
  HimariO ca2bb89eac clip : Add Qwen2.5VL support (#12402) před 9 měsíci
  Xuan-Son Nguyen 2d451c8059 common : add common_remote_get_content (#13123) před 9 měsíci
  Xuan-Son Nguyen 4753791e70 clip : improve projector naming (#13118) před 9 měsíci
  SXX 77d5e9a76a ggml: move fp16/bf16 conversion optimizations to CPU backend + export conversion APIs (#13107) před 9 měsíci
  frob d5fe4e81bd grammar : handle maxItems == 0 in JSON schema (#13117) před 9 měsíci
  Diego Devesa 295354ea68 llama : fix K-shift with quantized K and BLAS backend (#13113) před 9 měsíci
  City 558a764713 Force FP32 compute in GLM4 FFN Down (#13101) před 9 měsíci
  Xuan-Son Nguyen edb18b6e8f clip : fix pixtral on some GPU backends (#13097) před 9 měsíci
  Neo Zhang Jianyu 514c45608f change the reorder tensor from init to execute OP (#13003) před 9 měsíci
  Radoslav Gerganov 553a5c3a9f rpc : do not wait for response when sending RPC_CMD_SET_TENSOR (#12943) před 9 měsíci
  Xuan-Son Nguyen 13be08daf9 clip : remove boi/eoi embeddings for GLM-edge model (#13081) před 9 měsíci
  Georgi Gerganov 226251ed56 embeddings : fix batch sizes (#13076) před 9 měsíci
  Georgi Gerganov 87616f0680 ggml : fix trailing whitespaces (#0) před 9 měsíci
  Georgi Gerganov 63b4911494 sync : ggml před 9 měsíci
  Acly c6e8cc28c1 ggml : Depthwise 2D convolution (ggml/1152) před 9 měsíci
  Johannes Gäßler b10d8bfdb1 CUDA: use switch statements in constexpr functions (#13095) před 9 měsíci