История коммитов

Автор SHA1 Сообщение Дата
  Johannes Gäßler e81b8e4b7f llama: use FA + max. GPU layers by default (#15434) 4 месяцев назад
  Johannes Gäßler 38ad381f9f CUDA: use FP32 arithmetic for conv2d (#15683) 4 месяцев назад
  Jeff Bolz 696fccf354 vulkan: Skip syncing for prealloc_y when it is reused (#15544) 4 месяцев назад
  Chenguang Li ef476916bb CANN: FIx compiler warnings (#15661) 4 месяцев назад
  Sergey Alirzaev d82f6aa34a server : removed obsolete doc (#15670) 4 месяцев назад
  Johannes Gäßler 3d16b29c3b scripts: strip "AMD Instinct" from GPU name (#15668) 4 месяцев назад
  ExtReMLapin 792b44f2ed server : add documentation for `parallel_tool_calls` param (#15647) 4 месяцев назад
  Aman Gupta 81017865ee CUDA: fix bug in rms_norm fusion (#15660) 4 месяцев назад
  Piotr Wilkin (ilintar) 60e5eee31f chat : Seed OSS thinking + tool call support (#15552) 4 месяцев назад
  Aman Gupta 009b709d6e CUDA: fuse adds, fuse add with rms norm (#15631) 4 месяцев назад
  Gabe Goodhart e8d99dd0b6 nvidia nemotron nano v2 (nemotronh) (#15507) 4 месяцев назад
  Gabe Goodhart a8bca68f72 fix: Compute the full sum in llama-eval-callback, not just the sum of printed values (#15637) 4 месяцев назад
  mnehete32 c97dc09391 CUDA: add conv2d (#15635) 4 месяцев назад
  Aaron Teo 6c442f42ff ggml-cpu: fix invalid hsum build in debug s390x (#15634) 4 месяцев назад
  compilade 73804145ab ggml : fix SSM_SCAN for n_groups > 1 (#15625) 4 месяцев назад
  Georgi Gerganov c8d0d14e77 kv-cache : fix find_slot to not search for continuous slot (#15638) 4 месяцев назад
  Sigbjørn Skjæret 84ab83cc0b model : jina-embeddings-v3 support (#13693) 4 месяцев назад
  Aman Gupta 55042b3692 scripts: add sqlite3 check for compare-commits.sh (#15633) 4 месяцев назад
  Georgi Gerganov 8a4280ce43 kv-cache : remove LLAMA_SET_ROWS checks (#15505) 4 месяцев назад
  Aleksei Nikiforov 64387f6e95 gguf-py: byteswapping improvements (#12851) 4 месяцев назад
  Joshua Cogliati d35a1e8c41 cli : change log to warning to explain reason for stopping (#15604) 4 месяцев назад
  Daniel Bevenius 46d9caa27a model-conversion : add mmproj conversion target (#15628) 4 месяцев назад
  matiaslin 5a0e3ef6f0 cuda: Add cublasLt_static linking when GGML_STATIC is enabled (#15622) 4 месяцев назад
  Johannes Gäßler fbef0fad7a server: higher timeout for tests (#15621) 4 месяцев назад
  Georgi Gerganov da54f9f1a2 presets : add qwen3-30B-a3b FIM (#15616) 4 месяцев назад
  uvos 47373271f9 HIP: Enable support for ggml_backend_cuda_register_host_buffer (#15615) 4 месяцев назад
  Georgi Gerganov 1bded5a3b3 kv-cache : better estimate of n_kv for multi-sequence batches (#15610) 4 месяцев назад
  Chenguang Li 1e7489745a CANN: refactor mask handling and improve performance in FA (#15561) 4 месяцев назад
  xctan 1cf123a343 ggml-cpu : add basic RVV support for vector f32 ops (#15057) 4 месяцев назад
  Daniel Bevenius fcca2182a1 common : add -m to bash completion for --model [no ci] (#15591) 4 месяцев назад