Commit Verlauf

Autor SHA1 Nachricht Datum
  Xuan Son Nguyen 0996c5597f llava : correct args for minicpmv-cli (#9429) vor 1 Jahr
  Xuan Son Nguyen 5bb2c5dbd2 files : remove accidentally added `lora_test` submodule (#9430) vor 1 Jahr
  Farbod Bijary 67155ab7f5 feat: Implements retrying logic for downloading models using --model-url flag (#9255) vor 1 Jahr
  Johannes Gäßler 5af118efda CUDA: fix --split-mode row race condition (#9413) vor 1 Jahr
  Georgi Gerganov d2b496bff4 batched-bench : remove unused code (#9305) vor 1 Jahr
  R0CKSTAR b34e023480 musa: remove Clang builtins mapping (#9421) vor 1 Jahr
  Alberto Cabrera Pérez 51b6038636 sycl : update support conditions (#9394) vor 1 Jahr
  Georgi Gerganov cb9c933eb2 flake.lock: Update (#9360) vor 1 Jahr
  Xuan Son Nguyen 6cd4e03444 arg : bring back missing ifdef (#9411) vor 1 Jahr
  matteo 8d300bd35f enable --special arg for llama-server (#9419) vor 1 Jahr
  slaren 49006c67b4 llama : move random seed generation to the samplers (#9398) vor 1 Jahr
  Georgi Gerganov 00ba2ff781 metal : fix compile warning with GGML_METAL_NDEBUG (#0) vor 1 Jahr
  Daniel Bevenius 83008b7cfe llama : update llm_build_copy_mask_state comment [no ci] (#9385) vor 1 Jahr
  Molly Sophia 0b4ac75772 RWKV v6: Add time_mix_decay_w1/w2 in quant exclusion list (#9387) vor 1 Jahr
  slaren fb3f249815 make : do not run llama-gen-docs when building (#9399) vor 1 Jahr
  Xuan Son Nguyen bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) vor 1 Jahr
  Radoslav Gerganov 293bebe077 rpc : fix segfault with nkvo (#9389) vor 1 Jahr
  Prashant Vithule 5fac4d5764 ggml : vector length agnostic SVE support (#9290) vor 1 Jahr
  slaren 5fb5e24811 llama : minor sampling refactor (2) (#9386) vor 1 Jahr
  Georgi Gerganov 38ca6f644b readme : update hot topics vor 1 Jahr
  Johannes Gäßler 8e6e2fbe14 CUDA: fix variable name conflict for Windows build (#9382) vor 1 Jahr
  Antonis Makropoulos 5ed087573e readme : add LLMUnity to UI projects (#9381) vor 1 Jahr
  Radoslav Gerganov 54f376d0b9 rpc : update README [no ci] (#9320) vor 1 Jahr
  Dan Johansson b2e89a3274 Arm AArch64: Documentation updates (#9321) vor 1 Jahr
  Markus Tavenrath daa9623ab0 Overlap cmdbuffer creation and cmdbuffer execution in Vulkan backend by submitting smaller cmdbuffers early. (#9118) vor 1 Jahr
  Georgi Gerganov e079bffb66 cuda : fix FA Q src index (1 -> 0) (#9374) vor 1 Jahr
  Xuan Son Nguyen 3f7ccfd649 common : bring back missing args, add env var duplication check (#9375) vor 1 Jahr
  slaren a249843d89 common : restore --n-gpu-layers (#9371) vor 1 Jahr
  slaren 19f4a7b296 llama : refactor samplers internal implementation (#9370) vor 1 Jahr
  Neo Zhang Jianyu 2a358fb0c4 [SYCL] add check malloc result on device (#9346) vor 1 Jahr