Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov 1f63e75f3b metal : use less stack memory in FA kernel (#14088) před 7 měsíci
  Georgi Gerganov 40cbf571c9 kv-cache : fix shift and defrag logic (#14081) před 7 měsíci
  Diego Devesa 7f4fbe5183 llama : allow building all tests on windows when not using shared libs (#13980) před 8 měsíci
  xctan f470bc36be ggml-cpu : split arch-specific implementations (#13892) před 8 měsíci
  Diego Devesa 8f47e25f56 cuda : fix device sync on buffer clear (#14033) před 8 měsíci
  Georgi Gerganov 201b31dc2e graph : fix geglu (#14077) před 8 měsíci
  Xinpeng Dou e21d2d4ae2 CANN: Simplify the environment variable setting(#13104) před 8 měsíci
  R0CKSTAR dc0623fddb webui: fix sidebar being covered by main content (#14082) před 8 měsíci
  Georgi Gerganov 87d34b381d server : fix LRU check (#14079) před 8 měsíci
  Nicolò Scipione b460d16ae8 sycl: Add reorder to Q6_K mmvq implementation (#13885) před 8 měsíci
  Đinh Trọng Huy 91a8ee6a6f add geglu activation function (#14074) před 8 měsíci
  Yuanhao Ji 056eb74534 CANN: Enable labeler for Ascend NPU (#13914) před 8 měsíci
  Diego Devesa 247e5c6e44 cuda : fix buffer type check with integrated GPUs (#14069) před 8 měsíci
  吴小白 5787b5da57 ci: add LoongArch cross-compile build (#13944) před 8 měsíci
  Akarshan Biswas 228f34c9ce SYCL: Implement few same quantized type copy kernels (#13739) před 8 měsíci
  Sigbjørn Skjæret 0974ad7a7c llama : fix llama_model_chat_template with template name (LLM_KV with suffix) (#14050) před 8 měsíci
  Georgi Gerganov 745aa5319b llama : deprecate llama_kv_self_ API (#14030) před 8 měsíci
  Georgi Gerganov 487a5e0401 context : fix SWA-related warning for multiple sequences (#14045) před 8 měsíci
  Sigbjørn Skjæret d17a809ef0 llama : support multiple classifier outputs and labels (#13940) před 8 měsíci
  Sigbjørn Skjæret 1caae7fc6c gguf-py : add add_classifier_output_labels method to writer (#14031) před 8 měsíci
  Masato Nakasaka 669c13e0f6 vulkan: Enable VK_KHR_cooperative_matrix extension for Intel Xe2 GPUs (#14001) před 8 měsíci
  pockers21 146b88e8b3 ci: fix CUDA build failure on autodl cloud machines (#14005) před 8 měsíci
  Georgi Gerganov 7f37b6cf1e memory : migrate from llama_kv_cache to more generic llama_memory (#14006) před 8 měsíci
  Diego Devesa 3a077146a4 llama : allow using mmap without PrefetchVirtualMemory, apply GGML_WIN_VER to llama.cpp sources (#14013) před 8 měsíci
  Olexandr88 d01d112abb readme : add badge (#13938) před 8 měsíci
  Sigbjørn Skjæret 9f47fa5792 vocab : warn about missing mask token (#14022) před 8 měsíci
  Georgi Gerganov 9e31bec4fd context : fix pos_min initialization upon error decode (#14008) před 8 měsíci
  Jeff Bolz 5a8ae3053c vulkan: automatically deduce size of push constants (#13936) před 8 měsíci
  Ervin Áron Tasnádi 0d3984424f ggml-vulkan: adds support for op CONV_TRANSPOSE_1D (#13813) před 8 měsíci
  Georgi Gerganov 3e63a58ef7 kv-cache : refactor the update/defrag mechanism (#13988) před 8 měsíci