Historial de Commits

Autor SHA1 Mensaje Fecha
  IsaacDynamo b4efd77f8a server : add parse_special option to /tokenize endpoint (#14783) hace 6 meses
  Aman Gupta 2be60cbc27 docs : fix link for tools/perplexity in README.md (#14780) hace 6 meses
  rspOverflow b526ad2668 Documentation: Further revisions to the Vulkan section in build.md (#14785) hace 6 meses
  Aman Gupta 938b785764 Clang-format: local files first + fix BinPacking (#14779) hace 6 meses
  0cc4m 36c153248f Contrib: add 0cc4m as codeowner for Vulkan backend (#14775) hace 6 meses
  Ervin Áron Tasnádi a979ca22db ggml: adds CONV_2D op and direct GEMM Vulkan implementation (#14316) hace 6 meses
  compilade 90083283ec imatrix : use GGUF to store importance matrices (#9400) hace 6 meses
  Peter0x44 d4b91ea7b2 vulkan: Add logging for bf16 features to ggml_vk_print_gpu_info (#13274) (#14707) hace 6 meses
  0cc4m 83f5872404 Vulkan: Fix fprintf format-security warning (#14770) hace 6 meses
  rspOverflow f0d4d176df Documentation: Update build.md's Vulkan section (#14736) hace 6 meses
  Georgi Gerganov b17230917c sync : ggml hace 6 meses
  Georgi Gerganov bf9087f59a metal : fuse add, mul + add tests (#14596) hace 6 meses
  Georgi Gerganov 9fb1042ce6 graph : fix graph reuse reset of params (#14760) hace 6 meses
  Georgi Gerganov 2adf8d83ac parallel : add option for different RNG seeds (#14757) hace 6 meses
  Oliver Simons 021cc28bef cuda : Fix Gemma3n not executed as CUDA_GRAPH on NVGPUs (#14741) hace 6 meses
  Georgi Gerganov d498af3d5a graph : avoid huge warm-up graphs for MoE models (#14753) hace 6 meses
  Georgi Gerganov eacdeb5bfc model : fix build after merge conflict (#14754) hace 6 meses
  lgai-exaone e0cb5c5cb8 model : add EXAONE 4.0 support (#14630) hace 6 meses
  Aman Gupta f9a31eea06 CUDA: set_rows + cpy.cu refactor (#14712) hace 6 meses
  Georgi Gerganov 8f974bc1e9 graph : refactor context to not pass gf explicitly (#14629) hace 6 meses
  Nexes the Elder 09651d09ff graph : Pass the graph placeholder message in debug mode (#14748) hace 6 meses
  Neo Zhang Jianyu 349ea79fce use max work group size for device to replace the magic number (#14732) hace 6 meses
  Piotr Wilkin (ilintar) 670e1360cd convert : fix Ernie4.5 MoE without shared experts (#14746) hace 6 meses
  Wroclaw 760b4484e3 nix : use optionalAttrs for env mkDerivation attrset argument (#14726) hace 6 meses
  Piotr Wilkin (ilintar) cb887f1bc1 model: add Ernie 4.5 MoE support (#14658) hace 6 meses
  Georgi Gerganov d6fb3f6b49 kv-cache : fix k-shift for multiple streams (#14742) hace 6 meses
  Georgi Gerganov 01612b7409 llama : reuse compute graphs (#14482) hace 6 meses
  Tarek Dakhran 086cf81e88 llama : fix parallel processing for lfm2 (#14705) hace 6 meses
  Georgi Gerganov d9b691081c kv-cache : opt mask set input (#14600) hace 6 meses
  Georgi Gerganov ad57d3edd2 batch : fix uninitialized has_cpl flag (#14733) hace 6 meses