Commit History

Auteur SHA1 Bericht Datum
  MaggotHATE bcdb7a2386 server: (web UI) Add samplers sequence customization (#10255) 1 jaar geleden
  Georgi Gerganov f245cc28d4 scripts : fix missing key in compare-llama-bench.py (#10332) 1 jaar geleden
  Jeff Bolz 772703c8ff vulkan: Optimize some mat-vec mul quant shaders (#10296) 1 jaar geleden
  FirstTimeEZ dd3a6ce9f8 vulkan : add cmake preset debug/release (#10306) 1 jaar geleden
  Dan Johansson 1e58ee1318 ggml : optimize Q4_0 into Q4_0_X_Y repack (#10324) 1 jaar geleden
  FirstTimeEZ 89e4caaaf0 llama : save number of parameters and the size in llama_model (#10286) 1 jaar geleden
  Srihari-mcw 74d73dc85c Make updates to fix issues with clang-cl builds while using AVX512 flags (#10314) 1 jaar geleden
  Johannes Gäßler 4047be74da scripts: update compare-llama-bench.py (#10319) 1 jaar geleden
  slaren 883d206fbd ggml : fix some build issues 1 jaar geleden
  Georgi Gerganov 09ecbcb596 cmake : fix ppc64 check (whisper/0) 1 jaar geleden
  thewh1teagle 3225008973 ggml : vulkan logs (whisper/2547) 1 jaar geleden
  Georgi Gerganov cbf5541a82 sync : ggml 1 jaar geleden
  Eve 18429220bd AVX BF16 and single scale quant optimizations (#10212) 1 jaar geleden
  R0CKSTAR f0204a0ec7 ci: build test musa with cmake (#10298) 1 jaar geleden
  Romain Biessy 57f8355b29 sycl: Update Intel docker images to use DPC++ 2025.0 (#10305) 1 jaar geleden
  Xuan Son Nguyen 9901068ac7 server : (web UI) add copy button for code block, fix api key (#10242) 1 jaar geleden
  Chenguang Li 231f9360d9 cann: dockerfile and doc adjustment (#10302) 1 jaar geleden
  Georgi Gerganov 4802ad350b scripts : fix regex in sync [no ci] 1 jaar geleden
  Romain Biessy 5a54af4d4f sycl: Use syclcompat::dp4a (#10267) 1 jaar geleden
  Charles Xu 1607a5e5b0 backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (#9921) 1 jaar geleden
  Diego Devesa ae8de6d50a ggml : build backends as libraries (#10256) 1 jaar geleden
  Johannes Gäßler 4a8ccb37ad CUDA: no -sm row for very small matrices (#10185) 1 jaar geleden
  Georgi Gerganov 2a82891a85 speculative : fix out-of-bounds access (#10289) 1 jaar geleden
  Jeff Bolz af148c9386 vulkan: Optimize binary ops (#10270) 1 jaar geleden
  Jeff Bolz 66798e42fb vulkan: Use macros to make the mat mul pipeline creation more concise (#10259) 1 jaar geleden
  Michael Podvitskiy fb4a0ec083 llama : propagate the results of `graph_compute` (#9525) 1 jaar geleden
  Georgi Gerganov 5ea926dad7 sync : ggml 1 jaar geleden
  Small Grass Forest 1ee9eea094 docs : update bindings list (#10261) 1 jaar geleden
  Alexey Parfenov ff7fb670d0 server : add missing docs (#10269) 1 jaar geleden
  Jhen-Jie Hong 0e712a5acb server : fix incorrect res in validate_model_chat_template (#10272) 1 jaar geleden