Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov 223c25a72f server : improve infill context reuse (#9894) hace 1 año
  MaggotHATE fbc98b748e sampling : add XTC sampler (#9742) hace 1 año
  Georgi Gerganov dcdd535302 server : update preact (#9895) hace 1 año
  Michał Tuszyński 4c42f93b22 readme : update bindings list (#9889) hace 1 año
  VoidIsVoid a89f75e1b7 server : handle "logprobs" field with false value (#9871) hace 1 año
  agray3 13dca2a54a Vectorize load instructions in dmmv f16 CUDA kernel (#9816) hace 1 año
  Georgi Gerganov d4c19c0f5c server : accept extra_context for the infill endpoint (#9874) hace 1 año
  Georgi Gerganov c7181bd294 server : reuse cached context chunks (#9866) hace 1 año
  Georgi Gerganov 92be9f1216 flake.lock: Update (#9870) hace 1 año
  Georgi Gerganov edc265661c server : add option to time limit the generation phase (#9865) hace 1 año
  Georgi Gerganov 1bde94dd02 server : remove self-extend features (#9860) hace 1 año
  Georgi Gerganov 95c76e8e92 server : remove legacy system_prompt feature (#9857) hace 1 año
  Georgi Gerganov 11ac9800af llama : improve infill support and special token detection (#9798) hace 1 año
  R0CKSTAR 943d20b411 musa : update doc (#9856) hace 1 año
  Diego Devesa 96776405a1 ggml : move more prints to the ggml log system (#9839) hace 1 año
  Diego Devesa 7eee341bee common : use common_ prefix for common library functions (#9805) hace 1 año
  Diego Devesa 0e9f760eb1 rpc : add backend registry / device interfaces (#9812) hace 1 año
  R0CKSTAR cf8e0a3bb9 musa: add docker image support (#9685) hace 1 año
  Diego Devesa c7499c557c examples : do not use common library in simple example (#9803) hace 1 año
  Diego Devesa c81f3bbb05 cmake : do not build common library by default when standalone (#9804) hace 1 año
  Georgi Gerganov e7022064ab perplexity : fix integer overflow (#9783) hace 1 año
  Georgi Gerganov 3dc48fe75a examples : remove llama.vim hace 1 año
  Diego Devesa dca1d4b58a ggml : fix BLAS with unsupported types (#9775) hace 1 año
  Xuan Son Nguyen 458367a906 server : better security control for public deployments (#9776) hace 1 año
  standby24x7 fa42aa6d89 scripts : fix spelling typo in messages and comments (#9782) hace 1 año
  Diego Devesa 6374743747 ggml : add backend registry / device interfaces to BLAS backend (#9752) hace 1 año
  Andrew Minh Nguyen f1af42fa8c Update building for Android (#9672) hace 1 año
  Georgi Gerganov 6279dac039 flake.lock: Update (#9753) hace 1 año
  Georgi Gerganov d5ac8cf2f2 ggml : add metal backend registry / device (#9713) hace 1 año
  Paul Tsochantaris 96b6912103 metal : single allocation of encode_async block (#9747) hace 1 año