Commit Verlauf

Autor SHA1 Nachricht Datum
  Taikono-Himazin 41a11aaf99 ggml : increased GGML_MAX_PARAMS to allow finetuning of 70b models (#4424) vor 2 Jahren
  Yueh-Po Peng 8a7b2fa528 Update README.md (#4388) vor 2 Jahren
  Xiang (Kevin) Li e18f7345a3 grammar : revert the replacement of llama_token_to_piece with id_to_token (#4396) vor 2 Jahren
  Georgi Gerganov fe680e3d10 sync : ggml (new ops, tests, backend, etc.) (#4359) vor 2 Jahren
  Georgi Gerganov bcc0eb4591 llama : per-layer KV cache + quantum K cache (#4309) vor 2 Jahren
  Hongyu Ouyang 81bc9214a3 train : fix #4227 (double free in examples/train-text-from-scratch/train-text-from-scratch.cpp) (#4351) vor 2 Jahren
  Georgi Gerganov 05cd6e5036 server : recognize cache_prompt parameter in OAI API (#4347) vor 2 Jahren
  Georgi Gerganov caa9249217 common : fix compile warning vor 2 Jahren
  stduhpf da5eaef1f3 speculative : support `--color` (#4343) vor 2 Jahren
  Marcus Dunn 5f6e0c0dff grammar : pre-computed pieces + reserve mem + less string copies (#4330) vor 2 Jahren
  Kerfuffle 5aa365d88f llama : allow overriding GGUF metadata when loading model (#4092) vor 2 Jahren
  MaggotHATE 52c8bc3cf3 sampling : custom samplers order (#4285) vor 2 Jahren
  kchro3 e4b76bbe31 swift : revert compiler checks for swift package (#4332) vor 2 Jahren
  Daniel Bevenius 23b5e12eb5 simple : update error message for KV cache check (#4324) vor 2 Jahren
  Miwa / Ensan d208995c6d swift : fix concatenation method to avoid invalid UTF8 stringfication (#4325) vor 2 Jahren
  Miwa / Ensan 5c9f90cba1 swift : fix prompt tokenization logic (#4321) vor 2 Jahren
  Ikko Eltociear Ashimine 4fa44e84ad grammar-parser : fix typo (#4318) vor 2 Jahren
  Georgi Gerganov fbbc42827b ggml : reuse ggml_get_n_tasks() in ggml_graph_plan() (#4308) vor 2 Jahren
  Georgi Gerganov adf3de4f69 ggml : fix soft max out-of-bounds access (#4307) vor 2 Jahren
  Ed Lee 33e171d1e9 server : fix OpenAI API `stop` field to be optional (#4299) vor 2 Jahren
  Rickard Edén 6949b50df5 py : add grammar to oai like api (#4294) vor 2 Jahren
  Georgi Gerganov d7b800b8bc llama : pad KV cache size (#4280) vor 2 Jahren
  Georgi Gerganov 5a7d3125e7 llama : avoid using "optional" keyword (#4283) vor 2 Jahren
  Georgi Gerganov d5a1cbde60 llama : support optional tensors (#4283) vor 2 Jahren
  Miwa / Ensan b220222a64 swift : fix token_to_piece implementation (#4278) vor 2 Jahren
  Jared Van Bortel 511f52c334 build : enable libstdc++ assertions for debug builds (#4275) vor 2 Jahren
  CausalLM 03562f3a86 llama : support attention bias on LLaMA architecture (#4283) vor 2 Jahren
  Shijie 37c746d687 llama : add Qwen support (#4281) vor 2 Jahren
  Georgi Gerganov 880f57973b llama : fix integer overflow during quantization (#4284) vor 2 Jahren
  Daniel Bevenius 8d6d9f033b py : add requirements file for convert-hf-to-gguf.py (#4277) vor 2 Jahren