История коммитов

Автор SHA1 Сообщение Дата
  Maximilian Winter 52ee4540c0 examples : add pydantic models to GBNF grammar generator (#4883) 2 лет назад
  Johannes Gäßler 3fe81781e3 CUDA: faster q8_0 -> f16 dequantization (#4895) 2 лет назад
  slaren e7e4df031b llama : ggml-backend integration (#4766) 2 лет назад
  Georgi Gerganov 584d674be6 llama : remove redundant assert for StableLM (#4901) 2 лет назад
  Daniel Bevenius 930f907d3e export-lora : use LLAMA_FILE_MAGIC_GGLA (#4894) 2 лет назад
  Zay e790eef21c llama.swiftui : update models layout (#4826) 2 лет назад
  Georgi Gerganov 5537d9d36b gitignore : imatrix 2 лет назад
  Johannes Gäßler 1b280c9fff CUDA: fix softmax compile for old CUDA versions (#4862) 2 лет назад
  Georgi Gerganov 3cabe80630 llama : fix typo "imp_embd" -> "inp_embd" 2 лет назад
  howlger 4315a94366 common : streamline the formatting of help (#4890) 2 лет назад
  Georgi Gerganov 2d00741e12 py : fix lint (#4889) 2 лет назад
  Georgi Gerganov f445c0e68c llama : fix llm_build_k_shift to use correct n_rot (#4889) 2 лет назад
  Kawrakow 326b418b59 Importance Matrix calculation (#4861) 2 лет назад
  Georgi Gerganov 1d118386fe server : fix infill when prompt is empty (#4833) 2 лет назад
  Georgi Gerganov 7edefbd79c main : better name for variable n_print (#4874) 2 лет назад
  Georgi Gerganov 3ca63b4538 main : disable token count by default (#4874) 2 лет назад
  Georgi Gerganov b037787548 swift : track ggml release branch (#4867) 2 лет назад
  Kawrakow 469e75d0a3 llama : restore intended k-quants mixes for MoE models (#4872) 2 лет назад
  Kawrakow 49662cbed3 ggml : SOTA 2-bit quants (add IQ2_XS) (#4856) 2 лет назад
  Georgi Gerganov 3ba5b8ca8e swift : pin ggml commit + remove ggml.h from spm-headers (#4878) 2 лет назад
  Laura 4330bd83fe server : implement credentialed CORS (#4514) 2 лет назад
  Michael Coppola 27379455c3 server : support for multiple api keys (#4864) 2 лет назад
  Behnam M eab6795006 server : add `LOG_INFO` when model is successfully loaded (#4881) 2 лет назад
  Someone d8d90aa343 ci: nix-flake-update: new token with pr permissions (#4879) 2 лет назад
  pudepiedj 43f76bf1c3 main : print total token count and tokens consumed so far (#4874) 2 лет назад
  Isaac McFadyen 2f043328e3 server : fix typo in model name (#4876) 2 лет назад
  Paul Tsochantaris 2a7c94db5f metal : put encoder debug group behind a define (#4873) 2 лет назад
  Georgi Gerganov 64802ec00d sync : ggml 2 лет назад
  Georgi Gerganov 3267c2abc7 metal : fix deprecation warning (ggml/690) 2 лет назад
  Timothy Cronin f85a973aa1 ggml : remove ggml_cpy_inplace and ggml_cont_inplace (ggml/693) 2 лет назад