История коммитов

Автор SHA1 Сообщение Дата
  Alex Klinkhamer 48be797ffb llama : expose model's rope_freq_scale in the API (#3418) 2 лет назад
  Jiahao Li f56e1baec3 metal : alibi for arbitrary number of heads (#3426) 2 лет назад
  Eve 017efe899d cmake : make LLAMA_NATIVE flag actually use the instructions supported by the processor (#3273) 2 лет назад
  goerch ff5a3f0c09 Work on the BPE tokenizer (#3252) 2 лет назад
  cebtenzzre 1c84003c08 convert : fix vocab size when not defined in hparams (#3421) 2 лет назад
  cebtenzzre e78f0b0d05 cmake : increase minimum version for add_link_options (#3444) 2 лет назад
  shibe2 665018c749 CLBlast: Add broadcast support for matrix multiplication (#3402) 2 лет назад
  cebtenzzre 29a404a951 gguf : add BERT, MPT, and GPT-J arch info (#3408) 2 лет назад
  cebtenzzre 0fe321031a gguf : general usability improvements (#3409) 2 лет назад
  cebtenzzre 9476b01226 cmake : make CUDA flags more similar to the Makefile (#3420) 2 лет назад
  xaedes a03ce38455 finetune : fix #3404 (#3437) 2 лет назад
  Adrian a847676984 metal : set log callback before initializing (#3427) 2 лет назад
  bandoti 095231dfd3 cmake : fix transient definitions in find pkg (#3411) 2 лет назад
  Kevin Ji ea55295a74 docker : ignore Git files (#3314) 2 лет назад
  vvhg1 c97f01c362 infill : add new example + extend server API (#3296) 2 лет назад
  slaren f5ef5cfb18 ggml-cuda : perform cublas mat mul of quantized types as f16 (#3412) 2 лет назад
  slaren 40e07a60f9 llama.cpp : add documentation about rope_freq_base and scale values (#3401) 2 лет назад
  Georgi Gerganov bc34dd4f5b train : fix KQ_pos allocation (#3392) 2 лет назад
  Cebtenzzre 2777a84be4 llama : quantize up to 31% faster on Linux and Windows with mmap (#3206) 2 лет назад
  BarfingLemurs 0a4a4a0982 readme : update hot topics + model links (#3399) 2 лет назад
  Andrew Duffy 569550df20 readme : add link to grammars app (#3388) 2 лет назад
  Jhen-Jie Hong c71bf2c45c swift : fix build on xcode 15 (#3387) 2 лет назад
  Cebtenzzre bc39553c90 build : enable more non-default compiler warnings (#3200) 2 лет назад
  Hua Jiang 0ccfc62a96 ggml_tensor: update the structure comments. (#3283) 2 лет назад
  Qu Zongfu 7f1a0fe709 ggml : release the requested thread pool resource (#3292) 2 лет назад
  slaren 16bc66d947 llama.cpp : split llama_context_params into model and context params (#3301) 2 лет назад
  Eve 0512d66670 ci : multithreaded builds (#3311) 2 лет назад
  xaedes 0e76a8992c train : finetune LORA (#2632) 2 лет назад
  Cebtenzzre 2db94d98ed gguf : basic type checking in gguf_get_* (#3346) 2 лет назад
  Cebtenzzre ecf90b1a51 gguf : make token scores and types optional (#3347) 2 лет назад