Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov c10704d01e llama : fix MPI threads (close #2827) hace 2 años
  Olivier Chafik 230d46c723 examples : update llama2.c converter to read vocab and write models in GGUF format (#2751) hace 2 años
  Kawrakow 463173a6c0 llama : speedup tokenization (#2831) hace 2 años
  Georgi Gerganov eaa13a48ff falcon : fix CUDA inference by making K and Q contiguous (#2830) hace 2 años
  Georgi Gerganov da7455d046 readme : fix headings hace 2 años
  Georgi Gerganov 25423e9185 scripts : helper convert script hace 2 años
  Kawrakow a6d1189fdd k_quants tuning for Falcon-7b (#2816) hace 2 años
  Georgi Gerganov c48c5bb0b0 readme : update hot topics hace 2 años
  Georgi Gerganov d0cee0d36d gguf : add 64-bit support (GGUF v2) (#2821) hace 2 años
  Georgi Gerganov edd4c14817 llama : more tokenizer fixes (#2810) hace 2 años
  Przemysław Pawełczyk 1591e2e590 ggml : detect SSSE3 (#2825) hace 2 años
  slaren 789c8c945a ci : add LoRA test to CI (#2650) hace 2 años
  Bruce MacDonald c1ac54b77a server : add `/detokenize` endpoint (#2802) hace 2 años
  Kerfuffle 730d9c681e convert.py : advanced option (#2753) hace 2 años
  Tim Miller c7d92e6dfe llama : use Unicode Escape Sequence to replace encoded characters (#2814) hace 2 años
  Tungsten842 61d1a2895e flake.nix : add rocm support and cleanup (#2808) hace 2 años
  Cebtenzzre 741ca7dd1c llama : move #includes out of _GNU_SOURCE conditional (#2817) hace 2 años
  Dr. Tom Murphy VII Ph.D 72f895c923 main : fix bug (penalize_nl=false doesn't work) + suppress warning on mingw (#1528) hace 2 años
  Cebtenzzre 50526f37eb llama : use std::abs in llama_sample_tail_free (#2800) hace 2 años
  Georgi Gerganov 04f4b1eb10 k-quants : remove unnecessary tensor shape restrictions (#2811) hace 2 años
  Kawrakow 7592375403 Better perplexity for 2- and 3-bit quantization for LLaMA-v2-70B (#2807) hace 2 años
  Kawrakow 771551a793 Fix HellaSwag (#2805) hace 2 años
  Volodymyr Vitvitskyi f305bad11e flake : build llama.cpp on Intel with nix (#2795) hace 2 años
  Nigel Bosch a2ca4e9de9 Handle null rope scaling value (#2793) hace 2 años
  klosax 2ba83c8685 Fix spm whitespaces (#2806) hace 2 años
  lon bae5c5f679 examples : skip unnecessary external lib in server README.md how-to (#2804) hace 2 años
  Marcus Dunn 232caf3c15 llama : fix struct decl (#2790) hace 2 años
  Kawrakow d046dcee08 Faster perplexity computation (#2786) hace 2 años
  Matt Pulver c82742ac9c llama : add llama_beam_search() (#2267) hace 2 años
  Nigel Bosch 28b2c996ca convert.py : Get rope scale from HuggingFace models (#2772) hace 2 años