Georgi Gerganov
|
f55538c3cc
metal : fix memory leak (#2762)
|
há 2 anos atrás |
Cebtenzzre
|
ebcee207b6
quantize : make output filename optional again (#2823)
|
há 2 anos atrás |
JohnnyB
|
3e8ff47af6
devops : added systemd units and set versioning to use date. (#2835)
|
há 2 anos atrás |
Georgi Gerganov
|
103cfafc77
gguf : fix strings to not be null-terminated (#2839)
|
há 2 anos atrás |
Georgi Gerganov
|
c10704d01e
llama : fix MPI threads (close #2827)
|
há 2 anos atrás |
Olivier Chafik
|
230d46c723
examples : update llama2.c converter to read vocab and write models in GGUF format (#2751)
|
há 2 anos atrás |
Kawrakow
|
463173a6c0
llama : speedup tokenization (#2831)
|
há 2 anos atrás |
Georgi Gerganov
|
eaa13a48ff
falcon : fix CUDA inference by making K and Q contiguous (#2830)
|
há 2 anos atrás |
Georgi Gerganov
|
da7455d046
readme : fix headings
|
há 2 anos atrás |
Georgi Gerganov
|
25423e9185
scripts : helper convert script
|
há 2 anos atrás |
Kawrakow
|
a6d1189fdd
k_quants tuning for Falcon-7b (#2816)
|
há 2 anos atrás |
Georgi Gerganov
|
c48c5bb0b0
readme : update hot topics
|
há 2 anos atrás |
Georgi Gerganov
|
d0cee0d36d
gguf : add 64-bit support (GGUF v2) (#2821)
|
há 2 anos atrás |
Georgi Gerganov
|
edd4c14817
llama : more tokenizer fixes (#2810)
|
há 2 anos atrás |
Przemysław Pawełczyk
|
1591e2e590
ggml : detect SSSE3 (#2825)
|
há 2 anos atrás |
slaren
|
789c8c945a
ci : add LoRA test to CI (#2650)
|
há 2 anos atrás |
Bruce MacDonald
|
c1ac54b77a
server : add `/detokenize` endpoint (#2802)
|
há 2 anos atrás |
Kerfuffle
|
730d9c681e
convert.py : advanced option (#2753)
|
há 2 anos atrás |
Tim Miller
|
c7d92e6dfe
llama : use Unicode Escape Sequence to replace encoded characters (#2814)
|
há 2 anos atrás |
Tungsten842
|
61d1a2895e
flake.nix : add rocm support and cleanup (#2808)
|
há 2 anos atrás |
Cebtenzzre
|
741ca7dd1c
llama : move #includes out of _GNU_SOURCE conditional (#2817)
|
há 2 anos atrás |
Dr. Tom Murphy VII Ph.D
|
72f895c923
main : fix bug (penalize_nl=false doesn't work) + suppress warning on mingw (#1528)
|
há 2 anos atrás |
Cebtenzzre
|
50526f37eb
llama : use std::abs in llama_sample_tail_free (#2800)
|
há 2 anos atrás |
Georgi Gerganov
|
04f4b1eb10
k-quants : remove unnecessary tensor shape restrictions (#2811)
|
há 2 anos atrás |
Kawrakow
|
7592375403
Better perplexity for 2- and 3-bit quantization for LLaMA-v2-70B (#2807)
|
há 2 anos atrás |
Kawrakow
|
771551a793
Fix HellaSwag (#2805)
|
há 2 anos atrás |
Volodymyr Vitvitskyi
|
f305bad11e
flake : build llama.cpp on Intel with nix (#2795)
|
há 2 anos atrás |
Nigel Bosch
|
a2ca4e9de9
Handle null rope scaling value (#2793)
|
há 2 anos atrás |
klosax
|
2ba83c8685
Fix spm whitespaces (#2806)
|
há 2 anos atrás |
lon
|
bae5c5f679
examples : skip unnecessary external lib in server README.md how-to (#2804)
|
há 2 anos atrás |