Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov deb7dfca4b gguf : add ftype meta info to the model (#2710) před 2 roky
  Kawrakow bac66994cf Quantization imrovements for k_quants (#2707) před 2 roky
  slaren 519c981f8b embedding : evaluate prompt in batches (#2713) před 2 roky
  slaren 1123f7fbdf ggml-cuda : use graph allocator (#2684) před 2 roky
  Georgi Gerganov ef3f333d37 ggml : sync latest (SAM + SD operators, CUDA alibi) (#2709) před 2 roky
  slaren 8e4364f2af llama-bench : minor fixes (#2695) před 2 roky
  Kylin 1e3bc523d8 ggml : support CUDA's half type for aarch64(#1455) (#2670) před 2 roky
  Shouzheng Liu 14b1d7e6f7 metal : add missing barriers for mul-mat (#2699) před 2 roky
  Jhen-Jie Hong 226255b44e server : fallback to default if client param is null (#2688) před 2 roky
  Kerfuffle 930523c8e1 Fix convert-llama-ggmlv3-to-gguf.py vocab conversion (#2698) před 2 roky
  Georgi Gerganov c8dba409e6 py : remove obsolete script před 2 roky
  Georgi Gerganov 6381d4e110 gguf : new file format with flexible meta data (beta) (#2398) před 2 roky
  Shouzheng Liu dadbed99e6 metal : fix synchronization in new matrix multiplication kernel (#2686) před 2 roky
  Kawrakow cb1c0727bd HellaSwag: split token evaluation into batches if needed (#2681) před 2 roky
  slaren 9e232f0234 ggml : move all type info to ggml_type_traits (#2663) před 2 roky
  Kawrakow 5e9ff54a67 More efficient Hellaswag implementation (#2677) před 2 roky
  Georgi Gerganov 1f0bccb279 server : better default prompt (#2646) před 2 roky
  Jhen-Jie Hong f63564adfa server : update xxd usage for older versions compatibility (#2649) před 2 roky
  Adrian 2d8b76a110 Add link to clojure bindings to Readme. (#2659) před 2 roky
  Georgi Gerganov 7af633aec3 readme : incoming BREAKING CHANGE před 2 roky
  slaren 097e121e2f llama : add benchmark example (#2626) před 2 roky
  mdrokz eaf98c2649 readme : add link to Rust bindings (#2656) před 2 roky
  Georgi Gerganov e9b12c332e perplexity : more meaningful ETA number - 2 decimal points před 2 roky
  Evan Jones 604b8bdfa6 Fix unicode in grammars (fixes #2501) (#2553) před 2 roky
  staviq 10151bee2e server : support for saving templates in browser LocalStorage (#2486) před 2 roky
  Johannes Gäßler 0992a7b8b1 README: fix LLAMA_CUDA_MMV_Y documentation (#2647) před 2 roky
  Henri Vasserman 6ddeefad9b [Zig] Fixing Zig build and improvements (#2554) před 2 roky
  Kerfuffle 8dae7ce684 Add --cfg-negative-prompt-file option for examples (#2591) před 2 roky
  Georgi Gerganov a73ccf1aa3 llama : replace (permute + reshape + view_1d) with (view_3d) (#2538) před 2 roky
  drbh 7cf54e1f74 tests : adds simple llama grammar tests (#2618) před 2 roky