Historie revizí

Autor SHA1 Zpráva Datum
  Kylin 1e3bc523d8 ggml : support CUDA's half type for aarch64(#1455) (#2670) před 2 roky
  Shouzheng Liu 14b1d7e6f7 metal : add missing barriers for mul-mat (#2699) před 2 roky
  Jhen-Jie Hong 226255b44e server : fallback to default if client param is null (#2688) před 2 roky
  Kerfuffle 930523c8e1 Fix convert-llama-ggmlv3-to-gguf.py vocab conversion (#2698) před 2 roky
  Georgi Gerganov c8dba409e6 py : remove obsolete script před 2 roky
  Georgi Gerganov 6381d4e110 gguf : new file format with flexible meta data (beta) (#2398) před 2 roky
  Shouzheng Liu dadbed99e6 metal : fix synchronization in new matrix multiplication kernel (#2686) před 2 roky
  Kawrakow cb1c0727bd HellaSwag: split token evaluation into batches if needed (#2681) před 2 roky
  slaren 9e232f0234 ggml : move all type info to ggml_type_traits (#2663) před 2 roky
  Kawrakow 5e9ff54a67 More efficient Hellaswag implementation (#2677) před 2 roky
  Georgi Gerganov 1f0bccb279 server : better default prompt (#2646) před 2 roky
  Jhen-Jie Hong f63564adfa server : update xxd usage for older versions compatibility (#2649) před 2 roky
  Adrian 2d8b76a110 Add link to clojure bindings to Readme. (#2659) před 2 roky
  Georgi Gerganov 7af633aec3 readme : incoming BREAKING CHANGE před 2 roky
  slaren 097e121e2f llama : add benchmark example (#2626) před 2 roky
  mdrokz eaf98c2649 readme : add link to Rust bindings (#2656) před 2 roky
  Georgi Gerganov e9b12c332e perplexity : more meaningful ETA number - 2 decimal points před 2 roky
  Evan Jones 604b8bdfa6 Fix unicode in grammars (fixes #2501) (#2553) před 2 roky
  staviq 10151bee2e server : support for saving templates in browser LocalStorage (#2486) před 2 roky
  Johannes Gäßler 0992a7b8b1 README: fix LLAMA_CUDA_MMV_Y documentation (#2647) před 2 roky
  Henri Vasserman 6ddeefad9b [Zig] Fixing Zig build and improvements (#2554) před 2 roky
  Kerfuffle 8dae7ce684 Add --cfg-negative-prompt-file option for examples (#2591) před 2 roky
  Georgi Gerganov a73ccf1aa3 llama : replace (permute + reshape + view_1d) with (view_3d) (#2538) před 2 roky
  drbh 7cf54e1f74 tests : adds simple llama grammar tests (#2618) před 2 roky
  Shouzheng Liu a872a2b28e ggml-alloc : fix discrepency between measure&eval (#2639) před 2 roky
  Kolen Cheung 0919a0f73d cmake : install ggml-meta.metal if LLAMA_METAL (#2449) před 2 roky
  Jhen-Jie Hong ed53db86c3 metal : print error of load pipeline state (#2564) před 2 roky
  Shouzheng Liu fc8ef549e5 metal : enable ggml-alloc (#2627) před 2 roky
  Shouzheng Liu bf83bff674 metal : matrix-matrix multiplication kernel (#2615) před 2 roky
  Georgi Gerganov b5ffb2849d scripts : add helper script to get wikitext před 2 roky