Historial de Commits

Autor SHA1 Mensaje Fecha
  Justine Tunney 36e5a08b20 llava-cli : don't crash if --image flag is invalid (#4835) hace 2 años
  Georgi Gerganov 4dccb38d9a metal : improve dequantize precision to match CPU (#4836) hace 2 años
  Georgi Gerganov 9a818f7c42 scripts : improve get-pg.sh (#4838) hace 2 años
  iohub 18adb4e9bb readme : add 3rd party collama reference to UI list (#4840) hace 2 años
  Georgi Gerganov d9653894df scripts : script to get Paul Graham essays in txt format (#4838) hace 2 años
  Behnam M 128de3585b server : update readme about token probs (#4777) hace 2 años
  Zsapi 8c58330318 server : add api-key flag to documentation (#4832) hace 2 años
  Georgi Gerganov 18c2e1752c ggml : fix vld1q_s8_x4 32-bit compat (#4828) hace 2 años
  Johannes Gäßler 8f900abfc0 CUDA: faster softmax via shared memory + fp16 math (#4742) hace 2 años
  howlger 1fc2f265ff common : fix the short form of `--grp-attn-w`, not `-gat` (#4825) hace 2 años
  Georgi Gerganov a9a8c5de3d readme : add link to SOTA models hace 2 años
  Kawrakow dd5ae06405 SOTA 2-bit quants (#4773) hace 2 años
  Georgi Gerganov 668b31fc7d swift : exclude ggml-metal.metal from the package (#4822) hace 2 años
  Georgi Gerganov 42ea63c5a3 llama.swiftui : update readme hace 2 años
  Georgi Gerganov 52531fdff8 main : add self-extend support (#4815) hace 2 años
  Georgi Gerganov b0034d93ce examples : add passkey test (#3856) hace 2 años
  Lars Grammel b7e7982953 readme : add lgrammel/modelfusion JS/TS client for llama.cpp (#4814) hace 2 años
  slaren 226460cc0d llama-bench : add no-kv-offload parameter (#4812) hace 2 años
  Johannes Gäßler d5a410e855 CUDA: fixed redundant value dequantization (#4809) hace 2 años
  Georgi Gerganov 9dede37d81 llama : remove unused vars (#4796) hace 2 años
  Georgi Gerganov 3c36213df8 llama : remove redundant GQA check (#4796) hace 2 años
  Alex Azarov 72d8407b36 llama.swiftui : use llama.cpp as SPM package (#4804) hace 2 años
  Georgi Gerganov d117d4dc5d llama : print tensor meta for debugging hace 2 años
  Alex Azarov 3418c03ecc llama.swiftui : add visionOS target (#4805) hace 2 años
  Konstantin Zhuravlyov 63ee677efd ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (#4787) hace 2 años
  Georgi Gerganov 67984921a7 server : fix n_predict check (#4798) hace 2 años
  Daniel Illescas Romero c75ca5d96f llama.swiftui : use correct pointer for llama_token_eos (#4797) hace 2 años
  Georgi Gerganov 96e80dabc6 examples : improve base-translate.sh script (#4783) hace 2 años
  a-n-n-a-l-e-e eec22a1c63 cmake : check for openblas64 (#4134) hace 2 años
  Ikko Eltociear Ashimine be36bb946a flake.nix : fix typo (#4700) hace 2 años