Историја ревизија

Аутор SHA1 Порука Датум
  Olivier Chafik 7593639ce3 `main`: add --json-schema / -j flag (#6659) пре 1 година
  compilade 132f55795e llama : fix restoring the number of outputs from state files (#6687) пре 1 година
  Pierrick Hymbert 3272896d79 server : revert "minor layout improvements" (#6684) пре 1 година
  Steven Prichard 7fc16a2c32 swift : linux support (#6590) пре 1 година
  Neo Zhang Jianyu 17e98d4c96 fix mul_mat_id() for new input, make the ut pass (#6682) пре 1 година
  David Renshaw 1958f7e06c llama : add missing kv clear in llama_beam_search (#6664) пре 1 година
  Chao Jiang 04fbc5f23e Add Command R chat template (#6650) пре 1 година
  Georgi Gerganov f184dd9208 flake.lock: Update (#6669) пре 1 година
  Dave 422c2aff1c Added support for GGML_OP_CLAMP in Metal (#6662) пре 1 година
  Sigbjørn Skjæret 8800226d65 Fix --split-max-size (#6655) пре 1 година
  Jaemin Son e689fc4e91 [bug fix] convert github repository_owner to lowercase (#6673) пре 1 година
  James A Capozzoli a4ec34e1cd convert : enable the `--use-temp-file` cli flag (#6645) пре 1 година
  Neo Zhang Jianyu de17e3f745 fix memcpy() crash, add missed cmd in guide, fix softmax (#6622) пре 1 година
  Johannes Gäßler b5e7285baf CUDA: fix matrix multiplication logic for tests (#6667) пре 1 година
  Pierrick Hymbert 4bd0f93e4a model: support arch `DbrxForCausalLM` (#6515) пре 1 година
  Olivier Chafik ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555) пре 1 година
  slaren fbbc030ba9 metal : unify mul_mv_id kernels (#6556) пре 1 година
  Daniel Bevenius 4cc120c744 infill : add download instructions for model (#6626) пре 1 година
  Pierrick Hymbert 24ee66ed0d server : coherent log output for KV cache full (#6637) пре 1 година
  jiez 91c736015b llama : add gguf_remove_key + remove split meta during quantize (#6591) пре 1 година
  Rene Leonhardt 5c4d767ac0 chore: Fix markdown warnings (#6625) пре 1 година
  Georgi Gerganov ef21ce4ccb imatrix : remove invalid assert (#6632) пре 1 година
  MasterYi1024 dee7f8d692 Correct free memory and total memory. (#6630) пре 1 година
  Pierrick Hymbert 81da18e71c eval-callback: use ggml_op_desc to pretty print unary operator name (#6631) пре 1 година
  Georgi Gerganov 9ed2737acc ci : disable Metal for macOS-latest-cmake-x64 (#6628) пре 1 година
  Clint Herron 04a5ac211e Optimization: eliminate addition of redundant stacks when advancing grammar. (#6616) пре 1 година
  Clint Herron f7001ccc5a As suggested by @slaren, disabling Metal for test to fix CI build on OSX from #6576 (#6619) пре 1 година
  Nikolas a474f50ebb Refactor Error Handling for CUDA (#6575) пре 1 година
  Olivier Chafik cbaadc9294 grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609) пре 1 година
  Hugo Roussel 1bbdaf6ecd ci: download artifacts to release directory (#6612) пре 1 година