Historie revizí

Autor SHA1 Zpráva Datum
  Elbios 0d4177126b llava : fix memory management bug (#5491) před 1 rokem
  John 7930a8a6e8 llaba : hotfix for llava-1.6 image number (#5495) před 1 rokem
  Neuman Vong 704359e299 vulkan: Find optimal memory type but with fallback (#5381) před 1 rokem
  Rune 594fca3fef readme : fix typo (#5490) před 1 rokem
  John ccbb277f46 llava : update README.md (#5489) před 1 rokem
  Michael Podvitskiy 8084d55440 cmake : ARM intrinsics detection for MSVC (#5401) před 1 rokem
  John aa23412989 llava : support v1.6 (#5267) před 1 rokem
  AT f5ca054855 Early return for zero size calls to get_tensor. (#5482) před 1 rokem
  John 6c00a06692 gguf : add python reader example (#5216) před 1 rokem
  Jared Van Bortel ea9c8e1143 llama : add support for Nomic Embed (#5468) před 1 rokem
  Aarni Koskela c4e6dd59e4 llama : allow raw byte in SPM vocabs; don't crash on nl 404 (#5478) před 1 rokem
  Aarni Koskela 037259be68 llama : make load error reporting more granular (#5477) před 1 rokem
  Daniel Bevenius 263978904c finetune : rename feed-forward tensors (w1/w2/w3) (#4839) před 1 rokem
  Georgi Gerganov cf45252a7c tests : multi-thread the tokenizer tests (#5474) před 1 rokem
  Douglas Hanley 03bf161eb6 llama : support batched embeddings (#5466) před 1 rokem
  Johannes Gäßler ad014bba97 make: add error message for bad CUDA version (#5444) před 1 rokem
  Georgi Gerganov 49cc1f7d67 bert : add tests + fix quantization (#5475) před 1 rokem
  Georgi Gerganov 99b8b43d7b tests : disable moe test (#5473) před 1 rokem
  Kawrakow 895407f31b ggml-quants : fix compiler warnings (shadow variable) (#5472) před 1 rokem
  Georgi Gerganov 099afc6274 llama : fix quantization when tensors are missing (#5423) před 1 rokem
  Georgi Gerganov df334a1125 swift : package no longer use ggml dependency (#5465) před 1 rokem
  Lee dbd8828eb0 py : fix persimmon `n_rot` conversion (#5460) před 1 rokem
  Abhilash Majumder 43fe07c1a4 ggml-sycl: Replace 3d ops with macro (#5458) před 1 rokem
  Daniel Bevenius 4a46d2b792 llava : remove prog parameter from ArgumentParser (#5457) před 1 rokem
  Georgi Gerganov 3b169441df sync : ggml (#5452) před 1 rokem
  Johannes Gäßler 3bdc4cd0f5 CUDA: mul_mat_vec_q tiling, refactor mul mat logic (#5434) před 1 rokem
  Douglas Hanley 2891c8aa9a Add support for BERT embedding models (#5423) před 1 rokem
  github-actions[bot] 97a336507e flake.lock: Update před 1 rokem
  Sergio López c88c74f967 vulkan: only use M-sized matmul on Apple GPUs (#5412) před 1 rokem
  Alexey Parfenov a803333a4e common : use enums for sampler types (#5418) před 1 rokem