Commit Verlauf

Autor SHA1 Nachricht Datum
  Andrei d11afd6652 llava : fix moondream support (#7163) vor 1 Jahr
  Ouadie EL FAROUKI 8c570c9496 Minor arithmetic improvement to mmvq wrapper kernel (#7172) vor 1 Jahr
  slaren eaf4bd8b39 eval-callback : fix conversion to float (#7184) vor 1 Jahr
  0cc4m befddd0f15 Vulkan Bugfixes and Improvements (#7084) vor 1 Jahr
  Georgi Gerganov d46dbc76f8 readme : add scheduled server workflow status badge vor 1 Jahr
  l3utterfly 0961d86604 readme : add app (#6371) vor 1 Jahr
  jaime-m-p 43248e5594 llama3 custom regex split (#6965) vor 1 Jahr
  Johannes Gäßler a743d76a01 CUDA: generalize FP16 fattn vec kernel (#7061) vor 1 Jahr
  Galunid f31ec120bc Add warning if token is invalid (#7173) vor 1 Jahr
  Daniel Bevenius fd9f92b154 llama : update llama_timings.n_p_eval setting (#7160) vor 1 Jahr
  Sigbjørn Skjæret 22842164bc gguf-py : add special token modification capability (#7166) vor 1 Jahr
  Albert Jin 4734524882 opencl : alignment size converted from bits to bytes (#7090) vor 1 Jahr
  Ahmet Zeer 07cd41d096 TypoFix (#7162) vor 1 Jahr
  Jared Van Bortel 4426e2987b cmake : fix typo (#7151) vor 1 Jahr
  compilade f98eb31c51 convert-hf : save memory with lazy evaluation (#7075) vor 1 Jahr
  agray3 bc4bba364f Introduction of CUDA Graphs to LLama.cpp (#6766) vor 1 Jahr
  Johannes Gäßler c12452c7ae JSON: [key] -> .at(key), assert() -> GGML_ASSERT (#7143) vor 1 Jahr
  Georgi Gerganov 9da243b36a Revert "llava : add support for moondream vision language model (#6899)" vor 1 Jahr
  JohnnyB bd1871fa2b server : add themes + favicon (#6848) vor 1 Jahr
  Gilad S 26458af1d6 metal : use `vm_allocate` instead of `posix_memalign` on macOS (#7078) vor 1 Jahr
  Dawid Potocki 83330d8cd6 main : add --conversation / -cnv flag (#7108) vor 1 Jahr
  Eve 465263d0cf sgemm : AVX Q4_0 and Q8_0 (#6891) vor 1 Jahr
  Johan 911b3900dd server : add_special option for tokenize endpoint (#7059) vor 1 Jahr
  20kdc ad211edef5 convert.py : --vocab-only generates false but valid params (#7027) vor 1 Jahr
  Ren Xuancheng 229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114) vor 1 Jahr
  Xuan Son Nguyen 1fd9c1741d clean up json_value & server_log (#7142) vor 1 Jahr
  DAN™ 4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132) vor 1 Jahr
  Georgi Gerganov 7e0b6a7b3b py : also print the normalizers vor 1 Jahr
  Brian acdce3cdef compare-llama-bench.py: add missing basicConfig (#7138) vor 1 Jahr
  Justine Tunney 3855416027 ggml : introduce bfloat16 support (#6412) vor 1 Jahr