Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov 3b7c914de2 tests : gitignore test-c.o před 2 roky
  Xuan Son Nguyen 48c857aa10 server : refactored the task processing logic (#5065) před 2 roky
  crasm 413e7b0559 ci : add model tests + script wrapper (#4586) před 2 roky
  Paul Tsochantaris 6dd3c28c9c metal : remove unused `n_buffers` and `buffers` (#5129) před 2 roky
  Riceball LEE 38b431de23 gguf : fix "general.alignment" type in gguf_reader.py (#5136) před 2 roky
  Georgi Gerganov aad0b01d73 readme : update hot topics před 2 roky
  Kawrakow 1182cf4d4f Another bucket sort (#5109) před 2 roky
  XiaotaoChen fe54033b69 readme : add MobileVLM 1.7B/3B to the supported models list (#5107) před 2 roky
  l3utterfly 5eaf9964fc llama : dynamic temperature sampling (#4972) před 2 roky
  Jared Van Bortel d292f4f204 examples : make pydantic scripts pass mypy and support py3.8 (#5099) před 2 roky
  Valentin Konovalov 256d1bb0dd android : use release cmake build type by default (#5123) před 2 roky
  Kawrakow faa3526a1e Fix Q3_K_XS for MoE models (#5113) před 2 roky
  Georgi Gerganov ddc5a5033f metal : show compile log messages před 2 roky
  Engininja2 cd4fddb29f cuda : fix 2-bit quants on amd hip (#5105) před 2 roky
  Michael Hueschen c9b316c78f nix-shell: use addToSearchPath před 2 roky
  Michael Hueschen bf63d695b8 nix: add cc to devShell LD_LIBRARY_PATH před 2 roky
  slaren 1387ea2117 llama : pre-allocate input tensors in a separate buffer (#5100) před 2 roky
  Georgi Gerganov 26d607608d metal : disable support for MUL_MAT F32 x F16 před 2 roky
  Kawrakow 44879ee885 Additional KL-divergence statistics (#5081) před 2 roky
  Johannes Gäßler 9ecdd12e95 CUDA: more info when no device code (#5088) před 2 roky
  Georgi Gerganov 89758723c7 minor : clean-up some warnings and style (#5094) před 2 roky
  Xuan Son Nguyen 2bed4aa3f3 devops : add intel oneapi dockerfile (#5068) před 2 roky
  Michael Coppola 125d03a503 llama.vim : added api key support (#5090) před 2 roky
  slaren 011e8ec577 llama : fix not enough space in buffer with Qwen (#5086) před 2 roky
  Kawrakow 6f9939d119 KL-divergence (#5076) před 2 roky
  Reinforce-II 780e24a22e ggml : parallelize FP32 conversion when using BLAS (#5045) před 2 roky
  XiaotaoChen 3ce7e8f8e7 llava : MobileVLM support (#4954) před 2 roky
  Someone Serge b2d80e105a flake.nix: add a comment about flakes vs nix před 2 roky
  Someone Serge 28603cd283 nix: add a comment on the many nixpkgs-with-cuda instances před 2 roky
  Someone Serge 5e97ec91ae nix: add a comment about makeScope před 2 roky