История коммитов

Автор SHA1 Сообщение Дата
  Diego Devesa c9b00a70b0 ci : fix cuda releases (#10532) 1 год назад
  Shane A de5097351c Add OLMo 2 model in docs (#10530) 1 год назад
  Diego Devesa 5a349f2809 ci : remove nix workflows (#10526) 1 год назад
  Diego Devesa 30ec398321 llama : disable warnings for 3rd party sha1 dependency (#10527) 1 год назад
  Tristan Druyen be0e350c8b Fix HIP flag inconsistency & build docs (#10524) 1 год назад
  R0CKSTAR 249cd93da3 mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516) 1 год назад
  Jeff Bolz 904109ed0d vulkan: fix group_norm (#10496) 1 год назад
  Xuan Son Nguyen 45abe0f74e server : replace behave with pytest (#10416) 1 год назад
  Neo Zhang Jianyu 0bbd2262a3 restore the condistion to build & update pacakge when merge (#10507) 1 год назад
  Georgi Gerganov ab96610b1e cmake : enable warnings in llama (#10474) 1 год назад
  Diego Devesa 7db3846a94 ci : publish the docker images created during scheduled runs (#10515) 1 год назад
  Diego Devesa c6807b3f28 ci : add ubuntu cuda build, build with one arch on windows (#10456) 1 год назад
  Charles Xu 25669aa92c ggml-cpu: cmake add arm64 cpu feature check for macos (#10487) 1 год назад
  Georgi Gerganov 84e1c33cde server : fix parallel speculative decoding (#10513) 1 год назад
  Georgi Gerganov 811872a59d speculative : simplify the implementation (#10504) 1 год назад
  Shanshan Shen 9a4b79bcfa CANN: Improve the Inferencing Performance for Ascend NPU Device (#10454) 1 год назад
  Chenguang Li 7066b4cce2 CANN: RoPE and CANCAT operator optimization (#10488) 1 год назад
  Junil Kim 0eb4e12bee vulkan: Fix a vulkan-shaders-gen arugment parsing error (#10484) 1 год назад
  Eric Curtin 0cc63754b8 Introduce llama-run (#10291) 1 год назад
  Diego Devesa 50d5cecbda ci : build docker images only once daily (#10503) 1 год назад
  Georgi Gerganov 9fd8c2687f server : add more information about error (#10455) 1 год назад
  Georgi Gerganov 47f931c8f9 server : enable cache_prompt by default (#10501) 1 год назад
  Georgi Gerganov 106964e3d2 metal : enable mat-vec kernels for bs <= 4 (#10491) 1 год назад
  Shane A 80acb7b430 Rename Olmo1124 to Olmo2 (#10500) 1 год назад
  Diego Devesa 10bce0450f llama : accept a list of devices to use to offload a model (#10497) 1 год назад
  Johannes Gäßler 1f922254f0 Github: update issue templates [no ci] (#10489) 1 год назад
  brucepro a9a678a6b2 Add download chat feature to server chat (#10481) 1 год назад
  Georgi Gerganov 9ca2e67762 server : add speculative decoding support (#10455) 1 год назад
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) 1 год назад
  Georgi Gerganov f6d12e7df8 tests : fix compile warning 1 год назад