Historial de Commits

Autor SHA1 Mensaje Fecha
  uvos 3ad5451f3b Add some minimal optimizations for CDNA (#10498) hace 1 año
  Diego Devesa 46c69e0e75 ci : faster CUDA toolkit installation method and use ccache (#10537) hace 1 año
  Georgi Gerganov 9e2301f4a4 metal : fix group_norm support condition (#0) hace 1 año
  Georgi Gerganov fee824a1a1 sync : ggml hace 1 año
  Frankie Robertson 9150f8fef9 Do not include arm_neon.h when compiling CUDA code (ggml/1028) hace 1 año
  Jeff Bolz c31ed2abfc vulkan: define all quant data structures in types.comp (#10440) hace 1 año
  Jeff Bolz 5b3466bedf vulkan: Handle GPUs with less shared memory (#10468) hace 1 año
  Jeff Bolz 249a7902ec vulkan: further optimize q5_k mul_mat_vec (#10479) hace 1 año
  Jeff Bolz 71a64989a5 vulkan: skip integer div/mod in get_offsets for batch_idx==0 (#10506) hace 1 año
  Jeff Bolz 4a57d362e1 vulkan: optimize Q2_K and Q3_K mul_mat_vec (#10459) hace 1 año
  Diego Devesa c9b00a70b0 ci : fix cuda releases (#10532) hace 1 año
  Shane A de5097351c Add OLMo 2 model in docs (#10530) hace 1 año
  Diego Devesa 5a349f2809 ci : remove nix workflows (#10526) hace 1 año
  Diego Devesa 30ec398321 llama : disable warnings for 3rd party sha1 dependency (#10527) hace 1 año
  Tristan Druyen be0e350c8b Fix HIP flag inconsistency & build docs (#10524) hace 1 año
  R0CKSTAR 249cd93da3 mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516) hace 1 año
  Jeff Bolz 904109ed0d vulkan: fix group_norm (#10496) hace 1 año
  Xuan Son Nguyen 45abe0f74e server : replace behave with pytest (#10416) hace 1 año
  Neo Zhang Jianyu 0bbd2262a3 restore the condistion to build & update pacakge when merge (#10507) hace 1 año
  Georgi Gerganov ab96610b1e cmake : enable warnings in llama (#10474) hace 1 año
  Diego Devesa 7db3846a94 ci : publish the docker images created during scheduled runs (#10515) hace 1 año
  Diego Devesa c6807b3f28 ci : add ubuntu cuda build, build with one arch on windows (#10456) hace 1 año
  Charles Xu 25669aa92c ggml-cpu: cmake add arm64 cpu feature check for macos (#10487) hace 1 año
  Georgi Gerganov 84e1c33cde server : fix parallel speculative decoding (#10513) hace 1 año
  Georgi Gerganov 811872a59d speculative : simplify the implementation (#10504) hace 1 año
  Shanshan Shen 9a4b79bcfa CANN: Improve the Inferencing Performance for Ascend NPU Device (#10454) hace 1 año
  Chenguang Li 7066b4cce2 CANN: RoPE and CANCAT operator optimization (#10488) hace 1 año
  Junil Kim 0eb4e12bee vulkan: Fix a vulkan-shaders-gen arugment parsing error (#10484) hace 1 año
  Eric Curtin 0cc63754b8 Introduce llama-run (#10291) hace 1 año
  Diego Devesa 50d5cecbda ci : build docker images only once daily (#10503) hace 1 año