Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov e38b7c6e9e graph : support cacheless embeddings with FA and iSWA (#16528) hace 3 meses
  lhez 5016b72862 opencl: fix build targeting CL 2 (#16554) hace 3 meses
  Johannes Gäßler 7049736b2d CUDA: fix numerical issues in tile FA kernel (#16540) hace 3 meses
  Jie Fu (傅杰) 01d2bdc2bc ggml : fix build broken with -march=armv9-a on MacOS (#16520) hace 3 meses
  Chenguang Li 56fc38b965 CANN: fix CPU memory leak in CANN backend (#16549) hace 3 meses
  Pascal 1fb9504eb7 fix: add remark plugin to render raw HTML as literal text (#16505) hace 3 meses
  Sam/Samuel 3f750f8d76 metal: add support for opt_step_sgd (#16539) hace 3 meses
  Georgi Gerganov c515fc5771 ggml : fix scalar path for computing norm (#16558) hace 3 meses
  hipudding f9bc66c3eb CANN: Update several operators to support FP16 data format (#16251) hace 3 meses
  Sam/Samuel a31cf36ad9 metal : add opt_step_adamw and op_sum (#16529) hace 3 meses
  Pascal 81d54bbfd5 webui: remove client-side context pre-check and rely on backend for limits (#16506) hace 3 meses
  Neo Zhang Jianyu c7be9febcb [SYCL] fix UT fault cases: count-equal, argsort, pad OPs (#16521) hace 3 meses
  Mathieu Baudier 8415f61e23 ci : add Vulkan on Ubuntu with default packages build (#16532) hace 3 meses
  Aldehir Rojas 2c301e91ab common : handle unicode during partial json parsing (#16526) hace 3 meses
  Georgi Gerganov 4b2dae383d common : update presets (#16504) hace 3 meses
  sirus20x6 41aac5c69b ggml : Fix FP16 ELU positive branch (#16519) hace 3 meses
  Daniel Bevenius a2fba89a42 hparams : add check for layer index in is_recurrent (#16511) hace 3 meses
  sirus20x6 20cc625edc ggml: Correct SVE implementation in ggml_vec_dot_f16_unroll (#16518) hace 3 meses
  Johannes Gäßler 11f0af5504 CUDA: faster tile FA, add oob checks, more HSs (#16492) hace 3 meses
  Georgi Gerganov a3cb04744f metal : fix mul-mm condition + fix mul-mv permuted kernels (#16494) hace 3 meses
  Pascal 4a8fbe0a5e feat: render user content as markdown option (#16358) hace 3 meses
  Yann Follet 31d0ff1869 server / ranking : add sorting and management of top_n (#16403) hace 3 meses
  Diego Devesa 97870e6497 cuda : avoid initializing unused devices (#16510) hace 3 meses
  amirai21 477a66b035 convert : correctly handle LLaMA tokenizer for Jamba (#16470) hace 3 meses
  Georgi Gerganov e60f01d941 server : fix division by zero when reporting stats (#16501) hace 3 meses
  Georgi Gerganov 81086cd6a3 vocab : mark EOT token for Granite models (#16499) hace 3 meses
  Radoslav Gerganov 68ee98ae18 server : return HTTP 400 if prompt exceeds context length (#16486) hace 3 meses
  Radoslav Gerganov cdb6da468c server : log requests to /v1/completions (#16495) hace 3 meses
  Prajwal B Mehendarkar 6d69ab3f26 cmake : Dont define XOPENSOURCE on AIX (#16481) hace 3 meses
  Pascal 1faa13a118 webui: updated the chat service to only include max_tokens in the req… (#16489) hace 3 meses