Historial de Commits

Autor SHA1 Mensaje Fecha
  Derrick T. Woolworth 86e7299ef5 added support for Authorization Bearer tokens when downloading model (#8307) hace 1 año
  Xuan Son Nguyen 60d83a0149 update main readme (#8333) hace 1 año
  Daniel Bevenius 87e25a1d1b llama : add early return for empty range (#8327) hace 1 año
  jaime-m-p 213701b51a Detokenizer fixes (#8039) hace 1 año
  Xuan Son Nguyen be20e7f49d Reorganize documentation pages (#8325) hace 1 año
  Georgi Gerganov 7ed03b8974 llama : fix compile warning (#8304) hace 1 año
  Natsu 1d894a790e cmake : add GGML_BUILD and GGML_SHARED macro definitions (#8281) hace 1 año
  Ouadie EL FAROUKI 1f3e1b66e2 Enabled more data types for oneMKL gemm_batch (#8236) hace 1 año
  Georgi Gerganov 148ec970b6 convert : remove AWQ remnants (#8320) hace 1 año
  Georgi Gerganov 2cccbaa008 llama : minor indentation during tensor loading (#8304) hace 1 año
  Johannes Gäßler 8e558309dc CUDA: MMQ support for iq4_nl, iq4_xs (#8278) hace 1 año
  Daniele 0a423800ff CUDA: revert part of the RDNA1 optimizations (#8309) hace 1 año
  Douglas Hanley d12f781074 llama : streamline embeddings from "non-embedding" models (#8087) hace 1 año
  Johannes Gäßler bcefa03bc0 CUDA: fix MMQ stream-k rounding if ne00 % 128 != 0 (#8311) hace 1 año
  Pieter Ouwerkerk 5a7447c569 readme : fix minor typos [no ci] (#8314) hace 1 año
  Daniel Bevenius 61ecafa390 passkey : add short intro to README.md [no-ci] (#8317) hace 1 año
  Georgi Gerganov aa5898dc53 llama : prefer n_ over num_ prefix (#8308) hace 1 año
  Georgi Gerganov 6c05752c50 contributing : update guidelines (#8316) hace 1 año
  luoyu-intel a9554e20b6 [SYCL] Fix WARP_SIZE=16 bug of Intel GPU (#8266) hace 1 año
  Georgi Gerganov e235b267a2 py : switch to snake_case (#8305) hace 1 año
  Neo Zhang Jianyu f09b7cb609 rm get_work_group_size() by local cache for performance (#8286) hace 1 año
  Xuan Son Nguyen a38b884c6c cli: add EOT when user hit Ctrl+C (#8296) hace 1 año
  Icecream95 d7fd29fff1 llama : add OpenELM support (#7359) hace 1 año
  Daniel Bevenius 6f63d646c1 tokenize : add --show-count (token) option (#8299) hace 1 año
  ditsuke 51d2ebadbb build: Export hf-to-gguf as snakecase hace 1 año
  ditsuke 1e920018d3 doc: Add context for why we add an explicit pytorch source hace 1 año
  ditsuke 01a5f06550 chore: Remove rebase artifacts hace 1 año
  ditsuke 07786a61a2 chore: Fixup requirements and build hace 1 año
  ditsuke de14e2ea2b chore: ignore all __pychache__ hace 1 año
  ditsuke 821922916f fix: Update script paths in CI scripts hace 1 año