Commit History

Autor SHA1 Mensaxe Data
  Georgi Gerganov 148ec970b6 convert : remove AWQ remnants (#8320) hai 1 ano
  Georgi Gerganov 2cccbaa008 llama : minor indentation during tensor loading (#8304) hai 1 ano
  Johannes Gäßler 8e558309dc CUDA: MMQ support for iq4_nl, iq4_xs (#8278) hai 1 ano
  Daniele 0a423800ff CUDA: revert part of the RDNA1 optimizations (#8309) hai 1 ano
  Douglas Hanley d12f781074 llama : streamline embeddings from "non-embedding" models (#8087) hai 1 ano
  Johannes Gäßler bcefa03bc0 CUDA: fix MMQ stream-k rounding if ne00 % 128 != 0 (#8311) hai 1 ano
  Pieter Ouwerkerk 5a7447c569 readme : fix minor typos [no ci] (#8314) hai 1 ano
  Daniel Bevenius 61ecafa390 passkey : add short intro to README.md [no-ci] (#8317) hai 1 ano
  Georgi Gerganov aa5898dc53 llama : prefer n_ over num_ prefix (#8308) hai 1 ano
  Georgi Gerganov 6c05752c50 contributing : update guidelines (#8316) hai 1 ano
  luoyu-intel a9554e20b6 [SYCL] Fix WARP_SIZE=16 bug of Intel GPU (#8266) hai 1 ano
  Georgi Gerganov e235b267a2 py : switch to snake_case (#8305) hai 1 ano
  Neo Zhang Jianyu f09b7cb609 rm get_work_group_size() by local cache for performance (#8286) hai 1 ano
  Xuan Son Nguyen a38b884c6c cli: add EOT when user hit Ctrl+C (#8296) hai 1 ano
  Icecream95 d7fd29fff1 llama : add OpenELM support (#7359) hai 1 ano
  Daniel Bevenius 6f63d646c1 tokenize : add --show-count (token) option (#8299) hai 1 ano
  ditsuke 51d2ebadbb build: Export hf-to-gguf as snakecase hai 1 ano
  ditsuke 1e920018d3 doc: Add context for why we add an explicit pytorch source hai 1 ano
  ditsuke 01a5f06550 chore: Remove rebase artifacts hai 1 ano
  ditsuke 07786a61a2 chore: Fixup requirements and build hai 1 ano
  ditsuke de14e2ea2b chore: ignore all __pychache__ hai 1 ano
  ditsuke 821922916f fix: Update script paths in CI scripts hai 1 ano
  ditsuke b1c3f26e5e fix: Actually include scripts in build hai 1 ano
  ditsuke b0a46993df build(python): Package scripts with pip-0517 compliance hai 1 ano
  fairydreaming 807b0c49ff Inference support for T5 and FLAN-T5 model families (#5763) hai 1 ano
  Daniel Bevenius f8c4c0738d tests : add _CRT_SECURE_NO_WARNINGS for WIN32 (#8231) hai 1 ano
  Daniel Bevenius 402d6feffa llama : suppress unref var in Windows MSVC (#8150) hai 1 ano
  Georgi Gerganov 20fc3804bf convert : fix gemma v1 tokenizer convert (#8248) hai 1 ano
  AidanBeltonS f619024764 [SYCL] Remove unneeded semicolons (#8280) hai 1 ano
  Daniele d23287f122 Define and optimize RDNA1 (#8085) hai 1 ano