Commit Verlauf

Autor SHA1 Nachricht Datum
  le.chang cbbd1efa06 Makefile: use variables for cublas (#5689) vor 1 Jahr
  kwin1412 f1a98c5254 make : fix nvcc version is empty (#5713) vor 1 Jahr
  CJ Pais 6560bed3f0 server : support llava 1.6 (#5553) vor 1 Jahr
  slaren 06bf2cf8c4 make : fix debug build with CUDA (#5616) vor 1 Jahr
  Haoxiang Fei 8dbbd75754 metal : add build system support for embedded metal library (#5604) vor 1 Jahr
  Jared Van Bortel f24ed14ee0 make : pass CPPFLAGS directly to nvcc, not via -Xcompiler (#5598) vor 1 Jahr
  Georgi Gerganov d0e3ce51f4 ci : enable -Werror for CUDA builds (#5579) vor 1 Jahr
  Georgi Gerganov 68a6b98b3c make : fix CUDA build (#5580) vor 1 Jahr
  Xuan Son Nguyen 11b12de39b llama : add llama_chat_apply_template() (#5538) vor 1 Jahr
  Jared Van Bortel a0c2dad9d4 build : pass all warning flags to nvcc via -Xcompiler (#5570) vor 1 Jahr
  Ananta Bastola 6e4e973b26 ci : add an option to fail on compile warning (#3952) vor 1 Jahr
  Johannes Gäßler ad014bba97 make: add error message for bad CUDA version (#5444) vor 1 Jahr
  Johannes Gäßler 098f6d737b make: Use ccache for faster compilation (#5318) vor 1 Jahr
  Johannes Gäßler 3c0d25c475 make: add nvcc info print (#5310) vor 1 Jahr
  Johannes Gäßler 3cc5ed353c make: fix nvcc optimization flags for host code (#5309) vor 1 Jahr
  0cc4m e920ed393d Vulkan Intel Fixes, Optimizations and Debugging Flags (#5301) vor 1 Jahr
  Ali Nehzat d71ac90985 make : generate .a library for static linking (#5205) vor 1 Jahr
  0cc4m 2307523d32 ggml : add Vulkan backend (#2059) vor 1 Jahr
  Xuan Son Nguyen 48c857aa10 server : refactored the task processing logic (#5065) vor 2 Jahren
  crasm 413e7b0559 ci : add model tests + script wrapper (#4586) vor 2 Jahren
  Georgi Gerganov c918fe8dca metal : create autorelease pool during library build (#4970) vor 2 Jahren
  Georgi Gerganov 4be5ef556d metal : remove old API (#4919) vor 2 Jahren
  Kawrakow 326b418b59 Importance Matrix calculation (#4861) vor 2 Jahren
  Georgi Gerganov b0034d93ce examples : add passkey test (#3856) vor 2 Jahren
  slaren 5bf3953d7e cuda : improve cuda pool efficiency using virtual memory (#4606) vor 2 Jahren
  LeonEricsson 7082d24cec lookup : add prompt lookup decoding example (#4484) vor 2 Jahren
  FantasyGmm a55876955b cuda : fix jetson compile error (#4560) vor 2 Jahren
  Michael Kesper 28cb35a0ec make : add LLAMA_HIP_UMA option (#4587) vor 2 Jahren
  Georgi Gerganov 32259b2dad gguf : simplify example dependencies vor 2 Jahren
  slaren d232aca5a7 llama : initial ggml-backend integration (#4520) vor 2 Jahren