Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov cf32a9b93a metal : refactor kernel args into structs (#10238) vor 1 Jahr
  Johannes Gäßler c3ea58aca4 CUDA: remove DMMV, consolidate F16 mult mat vec (#10318) vor 1 Jahr
  Georgi Gerganov a4200cafad make : add ggml-opt (#0) vor 1 Jahr
  Georgi Gerganov 84274a10c3 tests : remove test-grad0 vor 1 Jahr
  Georgi Gerganov 8ee0d09ae6 make : auto-determine dependencies (#0) vor 1 Jahr
  slaren 883d206fbd ggml : fix some build issues vor 1 Jahr
  Charles Xu 1607a5e5b0 backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (#9921) vor 1 Jahr
  Diego Devesa ae8de6d50a ggml : build backends as libraries (#10256) vor 1 Jahr
  Georgi Gerganov ec450d3bbf metal : opt-in compile flag for BF16 (#10218) vor 1 Jahr
  Xuan Son Nguyen a71d81cf8c server : revamp chat UI with vuejs and daisyui (#10175) vor 1 Jahr
  Diego Devesa 9f40989351 ggml : move CPU backend to a separate file (#10144) vor 1 Jahr
  Diego Devesa a6744e43e8 llama : add simple-chat example (#10124) vor 1 Jahr
  Ma Mingfei 60ce97c9d8 add amx kernel for gemm (#8998) vor 1 Jahr
  Diego Devesa c83ad6d01e ggml-backend : add device and backend reg interfaces (#9707) vor 1 Jahr
  Georgi Gerganov 148844fe97 examples : remove benchmark (#9704) vor 1 Jahr
  R0CKSTAR c35e586ea5 musa: enable building fat binaries, enable unified memory, and disable Flash Attention on QY1 (MTT S80) (#9526) vor 1 Jahr
  Georgi Gerganov 19514d632e cmake : do not hide GGML options + rename option (#9465) vor 1 Jahr
  Georgi Gerganov 6262d13e0b common : reimplement logging (#9418) vor 1 Jahr
  Xuan Son Nguyen feff4aa846 server : add loading html page while model is loading (#9468) vor 1 Jahr
  Ahmad Tameem 2b00fa7997 riscv : modify Makefile and add a RISCV_VECT to print log info (#9442) vor 1 Jahr
  slaren fb3f249815 make : do not run llama-gen-docs when building (#9399) vor 1 Jahr
  Xuan Son Nguyen bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) vor 1 Jahr
  Xuan Son Nguyen 1b9ae5189c common : refactor arg parser (#9308) vor 1 Jahr
  Georgi Gerganov df270ef745 llama : refactor sampling v2 (#9294) vor 1 Jahr
  0cc4m 5fd89a70ea Vulkan Optimizations and Fixes (#8959) vor 1 Jahr
  Georgi Gerganov 272e3bd95e make : fix llava obj file race (#8946) vor 1 Jahr
  tc-mb 3071c0a5f2 llava : support MiniCPM-V-2.5 (#7599) vor 1 Jahr
  Pablo Duboue ebd541a570 make : clean llamafile objects (#8923) vor 1 Jahr
  slaren 15fa07a5c5 make : use C compiler to build metal embed object (#8899) vor 1 Jahr
  Clint Herron ed9d2854c9 Build: Fix potential race condition (#8781) vor 1 Jahr