Aleksander Grygier
|
a7a98e0fff
SvelteKit-based WebUI (#14839)
|
hace 4 meses |
Copilot
|
245be739df
ci : add copilot-instructions.md (#15286)
|
hace 4 meses |
Xuan-Son Nguyen
|
00fa15fedc
mtmd : add support for Voxtral (#14862)
|
hace 5 meses |
Diego Devesa
|
1d36b3670b
llama : move end-user examples to tools directory (#13249)
|
hace 8 meses |
William Tambellini
|
70680c48e5
ggml : upgrade init_tensor API to return a ggml_status (#11854)
|
hace 10 meses |
Xuan-Son Nguyen
|
63ac128563
server : add TEI API format for /rerank endpoint (#11942)
|
hace 11 meses |
Eve
|
adc5dd92e8
vulkan: scale caching for k quants + misc fixes (#11081)
|
hace 1 año |
Xuan Son Nguyen
|
91c36c269b
server : (web ui) Various improvements, now use vite as bundler (#10599)
|
hace 1 año |
Georgi Gerganov
|
20a780c7b6
gitignore : ignore local run scripts [no ci]
|
hace 1 año |
Georgi Gerganov
|
8ee0d09ae6
make : auto-determine dependencies (#0)
|
hace 1 año |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
hace 1 año |
ltoniazzi
|
2339a0be1c
tests : add integration test for lora adapters (#8957)
|
hace 1 año |
tc-mb
|
3071c0a5f2
llava : support MiniCPM-V-2.5 (#7599)
|
hace 1 año |
Austin
|
4730faca61
chore : Fix vulkan related compiler warnings, add help text, improve CLI options (#8477)
|
hace 1 año |
Georgi Gerganov
|
a977c11544
gitignore : deprecated binaries
|
hace 1 año |
Xuan Son Nguyen
|
be20e7f49d
Reorganize documentation pages (#8325)
|
hace 1 año |
ditsuke
|
de14e2ea2b
chore: ignore all __pychache__
|
hace 1 año |
ditsuke
|
b0a46993df
build(python): Package scripts with pip-0517 compliance
|
hace 1 año |
Georgi Gerganov
|
f3f65429c4
llama : reorganize source code + improve CMake (#8006)
|
hace 1 año |
Michael de Gans
|
a7854743c5
un-ignore `build-info.cmake` and `build-info.sh` (#7996)
|
hace 1 año |
Olivier Chafik
|
1c641e6aac
`build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)
|
hace 1 año |
zhouwg
|
b226c1227b
refine .gitignore (#7688)
|
hace 1 año |
Austin
|
7c4e5b7eae
chore : add ignore rule for generated server themes (#7689)
|
hace 1 año |
Olivier Chafik
|
8843a98c2b
Improve usability of --model-url & related flags (#6930)
|
hace 1 año |
Georgi Gerganov
|
f4ab2a4147
llama : fix BPE pre-tokenization (#6920)
|
hace 1 año |
Olivier Chafik
|
5cf5e7d490
`build`: generate hex dump of server assets during build (#6661)
|
hace 1 año |
Pierrick Hymbert
|
b804b1ef77
eval-callback: Example how to use eval callback for debugging (#6576)
|
hace 1 año |
Minsoo Cheong
|
64e7b47c69
examples : add "retrieval" (#6193)
|
hace 1 año |
Georgi Gerganov
|
95562175f8
gitignore : gguf-split
|
hace 1 año |
Johannes Gäßler
|
50ccaf5eac
lookup: complement data from context with general text statistics (#5479)
|
hace 1 año |