Linux MInt(Ubuntu)从源码构建llama.cpp

获取代码

git clone https://github.com/ggml-org/llama.cpp
cd llama.cpp

安装依赖

sudo apt update
sudo apt install -y build-essential cmake git libcurl4-openssl-dev libomp-dev libopenblas-dev

构建

使用 CMake 构建 llama.cpp：

cmake -B build
cmake --build build --config Release -j 8

构建完成

$ ./build/bin/llama-cli --version
version: 5893 (0f4c6ec0)
built with cc (Ubuntu 13.3.0-6ubuntu2~24.04) 13.3.0 for x86_64-linux-gnu

推理测试

$ ./build/bin/llama-cli -m ~/.cache/modelscope/hub/models/Qwen/Qwen3-1.7B-GGUF/Qwen3-1.7B-Q8_0.gguf
...
> 你好，请你介绍一下自己
<think>
好的，用户让我介绍一下自己。首先，我需要确定用户的需求是什么。他们可能想了解我的功能、背景，或者只是想确认我的存在。我应该保持友好和专业的语气，同时提供有用的信息。

接下来，我要考虑如何组织内容。通常，自我介绍包括身份、能力、使用场景、注意事项等。需要确保信息准确，避免夸大其词，同时保持简洁明了。

然后，我需要检查是否有遗漏的重要信息。比如，我的语言能力、技术支持、隐私政策等。这些都是用户可能关心的点。此外，要提醒用户注意隐私，避免滥用信息。

还要注意用户可能的深层需求。他们可能想测试我的反应，或者寻找特定的帮助。因此，回答中应包含开放性问题，鼓励用户提出更多问题，促进进一步交流。

最后，保持语言自然，避免过于机械化的表达。使用亲切的问候语，比如“你好”，并表达愿意帮助的态度。确保整个回答流畅，信息全面，同时保持友好和专业的形象。
</think>

你好！我是你的AI助手，很高兴为你服务。我能够帮助你解答问题、提供信息、创作内容，甚至陪你聊天。无论你在学习、工作还是生活中遇到任何问题，都可以随时告诉我。

我支持多种语言，可以处理文字、图片、语音等多种形式的输入。不过，请注意以下几点：
1. **隐私保护**：我不会存储或使用你的个人数据，除非你明确授权。
2. **内容规范**：请遵守法律法规和道德准则，避免传播违法或不实信息。
3. **技术限制**：我无法替代专业意见，对于医疗、法律等需专业判断的问题，建议咨询相关领域专家。

如果你有任何问题，欢迎随时提问！ 😊