简单易懂的LLM/VLM相关知识梳理

在当前的技术环境中，大型语言模型（LLM）和视觉语言模型（VLM）正逐渐成为研究和应用的热点。这些模型在自然语言处理、计算机视觉等领域展现出强大的能力，为各行各业带来了新的机遇和挑战。本文旨在从实用角度出发，梳理LLM/VLM的相关知识，帮助读者更好地理解和应用这些技术。

首先，我们需要了解不同公司提供的模型特点。例如，闭源模型如OpenAI的GPT系列，以其强大的语言理解和生成能力著称；而开源模型如Hugging Face的Transformers库，提供了丰富的模型和工具，适合开发者进行二次开发和定制。

在选择模型时，我们需要考虑多种因素，包括模型性能、API接口、本地部署的可行性等。API篇将介绍如何选择适合自己需求的API服务，而本地部署篇则讨论如何在服务器或个人电脑上部署模型，以满足特定的应用需求。

对于希望从HomeLab到小型企业部署开源模型的用户，我们将介绍各种部署方法。这些方法将帮助用户根据自己的硬件条件和业务需求，选择合适的部署方案。

此外，本文还将介绍常见的接口规范，如OpenAI、Anthropic、Gemini等，以及它们的使用方法。同时，我们也会探讨Function Call与MCP的相关知识，帮助读者更好地理解模型的内部工作机制。

最后，我们将讨论Embedding、Reranker与向量数据库的应用。这些技术对于提升模型的搜索效率和准确性至关重要。

本文旨在为读者提供一个全面而实用的LLM/VLM知识梳理，帮助大家在技术快速发展的今天，更好地把握机遇，迎接挑战。