Articles in the category of 大语言模型

大语言模型

AI大模型企业业务应用模式[转]

From: 阿里云CIO首次系统复盘：大模型落地的RIDE方法论与RaaS实践突破AI大模型企业业务应用模式这里，我重点讲述深蓝色部分的两种模式：第一个是...

October 1, 2025

vLLM Python 运行 gpt-oss 模型

HuggingFace：https://huggingface.co/openai/gpt-oss-20bhttps://huggingface.co/o...

September 13, 2025

Post-Train和Finetune三种模型训练技术

Pretrain（预训练）、Post-train（后训练）和 Finetune（微调）是三种常见的模型训练技术，它们在模型的不同阶段起不同作用。1. ...

June 2, 2025

vLLM与Ollama模型推理部署对比

LLM 部署框架综合对比图：From: LLM Serving FrameworksOllama vs vLLMFrom: ollama与vllm的深度比...

May 24, 2025

vLLM与Hugging Face模型推理对比

离线推理( offline inference )场景中，比较关注最大化吞吐量并降低单次推理成本。传统方法往往是资源消耗大、速度慢、容易出现性能瓶颈、导致...

May 24, 2025

多模态RAG评测流程[转]

出处：打破文本边界：如何进行多模态RAG评测在现代信息处理与检索系统中，如何有效地从这些包括了文本，图像，视频等多模态混合内容中，提取和利用信息是一个重要...

May 13, 2025

Ollama运行本地路径模型

Github: https://github.com/ollama/ollamaModels: https://ollama.com/searchOlla...

February 4, 2025

DeepSeek-R1 GPU硬件要求

出处：GPU System Requirements for Running DeepSeek-R1DeepSeek-R1-Zero通过大规模强化学习（R...

February 3, 2025

LLM驱动的智能体如何引领行业变革及应用探索与未来展望[转]

原文：AI Agent框架（LLM Agent）：LLM驱动的智能体如何引领行业变革，应用探索与未来展望1. AI Agent（LLM Agent）介绍1...

February 2, 2025

基于RAG的信息检索[译]

原文：Efficient Information Retrieval with RAG Workflow - 2023.10.09实现： Implemen...

January 21, 2025