大模型技术全景:开源模型、商业应用与实战教程详解

2024-06-21 李腾 185 次阅读 1 次点赞
本文系统梳理了大模型技术全栈内容,详细介绍了主流开源模型(Llama系列、ChatGLM、Qwen等)和商业模型(ChatGPT、文心大模型、通义千问等)的特点与应用场景。针对实际使用需求,提供了完整的本地运行方案(Ollama、Transformers等)、服务器部署指南(vLLM、SGLang)、模型微调方法(Axolotl、Llama-Factory)以及应用开发平台(Dify、LangChain)的实战教程。同时包含大模型测试题库和技术参考资料,为开发者和研究者提供全面技术参考。

大模型是人工智能的最重要的核心技术之一,基于大模型,人们开发了非常多的应用。本文主要介绍了大模型相关的开源模型、商业模型、使用教程、本地运行、服务器部署、模型训练、模型微调、Web UI和应用开发平台,并提供了一些题库用于大模型的测试。

开源模型

Llama 2(Meta、Facebook)

Llama 3(Meta、Facebook)

ChatGLM(清华大学)

LaMDA(Google)

Gemini(DeepMind)

Qwen(阿里云)

Qwen2(阿里云)

Qwen3(阿里云)

DeepSeek(深度求索)

源 2.0(浪潮)

Phi-4(微软)

商业模型

ChatGPT(OpenAI)

文心大模型(百度)

百川大模型(百川)

星火认知大模型(讯飞)

混元大模型(腾讯)

360智脑(360)

通义千问(阿里云)

月之暗面(月之暗面)

阿里云百炼

Claude(Anthropic)

使用教程

开源大模型对比

相关论文

大模型解禁技术(abliteration)简介、模型及相关文档

Model Context Protocol (MCP) 协议官网、简介和开发教程

Agent to Agent(A2A)协议官网、简介和开发教程

本地运行

Transformers

llama.cpp

chatglm.cpp

Ollama

LMStudio

服务器部署

vLLM

SGLang

模型训练

ColossalAI

模型微调

Axolotl

Llama-Factory

Swift

FastChat

P-tuning-v2

Web UI

Text generation web UI

llamafile

OpenWebUI

应用开发平台

Assistants API

Dify

FastGPT

LangChain

LangChain-ChatChat

RAGFlow

测试题目

给三个AI大模型出九个考题

19个弱项问题

问哪些问题,可以判断一个大模型水平高低

大模型,数学能力测试三道题

推理能力测试题

参考资料

一文搞懂大模型Prompt Engineering(提示工程):https://zhuanlan.zhihu.com/p/681824432

提示工程指南:https://www.promptingguide.ai/zh

Awesome AI:https://github.com/runningcheese/Awesome-AI

Awesome ChatGPT Prompts:https://prompts.chat/

大模型排行榜:https://github.com/LudwigStumpp/llm-leaderboard

大模型排行榜:https://llm-leaderboard.streamlit.app/

本文由人工编写,AI优化,转载请注明原文地址: 大模型完全指南:开源与商业模型、本地部署、微调实战

评论 (0)

登录后发表评论

暂无评论,快来发表第一条评论吧!