机器学习应用：大模型开源、商业项目、本地运行、模型微调相关项目

大模型技术全景：开源模型、商业应用与实战教程详解

2024-06-21 超腾开源 377 次阅读 1 次点赞

本文系统梳理了大模型技术全栈内容，详细介绍了主流开源模型（Llama系列、ChatGLM、Qwen等）和商业模型（ChatGPT、文心大模型、通义千问等）的特点与应用场景。针对实际使用需求，提供了完整的本地运行方案（Ollama、Transformers等）、服务器部署指南（vLLM、SGLang）、模型微调方法（Axolotl、Llama-Factory）以及应用开发平台（Dify、LangChain）的实战教程。同时包含大模型测试题库和技术参考资料，为开发者和研究者提供全面技术参考。

大模型是人工智能的最重要的核心技术之一，基于大模型，人们开发了非常多的应用。本文主要介绍了大模型相关的开源模型、商业模型、使用教程、本地运行、服务器部署、模型训练、模型微调、Web UI和应用开发平台，并提供了一些题库用于大模型的测试。

开源模型

Llama 2（Meta、Facebook）

Llama 3（Meta、Facebook）

商业模型

使用教程

开源大模型对比

本地运行

Transformers

Ollama

Web UI

Text generation web UI

llamafile

OpenWebUI

应用开发平台

测试题目

参考资料

一文搞懂大模型Prompt Engineering（提示工程）：https://zhuanlan.zhihu.com/p/681824432

提示工程指南：https://www.promptingguide.ai/zh

Awesome AI：https://github.com/runningcheese/Awesome-AI

Awesome ChatGPT Prompts：https://prompts.chat/

大模型排行榜：https://github.com/LudwigStumpp/llm-leaderboard

大模型排行榜：https://llm-leaderboard.streamlit.app/

IntelliJ IDEA常见问题解决方案大全：服务面板、Maven报错、启动故障处理

常用AI编程工具使用教程

Kiro官方网站和实测体验

Kaggle数据科学平台完全指南：竞赛、学习与社区全解析

AI IDE Warp

大模型本地运行：llama.cpp常用命令

使用Transformers进行情绪分析

DeepSeek本地部署教程：使用Ollama运行大模型及常见问题解决

Transformers项目地址、项目文档和安装使用教程

使用Transfomers进行语音识别

大模型技术全景：开源模型、商业应用与实战教程详解

开源模型

商业模型

使用教程

本地运行

服务器部署

模型训练

模型微调

Web UI

应用开发平台

测试题目

参考资料

推荐阅读

使用Three.js加载vtu格式（UnstructuredGrid）的文件

Kiro官方网站和实测体验

Ubuntu常见问题解决方法大全：SSH连接、网络配置与系统故障排除

谷歌Antigravity IDE：AI智能体驱动的软件开发平台详解

Transformers项目地址、项目文档和安装使用教程

DeepSeek本地部署教程：使用Ollama运行大模型及常见问题解决

评论 (2)

基础版

专业版