这是本文档旧的修订版！

AI | 给非技术背景AI用户的上手指南

作者：vim 版本：pv3.1.0r　注册文库：vim笔记

总体思路

选择1-2个适合自己的AI服务（建议国内外各选一家），了解AI的基本功能、对话语法先用起来。后续适当了解一些AI的工作原理、后端机制、以及不同的大模型的特性，根据具体的应用场景和需求，逐步进阶使用。在有高级或者特殊的需求（如涉及隐私及保密需求，或者需要建立内部知识库），就需要专业的研究学习一下了。本文主要面向前面两种场景，并简单介绍一下高级应用的方向。

Note：这篇文章只讨论中国用户可以使用的那些AI系统（可能需要科学使用），ChatGPT、Gemini这些目前还没有对中国用户开放的平台不做讨论。同时，本文只讨论可以直接使用的AI服务，那些需要调用API的前端AI应用也不多做讨论。

适合一般用户的AI选型

AI通用对话（国内）：主推Kimi，候选智谱AI
AI通用对话（国外）：主推Poe，候选Hugging Chat
AI图片生成：主推Playground AI，候选Poe的Playground机器人或者国内的Dreamina·即梦
AI特殊场景：LMsys(https://chat.lmsys.org/)

Note：以上AI服务商及相关大模型简介，以及积分使用策略，文末附件部分做简单介绍

进阶用法

基础玩法：从前面推荐的AI服务中选择1-2个，根据个人直觉和一般经验随便用起来，边用边摸索就好。
专业玩法：研究不同AI服务和大模型的特点，学习AI提示词的用法，基于不同场景和需求进行AI选型和专业化的对话。
高级玩法：并可以进一步在支持智能体定制的平台上，定制专用的AI智能体，建立专业知识库。
高级玩法：搭建自己的本地AI大模型后端环境，架设本地的AI前端应用，构建专业知识库，训练专用的AI行业/专家模型。

AI分层应用方案

基础应用（简单选型，直觉操作）

从下面的AI系统中，任选1-2个，然后按直觉使用就好，也可以先初步学习一下基础的AI提示词用法。

国内通用：推荐Kimi，候选智谱AI
国外通用：推荐Poe的Websearch机器人或者Poe的Gemini-1.5-flash机器人，候选HuggingChat的c4ai-command-r-plus大模型
图片生成：推荐Poe的Playground机器人，候选Playground AI

专业应用（针对选型，专业对话）

在前面日常使用的基础上，结合应用场景和需求，选择适合的高级大模型，学习一下AI提示词的用法，并学会专业的Prompt提示词语法与AI进行专业对话，提高对话效率。

国内通用：推荐Kimi，候选Coze平台（国际版，国内版）
国外通用：推荐Poe的GPT-4o机器人或者Poe的Claude-3-Sonnet机器人，候选HuggingChat的c4ai-command-r-plus大模型
图片生成：推荐推荐Poe的StableDiffusionXL机器人或者Playground AI，候选Dreamina·即梦

高级应用（智能体定制，知识库建设）

在前面AI应用基础上，可以在支持智能体定制的平台上（如POE、智谱AI），定制自己的专用AI智能体角色（如行政助理、行业专家、学术秘书等），并建立专用的知识库（如医学论文集，社会治理档案集，管理咨询资料库等），进一步提高对话质量。

智能体定制的常用设置包括：

基座大模型的选择
智能体角色、任务、知识、技能、输出规则、对话规范、工作流、问候信息等常用提示词设置
上传相关资料文档，建立智能体的后端知识库
设置大模型的技术特性（如：发散性、上下文层次、TopP、TopK等）
功能插件的选择调用（如搜索引擎调用、天气查询、图片生成与识别、OCR、网盘接入、第三平台数据接入等）
模型功能的选择（如联网、绘画、代码、语音合成、Markdown渲染等）
选择智能体的发布平台和开放程度

不同的平台可以做的设置各有差别，其中1和2基本上是每个智能体定制平台都有的，后面的其它设置，不同平台各有不同。根据需要选择定制就好。

基础定制：推荐国内的智谱AI，以及国际的POE
高级定制：推荐Coze平台，它同时包括了国际版和国内版

极客玩法（本地专家模型，行业知识库）

有些时候，你会面临一些特殊和高级的场景的需求。比如对话内容和分析资料有保密需要（如处理涉密文档和商业文件）和隐私需求（比如涉及自己和他人隐私，或者想整些不和谐的玩法）；或者需要为机构或团队内部训练出一个行业性专家大模型，进行内部的高级知识管理。这时候，可以自行架设一个软硬件一体的本地AI环境。

硬件选型相对简单：2020年之后产的Intel-i7、AMD-R7以上的CPU，nVidia-3060-8G、AMD-5600XT以上的GPU，32G以上的内存——硬件性能堆得越足，能跑的AI大模型越多、速度越快，根据需求和预算整就行。（具体成本可以网上查更专业资料）

软件选型如下：

个人（或者2-5人小团队）使用，最简单办法是装个LM-Studio，主打前端应用，直接支持Llama3、Mistral、Phi3等近二十种大模型。Windows、Mac、Linux都可以直接下载安装包安装使用。可以让你像其它普通桌面软件一样，在本地安装使用AI大模型，并可以直接在LM-Studio的界面中使用；打开软件的web服务功能，也可以让其它设备通过浏览器及NextGPT/OpenWebUI这些客户端，访问服务端的大模型服务。

机构（或者团队）使用，推荐在服务端安装Ollama，可以支持包括Llama3、Mistral、Gemini在类的几乎所有开源大模型。同样有Linux、Mac、Win在内的安装包，或者更简单的通过docker安装，一条docker命令搞定。使用方法也类似docker。然后，你同样可以安装OpenWebUI、Dify、MaxKB这样的前端应用，连上Ollama的服务器后，更方面的使用Ollama里的大模型服务。使用体验和前面介绍的那些专业的AI服务类似。

至于Ollama具体如何安装使用，Dify、MaxKB这些前端如何安装配置，是另一个层面需要了解的内容，网上已经有许多详细教程，就不在这篇文章里赘述了。如果需要，可以自行通过Bing、B站等找到相关内容。有这种需求和想法的人，应该也不用我再多说什么了。

AI服务推荐

Kimi

kimi（https://kimi.moonshot.cn）是本土AI企业月之暗面推出的人工智能助手，有很强的文字对话、信息检索和文档分析能力，免费，可联网，用户体验极佳。（就是近期用户增长太长，算力不足，时不时躺平。）

智谱AI

智谱AI（https://chatglm.cn）是本土AI企业智谱华章推出的生成式AI助手，功能比较全面，通用问答、创意写作、图片生成、文档分析都有，免费，可联网，可定制智体能，用户体验主流水平。（中规中矩，没有特别好或者不好）

万知AI

万知AI（https://www.wanzhi.com）是本土AI公司零一万物推出的一站式AI工作平台，特别针对白领工作中的查资料、读文档、做PPT等场景做了特别优化，免费、可联网，支持40万字超长文本。（底层性能比前两家都要强，刚刚推出，用户体验还需要跟上）

Poe

Poe（https://poe.com）是美国企业Quora推出的AI成平台，可以直接使用GPT、Claude、Gemini等通用大模型，也可以使用StableDiffusion、Playground、Dall-E等图像大模型进行图像生成，每天免费3000积分，轻度使用基本可以白嫖。（中国用户可直接注册使用，需科学访问）

HuggingChat

HuggingChat（https://huggingface.co/chat）是由AI社区HuggingFace推出，提供Llama3、Command-R+、Mixtral等多个可联网的开源大模型。可直接注册，完全免费，彻底摆脱Token焦虑。（中国用户可直接注册使用，需科学访问）

Playground AI

Playground AI(https://playground.com)由PlaygroundAI推出的AI图像创作平台，可以允许用户通过简单的文本提示生成高质量的图像、海报、logo和艺术作品，以及图像修复、去除背景、图像放大等图像编辑功能，或者根据上传已有图像生成新的图像等。且生成的内容可以商用。免费用户每天可以生成50张图，一般情况够用。

Coze

Coze（http://www.coze.com）是由字节跳动推出的GPTs类似的AI智能体定制平台，有国内版和国际版。可调用多家AI大模型和众多信息源，定制复杂应用的工作流等。

LMsys

LMsys(https://chat.lmsys.org/)是由加州大学和卡内基梅隆大学推出的AI大模型测试平台，免费使用几乎所有的大模型，无需注册，用的时候对AI输出的内容，顺手提供一下体验反馈即可。

AI大模型简介

开源大模型

HuggingChat可用

c4ai-command-r-plus（由Cohere推出的最新开源LLM产品，曾在LMsys的机器人竞技场中击败过GPT4，中文对话质量高）
Yi-1.5-34B-Chat（由中国企业零一万物推出的大模型，专业指标与前两者同一水平，采用高质量数据训练，对齐人类偏好，可申请免费商用，中文对话更是优势）
Meta-Llama-3-70B-Instruct（由Meta推出的大模型，就专业指标来说是目前最强开源大模型，中文训练略有不足，中文对话差点劲）
zephyr-orpo-141b-A35b（由HuggingChat基于欧洲AI企业Mistral推出的开源大模型Mistral 8x22B微调出来的优化版本）
gemma-1.1-7b-it（由Google推出的Gemma系列轻量级大模型）
Phi-3-mini-4k-instruct（由Microsoft推出的轻量级大模型）

其它

Stable Diffusion（Stability AI推出的图像生成大模型，提供文本到图像的生成，能够根据文本描述生成详细和逼真的图像）
Playground（Playground AI开发的最新文本到图像生成模型，它在美学质量、颜色和对比度、多纵横比生成以及人物细节方面）

商用主流大模型（开发机构，LMsys排名，主要特性，最佳用途）

GPT-4（OpenAI推出，LMsys头部选手，强大的语言生成能力、推理能力、数学能力、编码能力等，扩展支持多模态能力，全能型选手）
Gemini-1.5（Google推出，LMsys头部选手，原生多模态AI模型，支持文本、图像和视频输入，自然语言理解能力强，）
Claude-3（Anthropic推出，LMsys头部选手，在语义理解、文本处理能力方面表现突出，输出质量与回复速度有优势）

POE的AI机器人（功能与积分）

Websearch（40分/条）（基于OpenAI的GPT3.5-turbo大模型，增加联网搜索功能，适合信息搜索、特定事实查询和初步处理。）
Assistant（20分/条）（基于OpenAI的GPT3.5-turbo和的Claude-3-Haiku，适合各语种对话和编程任务）
Gemini-1.0-Pro-Search（20分/条）（Google的Gemini-1.0-pro多模态大模型，带联网功能，适合一般性对话）
Gemini-1.5-Flash（25分/条）（Google推出的最新多模态大模型，优化速度和成本，缩短了上下文长度，适合不太复杂对话）
Claude-3-Haiku（Anthropic推出的号称文本处理最强大模型，haiku是其中的速度优化版，缩短了上下文长度，适合不太复杂对话）
Gemini-1.5-pro-Search（175分/条）（Google推出的Gemini-1.5-pro多模态大模型，带联网功能，性能比1.0版强许多）
Claude-3-Sonnet（200分/条）（Anthropic推出的号称文本处理最强大模型，sonnet是其中智能和速度平衡版本）
GPT-4o（300分/条）（OpenAI推出的最新大模型，打通了文字、语音、视觉的对话，4o是一个综合了上下午的速度和成本优化版本）
付费使用：GPT-4(350分/条)，GPT-4-128k（2500分/条），Gemini-1.5-pro-128k（1750分/条），Command-R-Plus（1130分/条），Mistral-Large（1000分/条），Claude-3-Sonnet-200k（1000分/条），Claude-3-Opus(2000分/条)

lmsys的测试系统

Direct Chat：可以直接使用各种大模型对话，然后通过赞、踩、flag等方式帮着做体验反馈。
Arena(Battle)：同时使两个AI大模型对话，然后从中选优，相当于帮着进行大模型的盲测，包括GPT4、Claude-3-Opus这样的高级大模型需要在这里才能被调用

联系方式

邮件：vim@vim.org.cn　网站：www.vim.org.cn　留言：http://c.vim.org.cn

#AI, #选型, #经验

**这是本文档旧的修订版！**

目录