**这是本文档旧的修订版!**
目录
AI | 给非技术背景AI用户的上手指南
作者:vim 版本:pv3.1.0r 注册文库:vim笔记
总体思路
选择1-2个适合自己的AI服务(建议国内外各选一家),了解AI的基本功能、对话语法先用起来。后续适当了解一些AI的工作原理、后端机制、以及不同的大模型的特性,根据具体的应用场景和需求,逐步进阶使用。在有高级或者特殊的需求(如涉及隐私及保密需求,或者需要建立内部知识库),就需要专业的研究学习一下了。本文主要面向前面两种场景,并简单介绍一下高级应用的方向。
Note:这篇文章只讨论中国用户可以使用的那些AI系统(可能需要科学使用),ChatGPT、Gemini这些目前还没有对中国用户开放的平台不做讨论。同时,本文只讨论可以直接使用的AI服务,那些需要调用API的前端AI应用也不多做讨论。
适合一般用户的AI选型
- AI通用对话(国外):主推Poe,候选Hugging Chat
- AI特殊场景:LMsys(https://chat.lmsys.org/)
Note:以上AI服务商及相关大模型简介,以及积分使用策略,文末附件部分做简单介绍
进阶用法
- 基础玩法:从前面推荐的AI服务中选择1-2个,根据个人直觉和一般经验随便用起来,边用边摸索就好。
- 专业玩法:研究不同AI服务和大模型的特点,学习AI提示词的用法,基于不同场景和需求进行AI选型和专业化的对话。
- 高级玩法:并可以进一步在支持智能体定制的平台上,定制专用的AI智能体,建立专业知识库。
- 高级玩法:搭建自己的本地AI大模型后端环境,架设本地的AI前端应用,构建专业知识库,训练专用的AI行业/专家模型。
AI分层应用方案
基础应用(简单选型,直觉操作)
从下面的AI系统中,任选1-2个,然后按直觉使用就好,也可以先初步学习一下基础的AI提示词用法。
- 图片生成:推荐Poe的Playground机器人,候选Playground AI
专业应用(针对选型,专业对话)
在前面日常使用的基础上,结合应用场景和需求,选择适合的高级大模型,学习一下AI提示词的用法,并学会专业的Prompt提示词语法与AI进行专业对话,提高对话效率。
高级应用(智能体定制,知识库建设)
在前面AI应用基础上,可以在支持智能体定制的平台上(如POE、智谱AI),定制自己的专用AI智能体角色(如行政助理、行业专家、学术秘书等),并建立专用的知识库(如医学论文集,社会治理档案集,管理咨询资料库等),进一步提高对话质量。
智能体定制的常用设置包括:
- 基座大模型的选择
- 智能体角色、任务、知识、技能、输出规则、对话规范、工作流、问候信息等常用提示词设置
- 上传相关资料文档,建立智能体的后端知识库
- 设置大模型的技术特性(如:发散性、上下文层次、TopP、TopK等)
- 功能插件的选择调用(如搜索引擎调用、天气查询、图片生成与识别、OCR、网盘接入、第三平台数据接入等)
- 模型功能的选择(如联网、绘画、代码、语音合成、Markdown渲染等)
- 选择智能体的发布平台和开放程度
不同的平台可以做的设置各有差别,其中1和2基本上是每个智能体定制平台都有的,后面的其它设置,不同平台各有不同。根据需要选择定制就好。
- 基础定制:推荐国内的智谱AI,以及国际的POE
极客玩法(本地专家模型,行业知识库)
有些时候,你会面临一些特殊和高级的场景的需求。比如对话内容和分析资料有保密需要(如处理涉密文档和商业文件)和隐私需求(比如涉及自己和他人隐私,或者想整些不和谐的玩法);或者需要为机构或团队内部训练出一个行业性专家大模型,进行内部的高级知识管理。这时候,可以自行架设一个软硬件一体的本地AI环境。
硬件选型相对简单:2020年之后产的Intel-i7、AMD-R7以上的CPU,nVidia-3060-8G、AMD-5600XT以上的GPU,32G以上的内存——硬件性能堆得越足,能跑的AI大模型越多、速度越快,根据需求和预算整就行。(具体成本可以网上查更专业资料)
软件选型如下:
个人(或者2-5人小团队)使用,最简单办法是装个LM-Studio,主打前端应用,直接支持Llama3、Mistral、Phi3等近二十种大模型。Windows、Mac、Linux都可以直接下载安装包安装使用。可以让你像其它普通桌面软件一样,在本地安装使用AI大模型,并可以直接在LM-Studio的界面中使用;打开软件的web服务功能,也可以让其它设备通过浏览器及NextGPT/OpenWebUI这些客户端,访问服务端的大模型服务。
机构(或者团队)使用,推荐在服务端安装Ollama,可以支持包括Llama3、Mistral、Gemini在类的几乎所有开源大模型。同样有Linux、Mac、Win在内的安装包,或者更简单的通过docker安装,一条docker命令搞定。使用方法也类似docker。然后,你同样可以安装OpenWebUI、Dify、MaxKB这样的前端应用,连上Ollama的服务器后,更方面的使用Ollama里的大模型服务。使用体验和前面介绍的那些专业的AI服务类似。
至于Ollama具体如何安装使用,Dify、MaxKB这些前端如何安装配置,是另一个层面需要了解的内容,网上已经有许多详细教程,就不在这篇文章里赘述了。如果需要,可以自行通过Bing、B站等找到相关内容。有这种需求和想法的人,应该也不用我再多说什么了。
AI服务推荐
Kimi
kimi(https://kimi.moonshot.cn)是本土AI企业月之暗面推出的人工智能助手,有很强的文字对话、信息检索和文档分析能力,免费,可联网,用户体验极佳。(就是近期用户增长太长,算力不足,时不时躺平。)
智谱AI
智谱AI(https://chatglm.cn)是本土AI企业智谱华章推出的生成式AI助手,功能比较全面,通用问答、创意写作、图片生成、文档分析都有,免费,可联网,可定制智体能,用户体验主流水平。(中规中矩,没有特别好或者不好)
万知AI
万知AI(https://www.wanzhi.com)是本土AI公司零一万物推出的一站式AI工作平台,特别针对白领工作中的查资料、读文档、做PPT等场景做了特别优化,免费、可联网,支持40万字超长文本。(底层性能比前两家都要强,刚刚推出,用户体验还需要跟上)
Poe
Poe(https://poe.com)是美国企业Quora推出的AI成平台,可以直接使用GPT、Claude、Gemini等通用大模型,也可以使用StableDiffusion、Playground、Dall-E等图像大模型进行图像生成,每天免费3000积分,轻度使用基本可以白嫖。(中国用户可直接注册使用,需科学访问)
HuggingChat
HuggingChat(https://huggingface.co/chat)是由AI社区HuggingFace推出,提供Llama3、Command-R+、Mixtral等多个可联网的开源大模型。可直接注册,完全免费,彻底摆脱Token焦虑。(中国用户可直接注册使用,需科学访问)
Playground AI
Playground AI(https://playground.com)由PlaygroundAI推出的AI图像创作平台,可以允许用户通过简单的文本提示生成高质量的图像、海报、logo和艺术作品,以及图像修复、去除背景、图像放大等图像编辑功能,或者根据上传已有图像生成新的图像等。且生成的内容可以商用。免费用户每天可以生成50张图,一般情况够用。
Coze
Coze(http://www.coze.com)是由字节跳动推出的GPTs类似的AI智能体定制平台,有国内版和国际版。可调用多家AI大模型和众多信息源,定制复杂应用的工作流等。
LMsys
LMsys(https://chat.lmsys.org/)是由加州大学和卡内基梅隆大学推出的AI大模型测试平台,免费使用几乎所有的大模型,无需注册,用的时候对AI输出的内容,顺手提供一下体验反馈即可。
AI大模型简介
开源大模型
HuggingChat可用
- c4ai-command-r-plus(由Cohere推出的最新开源LLM产品,曾在LMsys的机器人竞技场中击败过GPT4,中文对话质量高)
- Yi-1.5-34B-Chat(由中国企业零一万物推出的大模型,专业指标与前两者同一水平,采用高质量数据训练,对齐人类偏好,可申请免费商用,中文对话更是优势)
- Meta-Llama-3-70B-Instruct(由Meta推出的大模型,就专业指标来说是目前最强开源大模型,中文训练略有不足,中文对话差点劲)
- zephyr-orpo-141b-A35b(由HuggingChat基于欧洲AI企业Mistral推出的开源大模型Mistral 8x22B微调出来的优化版本)
- gemma-1.1-7b-it(由Google推出的Gemma系列轻量级大模型)
- Phi-3-mini-4k-instruct(由Microsoft推出的轻量级大模型)
其它
- Stable Diffusion(Stability AI推出的图像生成大模型,提供文本到图像的生成,能够根据文本描述生成详细和逼真的图像)
- Playground(Playground AI开发的最新文本到图像生成模型,它在美学质量、颜色和对比度、多纵横比生成以及人物细节方面)
商用主流大模型(开发机构,LMsys排名,主要特性,最佳用途)
- GPT-4(OpenAI推出,LMsys头部选手,强大的语言生成能力、推理能力、数学能力、编码能力等,扩展支持多模态能力,全能型选手)
- Gemini-1.5(Google推出,LMsys头部选手,原生多模态AI模型,支持文本、图像和视频输入,自然语言理解能力强,)
- Claude-3(Anthropic推出,LMsys头部选手,在语义理解、文本处理能力方面表现突出,输出质量与回复速度有优势)
POE的AI机器人(功能与积分)
- Websearch(40分/条)(基于OpenAI的GPT3.5-turbo大模型,增加联网搜索功能,适合信息搜索、特定事实查询和初步处理。)
- Assistant(20分/条)(基于OpenAI的GPT3.5-turbo和的Claude-3-Haiku,适合各语种对话和编程任务)
- Gemini-1.0-Pro-Search(20分/条)(Google的Gemini-1.0-pro多模态大模型,带联网功能,适合一般性对话)
- Gemini-1.5-Flash(25分/条)(Google推出的最新多模态大模型,优化速度和成本,缩短了上下文长度,适合不太复杂对话)
- Claude-3-Haiku(Anthropic推出的号称文本处理最强大模型,haiku是其中的速度优化版,缩短了上下文长度,适合不太复杂对话)
- Gemini-1.5-pro-Search(175分/条)(Google推出的Gemini-1.5-pro多模态大模型,带联网功能,性能比1.0版强许多)
- Claude-3-Sonnet(200分/条)(Anthropic推出的号称文本处理最强大模型,sonnet是其中智能和速度平衡版本)
- GPT-4o(300分/条)(OpenAI推出的最新大模型,打通了文字、语音、视觉的对话,4o是一个综合了上下午的速度和成本优化版本)
- 付费使用:GPT-4(350分/条),GPT-4-128k(2500分/条),Gemini-1.5-pro-128k(1750分/条),Command-R-Plus(1130分/条),Mistral-Large(1000分/条),Claude-3-Sonnet-200k(1000分/条),Claude-3-Opus(2000分/条)
lmsys的测试系统
- Direct Chat:可以直接使用各种大模型对话,然后通过赞、踩、flag等方式帮着做体验反馈。
- Arena(Battle):同时使两个AI大模型对话,然后从中选优,相当于帮着进行大模型的盲测,包括GPT4、Claude-3-Opus这样的高级大模型需要在这里才能被调用
联系方式