vim笔记

放慢,走稳,深呼吸……

用户工具

站点工具


it:ai_experience_for_novice

AI | 给非技术背景AI用户的上手指南

作者:vim 版本:pv3.2.4r 注册文库:vim笔记

总体思路

选择1-2个适合自己的AI服务(建议国内外各选一家),了解AI的基本功能、对话语法先用起来。后续适当了解一些AI的工作原理、后端机制、以及不同的大模型的特性,根据具体的应用场景和需求,逐步进阶使用。在有高级或者特殊的需求(如涉及隐私及保密需求,或者需要建立内部知识库),就需要专业的研究学习一下了。本文主要面向前面两种场景,并简单介绍一下高级应用的方向。

Note:这篇文章只讨论中国用户可以使用的那些AI系统(可能需要科学使用),ChatGPT、Gemini这些目前还没有对中国用户开放的平台不做讨论。同时,本文只讨论可以直接使用的AI服务,那些需要调用API的前端AI应用也不多做讨论。

适合一般用户的AI选型

Note:国外的AI服务普遍需要科学使用,推荐一家国际出行的服务方(eFan),我从2021年就开始使用了,速度和稳定性很不错。

Note:以上AI服务商及相关大模型简介,以及积分使用策略,文末附件部分做简单介绍

AI用法进阶

  1. 基础玩法:从前面推荐的AI服务中选择1-2个,根据个人直觉和一般经验随便用起来,边用边摸索就好。
  2. 专业玩法:研究不同AI服务和大模型的特点,学习AI提示词的用法,基于不同场景和需求进行AI选型和专业化的对话。
  3. 高级玩法:并可以进一步在支持智能体定制的平台上,定制专用的AI智能体,建立专业知识库。
  4. 高级玩法:搭建自己的本地AI大模型后端环境,架设本地的AI前端应用,构建专业知识库,训练专用的AI行业/专家模型。

AI分层应用方案

基础应用(简单选型,直觉操作)

从下面的AI系统中,任选1-2个,然后按直觉使用就好,也可以先初步学习一下基础的AI提示词用法。

专业应用(针对选型,专业对话)

在前面日常使用的基础上,结合应用场景和需求,选择适合的高级大模型,学习一下AI提示词的用法,并学会专业的Prompt提示词语法与AI进行专业对话,提高对话效率。

高级应用(智能体定制,知识库建设)

在前面AI应用基础上,可以在支持智能体定制的平台上(如POE、智谱AI),定制自己的专用AI智能体角色(如行政助理、行业专家、学术秘书等),并建立专用的知识库(如医学论文集,社会治理档案集,管理咨询资料库等),进一步提高对话质量。

智能体定制主要内容

  1. 基座大模型的选择
  2. 智能体角色、任务、知识、技能、输出规则、对话规范、工作流、问候信息等常用提示词设置
  3. 上传相关资料文档,建立智能体的后端知识库
  4. 设置大模型的技术特性(如:发散性、上下文层次、TopP、TopK等)
  5. 功能插件的选择调用(如搜索引擎调用、天气查询、图片生成与识别、OCR、网盘接入、第三平台数据接入等)
  6. 模型功能的选择(如联网、绘画、代码、语音合成、Markdown渲染等)
  7. 选择智能体的发布平台和开放程度

不同的平台可以做的设置各有差别,其中1和2基本上是每个智能体定制平台都有的,后面的其它设置,不同平台各有不同。根据需要选择定制就好。

极客玩法(本地专家模型,行业知识库)

有些时候,你会面临一些特殊和高级的场景的需求。比如对话内容和分析资料有保密需要(如处理涉密文档和商业文件)和隐私需求(比如涉及自己和他人隐私,或者想整些不和谐的玩法);或者需要为机构或团队内部训练出一个行业性专家大模型,进行内部的高级知识管理。这时候,可以自行架设一个软硬件一体的本地AI环境。

硬件选型相对简单:2020年之后产的Intel-i7、AMD-R7以上的CPU,nVidia-3060-8G、AMD-5600XT以上的GPU,32G以上的内存——硬件性能堆得越足,能跑的AI大模型越多、速度越快,根据需求和预算整就行。(具体成本可以网上查更专业资料)

软件选型如下:

个人(或者2-5人小团队)使用,最简单办法是装个LM-Studio,主打前端应用,直接支持Llama3、Mistral、Phi3等近二十种大模型。Windows、Mac、Linux都可以直接下载安装包安装使用。可以让你像其它普通桌面软件一样,在本地安装使用AI大模型,并可以直接在LM-Studio的界面中使用;打开软件的web服务功能,也可以让其它设备通过浏览器及NextGPT/OpenWebUI这些客户端,访问服务端的大模型服务。

机构(或者团队)使用,推荐在服务端安装Ollama,可以支持包括Llama3、Mistral、Gemini在类的几乎所有开源大模型。同样有Linux、Mac、Win在内的安装包,或者更简单的通过docker安装,一条docker命令搞定。使用方法也类似docker。然后,你同样可以安装OpenWebUI、Dify、MaxKB这样的前端应用,连上Ollama的服务器后,更方面的使用Ollama里的大模型服务。使用体验和前面介绍的那些专业的AI服务类似。

至于Ollama具体如何安装使用,Dify、MaxKB这些前端如何安装配置,是另一个层面需要了解的内容,网上已经有许多详细教程,就不在这篇文章里赘述了。如果需要,可以自行通过Bing、B站等找到相关内容。有这种需求和想法的人,应该也不用我再多说什么了。


AI服务推荐

  • Kimi

kimi(https://kimi.moonshot.cn)是本土AI企业月之暗面推出的人工智能助手,有很强的文字对话、信息检索和文档分析能力,免费,可联网,用户体验极佳。(就是近期用户增长太长,算力不足,时不时躺平。)

  • 智谱AI

智谱AI(https://chatglm.cn)是本土AI企业智谱华章推出的生成式AI助手,功能比较全面,通用问答、创意写作、图片生成、文档分析都有,免费,可联网,可定制智体能,用户体验主流水平。(中规中矩,没有特别好或者不好)

  • 万知AI

万知AI(https://www.wanzhi.com)是本土AI公司零一万物推出的一站式AI工作平台,特别针对白领工作中的查资料、读文档、做PPT等场景做了特别优化,免费、可联网,支持40万字超长文本。(底层性能比前两家都要强,刚刚推出,用户体验还需要跟上)

  • Poe

Poe(https://poe.com)是美国企业Quora推出的AI成平台,可以直接使用GPT、Claude、Gemini等通用大模型,也可以使用StableDiffusion、Playground、Dall-E等图像大模型进行图像生成,每天免费3000积分,轻度使用基本可以白嫖。(中国用户可直接注册使用,需科学访问)

  • HuggingChat

HuggingChat(https://huggingface.co/chat)是由AI社区HuggingFace推出,提供Llama3、Command-R+、Mixtral等多个可联网的开源大模型。可直接注册,完全免费,彻底摆脱Token焦虑。(中国用户可直接注册使用,需科学访问)

  • Playground AI

Playground AI(https://playground.com)由PlaygroundAI推出的AI图像创作平台,可以允许用户通过简单的文本提示生成高质量的图像、海报、logo和艺术作品,以及图像修复、去除背景、图像放大等图像编辑功能,或者根据上传已有图像生成新的图像等。且生成的内容可以商用。免费用户每天可以生成50张图,一般情况够用。

  • Perplexity

Perplexity是一个AI驱动的会话式搜索引擎。允许用户使用自然语言提出问题,并提供结构化的答案,同时支持答案的来源追溯。它主要利用大型语言模型和自然语言处理技术从网络中搜集相关信息,通过Rag技术综合生成对用户查询的回答。多的不用说,当前业内最强AI搜索服务。

  • 知乎直答

知乎直答是知乎推出的一款AI搜索问答产品,功能和特点和Perplexity类似。在此基础上,依托知乎自身的优质内容库,对国内的一些问题回答有一定的优势。

  • 秘塔搜索

秘塔搜索是上海秘塔科技推出的一款AI搜索引擎,对标Perplexity。原理和Perplexity类似,其特色在于多层级(简洁、深入、研究)的搜索选择,尤其是学术搜索,可以搜索专业学术数据库中的资料,并生成科研场景的资料和综述。同时有非常细致的生成内容的页面呈现。

  • Coze

Coze(http://www.coze.com)是由字节跳动推出的GPTs类似的AI智能体定制平台,可以直接调用多家AI基础大模型、功能插件,并可以定制专用知识库和复杂应用的工作流等。生成各种专用AI智能体。有国内版和国际版。

  • Dify

Dify是一个AI智能体和知识库定制平台,和GPTs、Coze类似。可以通过调用AI基础大模型的API,以及平台提供的功能插件,生成各种专用AI智能体。优势在于知识库定制更专业,以及系统开源,可以在自己的内部部署。

  • LMsys

LMsys(https://chat.lmsys.org/)是由加州大学和卡内基梅隆大学推出的AI大模型测试平台,免费使用几乎所有的大模型,无需注册,用的时候对AI输出的内容,顺手提供一下体验反馈即可。

Direct Chat:可以直接使用各种大模型对话,然后通过赞、踩、flag等方式帮着做体验反馈。
Arena(Battle):同时使两个AI大模型对话,然后从中选优,相当于帮着进行大模型的盲测,包括GPT4、Claude-3-Opus这样的高级大模型需要在这里才能被调用

  • Groq

Groq.com是一家专业的LPU硬件和数据分析服务商,提供了多家开源大模型的测试服务,包括:llama3.1、Mixtral、Gemma2等。可以直接注册使用,需要科学访问。特点就是快,极其的快。不足是对话记录不保存、只能进行文本对话。需要临时AI快速对话,且有一定隐私保护需求的,可以备用。

AI大模型简介

开源大语言模型

  • Meta-Llama-3.1-70B-Instruct(由Meta推出的大模型,就专业指标来说是目前最强开源大模型,已经补足中文短板)
  • c4ai-command-r-plus(由Cohere推出的最新开源LLM产品,曾在LMsys的机器人竞技场中击败过GPT4,中文对话质量高)
  • Yi-1.5-34B-Chat(由中国企业零一万物推出的大模型,专业指标与前两者同一水平,采用高质量数据训练,对齐人类偏好,可申请免费商用,中文对话更是优势)
  • Mixtral-8x7B-Instruct-v0.1(由欧洲AI创业企业Mistral推出的开源大模型,该团队由Meta的法国AI团队组成,号称最佳对话大模型)
  • Phi-3-mini-4k-instruct(由Microsoft推出的轻量级大模型)

Note:以上开源大模型,均可以在HuggingChat里免费使用

商用主流大语言模型

(开发机构,LMsys排名,主要特性,最佳用途)

  • Claude(Anthropic推出,LMsys头部选手,在语义理解、文本处理能力方面表现突出,输出质量与回复速度有优势)
  • GPT(OpenAI推出,LMsys头部选手,强大的语言生成能力、推理能力、数学能力、编码能力等,扩展支持多模态能力,全能型选手)
  • Gemini(Google推出,LMsys头部选手,原生多模态AI模型,支持文本、图像和视频输入,自然语言理解能力强,)

图像大模型

  • Playground(Playground AI开发的最新文本到图像生成模型,它在美学质量、颜色和对比度、多纵横比生成以及人物细节方面)
  • Dall-E(OpenAI推出的文图大模型,主要结合GPT使用,能生成具有复杂细节的高质量图像)
  • Stable Diffusion(Stability AI推出的图像生成大模型,提供文本到图像的生成,能够根据文本描述生成详细和逼真的图像)
  • Flux.AI(Stability AI团队分裂出来建立的新的AI图像大模型,具有顶级的提示跟随、视觉质量、图像细节和输出多样性)

Note:以上语言大模型和图像大模型,均可以在POE里通过积分使用(每天免费提供3000积分)

POE的AI机器人

基础助理机器人

基于各家大模型公司基础版大模型,速度快、费用低,智能化程度相对较低,但一般对话和简单信息处理足够。

  • Assistant(20分/条)(由POE官方推出,整合了OpenAI、Anthropic、Goolge等公司大模型技术服务的通用智能助理)
  • Gemini-1.5-Flash(5分/条)(Google推出Gemini-1.5-Flash多模态小模型,增加联网搜索功能,优化速度和成本)
  • GPT-4o-mini(15分/条)(OpenAI的多模态小模型,适合各语种快速对话和编程任务)
  • Claude-3-Haiku(30分/条)(Anthropic推出的文本处理最强大模型,haiku是其中的速度优化版,缩短了上下文长度,优化速度和成本)
  • Llama-3.1-8B(20分/条)(Meta推出的最强开源大模型,功能与商业大模型类似,这个版本是它的精减版)

联网搜索机器人

在AI大模型即有功能的基础上,提供了联网信息搜索功能的AI机器人。

  • Websearch(30分/条)(基于Anthropic的Claude-3-Haiku小模型,增加联网搜索功能,适合信息搜索、特定事实查询和初步处理。)
  • Gemini-1.5-Flash-Search(25分/条)(基于Google的Gemini多模态基础大模型,结合Google联网搜索功能,适合信息搜索和基础处理)
  • Gemini-1.5-Pro-Search(175分/条)(基于Google的Gemini高级多模态大模型,结合Google联网搜索功能,适合信息搜索和高级处理)

主流对话机器人

基于各家企业的主流大模型的机构器,成本较高,但智能处理能力较强。

  • Claude-3.5-Sonnet(295分/条)(Anthropic推出的大模型,文本处理功能强大,同时擅长自主编码和视觉处理等复杂任务)
  • Gemini-1.5-pro(175分/条)(Google推出的多模态大模型,带联网功能,性能比1.0版强许多)
  • GPT-4o(300分/条)(OpenAI推出的最新大模型,打通了文字、语音、视觉的对话,4o是一个综合了上下午的速度和成本优化版本)
  • Llama-3.1-70B(300分/条)(Meta推出的最强开源大模型,功能与商业大模型类似,而费用更低)

会员版机器人·长文本机器人

在用户升级为会员后,还可以进一步使用以下高级大模型

GPT-4-Turbo(350分/条),Command-R-Plus(1130分/条),Mistral-Large-2(1000分/条),Claude-3.5-Sonnet-200k(1000分/条),Claude-3-Opus(2000分/条)

长文本处理版本

如需进行长文本对话,比如处理很长的文本资料,或者在单一对话中长期对话,可以选择以上模型的长文本版本——即在相关模型后面,增加了“128k”、“1M”、“2M”类似后缀的版本。

联系方式

邮件:vim@vim.org.cn 网站:www.vim.org.cn 留言:联系vim同志

it/ai_experience_for_novice.txt · 最后更改: 2024/08/28 19:10 由 127.0.0.1