📚用文心一言搭建数字分身!
00 分钟
2023-10-14
2023-10-22
type
status
date
slug
summary
tags
category
icon
password
大家好,我是鹤涵。
百度的文心一言是国内首个推出的对标ChatGPT的大模型。虽然刚推出时像是个「猎奇性的炫酷玩具」,但随着时间的推移,并且加上百度在AI领域的历史积累,该模型的能力已经非常完善。现在已经有了网页端、APP、API等多种形式的使用方式。

一、文心一言

一)初识文心一言

3月16日,百度召开新闻发布会,新一代大语言模型、生成式产品文心一言正式发布。发布会上,展示出文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合实力。
四月份就拿到了文心一言的邀请码,当时就做了一些测试。十月份我再拿同样的问题进行测试,还是有很大进步的。
三个问题测试如下

1、蒸个一包子要十分钟,蒸十个包子要多久?

4月:
notion image
10月:
notion image
从简单的乘法逻辑,到可以考虑到可以同时蒸多个包子。逻辑能力有显著提升。

2、爷爷和奶奶能不能结婚?

4月:
notion image
10月:
notion image
知道爷爷和奶奶已经是结婚关系了,背景知识能力有很大提升。

3、林黛玉为什么倒拔垂杨柳?

4月:
文心一言
notion image
10月:
文心一言
notion image
GPT-4
notion image
这个经典的「林黛玉倒拔垂杨柳」产生幻觉的问题,直到今天最强模型GPT-4还是存在这个问题。
但是文心已经把可以识别出「林黛玉」和「垂杨柳」是出自两部书。虽然还是把垂杨柳安到了典韦身上🐶,但是对上下文的理解有了很大改善,效果比GPT-4要好。
 

二)文心一言APP

8月31日文心一言APP正式开放使用,在文心一言社区有很多好玩的创意分享,可以看到大模型的能力在赋能更多的生活工作场景。下载链接在文心一言页面的右上角
notion image
APP端的玩法就更多了。
1、支持语言输入输出。让与AI交流仿佛跟与真人在交流一样!
2、支持图像识别。对标GPT4V,输入一张图片就可以像人一样理解这个图片的信息。
3、支持应用商店和社区。用户可以把调教好的Prompt角色对话记录共享给其他用户使用。
notion image
 
notion image

二、星河社区 AI Studio

一)初识 AI Studio

今年8月16日,2023 WAVE SUMMIT 深度学习开发者大会上,AI Studio(星河社区)进行了最新升级,正式推出星河大模型社区,让开发者可以获得一体化大模型开发体验。飞桨+文心贯通全开发流程,与开发者持续共创大模型项目和应用。目前,星河大模型社区已积累超 300 个大模型创意应用。
notion image
在这里可以把自己的训练好的文生图,文生文模型上传到应用市场上。提示词工程师们可以在这构建自己的影响力了!~

二)发布第一个应用

使用文心一言构建一个MIdJourney提示词生成器

1、创建应用

notion image
填写一些应用的基本信息(名字,标签,分类等)。

2、填写提示词

notion image
这里填写比较主要的一些参数
1)角色信息设定:这是最最主要的部分,填写我们调教好的Prompt。
2)检索数据库:提高模型的的上下文长度的同时,也可以投喂一些自己的少量私有数据。
3)模型配置:Temperature,TOP_P用来制输出的随机性,基础模型控制对话使用文心模型的版本。

3、测试效果

notion image
应用链接放在这了,大家可以试玩一下

三、文心一言API ERNIE-Bot

一)初识ERNIE-Bot

近期【ERNIE-Bot-SDK】(文心一言英文ERNIE-Bot)正式发布,正在欢迎开发者体验。有了API就可以跟已有系统进行集成,而且可以构建出很多有想象力的应用。
对标OpenAI的Chat,Embedding,Function Calling,Image 接口能力都具备,还是比较完善。
notion image

二)实战测试

1、获取访问令牌

后台访问令牌页面可以进行复制,给后续调用使用。
notion image

2、运行SDK

可以使用官方提供的在线Gradio页面进行访问。
notion image
 
技术人员当推荐使用CodeLab的方式在线运行Python代码的方式来调用。既可以把文档和代码一起记录到笔记里,又可以在线运行代码避免本地安装依赖。
notion image

四、基于ERNIE-Bot构建数字分身

我们使用FastGPT+OneAPI+ERNIE-Bot技术栈,投喂私有数据,构建自己的数字分身。

一)接入ERNIE-Bot

为什么不直接接入FastGPT,非得中转一下呢?
One-API已经把各个模型的SDK统一适配到OpenAI的接口格式了。这样既减少了我们对接API的开发成本,又方便多模型互换。
 

1、创建应用

新建一个应用,获取APIKey,ScecretKey。
notion image

2、搭建One-API

搭建流程官网上讲解的都比较详细了。

3、集成到ERNIE-Bot

这样成功就接入了ERNIE-Bot,ERNIE-Bot-turbo,Embedding-V1三个模型
notion image

二)集成到FastGPT

1、FastGPT搭建

我在之前这篇文章向量检索构建智能知识库:实战与进阶 的第三部分讲的很详细

2、修改配置文件

修改 config.json 配置文件
在VectorModels中加入Embedding-V1模型
在ChatModels中加入模型ERNIE-Bot,ERNIE-Bot-turbo模型

三)数组分身搭建

1、创建知识库

知识库的索引类型选择文心的Embedding Model
notion image

2、投喂数据

投喂自己文章的文本或者链接
notion image
 

3、应用搭建

创建应用,关联上述知识库,勾选文心的Chat模型。
notion image

三)效果测试

问「鹤涵是谁」这种私有问题的时候会从知识库中向量查找相关联的数据,从而做出回应。当我们不断灌入某人记忆,AI数字分身的行为就越跟真人类似。
notion image
 

五、百度世界大会

最近注意到10月17日即将开始的百度世界大会,李彦宏将在现场进行主题为「手把手教你做AI原生应用」的演讲。期待在百度世界大会之后涌现更多的AI原生应用。
大会有五大亮点
亮点一:李彦宏「手把手教你做A原生应用」
亮点二:文心一言能力再升级
亮点三:全新搜索网盘地图等齐亮相
亮点四:AI大模型的开发新革命
亮点五:沉浸式A科技展,打开想象
 
无论你是创业者、从业者,技术人员还是AI爱好者,都将在这里获得想要的答案!
10月17日百度世界大会不见不散
notion image

评论
Loading...