00:00 - 00:02

DeepSeek 深夜又开始放大招

00:02 - 00:04

视觉多模态AI大模型

00:04 - 00:06

Janus Pro 7B正式开源

00:06 - 00:08

人人都可以免费使用

00:08 - 00:11

从最新的基准测试评分中我们可以看到

00:11 - 00:13

它的性能是优于OpenAI的DALL - E3

00:13 - 00:16

还有StableDiffusion文生图大模型的

00:16 - 00:18

当然实际情况需要我们本地部署运行

00:18 - 00:20

测试以后才可以知晓

00:20 - 00:21

大家好

00:21 - 00:22

这里是零度解说

00:22 - 00:25

最近非常火的DeepSeek R1大模型

00:25 - 00:27

在开源的AI大模型领域

00:27 - 00:28

几乎是屠榜的存在

00:28 - 00:30

有人质疑 也有人点赞

00:30 - 00:33

还引来了美国现任总统 特朗普

00:33 - 00:34

还有埃隆·马斯克的置评

00:34 - 00:36

但这些都不是我们讨论的范围

00:36 - 00:38

今天我们主要来说一下

00:38 - 00:40

如何本地部署这个DeepSeek

00:40 - 00:43

最新开源的AI文生图大模型

00:43 - 00:45

它就是这个Janus Pro 7B

00:45 - 00:47

多模模态视觉大模型

00:47 - 00:48

在开始之前

00:48 - 00:49

首先我们打开这个帖子

00:49 - 00:51

这个链接我会放在视频下方

00:51 - 00:52

打开以后

00:52 - 00:53

然后在下方这里我们看到

00:53 - 00:54

首先第一步

00:54 - 00:56

我们需要确认一下

00:56 - 00:58

你当前电脑上有没有按照这个Conda

00:58 - 00:59

还有Git环境

00:59 - 01:01

如果你不知道如何检查的话

01:01 - 01:02

那么现在你可以跟我一样

01:02 - 01:03

在下方搜索栏里

01:03 - 01:04

我们输入关键词

01:04 - 01:05

cmd

01:05 - 01:08

来进入到命令提示符

01:08 - 01:09

打开以后

01:09 - 01:10

现在我们输入命令

01:10 - 01:10

Git

01:10 - 01:11

来后面跟着空格

01:11 - 01:12

-v

01:12 - 01:13

来查一下我们当前电脑上

01:13 - 01:15

是否安装了Git环境

01:15 - 01:16

如果你跟我一样

01:16 - 01:18

在上方这里看到这个Git的版本话

01:18 - 01:20

那说明当前你是安装的

01:20 - 01:22

如果你没看到类似的信息的话

01:22 - 01:23

那么到时候你点击上方的超链接

01:23 - 01:25

来打开这个Git的官网

01:25 - 01:28

点击下方有一个Download for Windows

01:28 - 01:28

进入以后

01:28 - 01:31

然后根据情况来下载对应版本

01:31 - 01:32

前面两个是安装版

01:32 - 01:34

然后后面两个是免安装版

01:34 - 01:36

这里建议大家选择安装版

01:36 - 01:36

下载以后

01:36 - 01:38

然后打开进行安装就可以了

01:38 - 01:39

因为我之前已经安装过了

01:39 - 01:41

所以这里我就不再重复安装了

01:41 - 01:42

然后第二个就检查你当前电脑上

01:42 - 01:44

是否安装了Conda环境

01:44 - 01:45

然后我们输入

01:45 - 01:46

conda

01:46 - 01:47

然后后面跟上

01:47 - 01:48

-version

01:48 - 01:51

来检查你当前conda版本

01:51 - 01:53

我当前看的版本是24.7.1

01:53 - 01:54

是目前比较新的版本

01:54 - 01:56

当然如果你没有的话

01:56 - 01:57

那么到时候就需要安装一下

01:57 - 01:58

回到刚才帖子下

01:58 - 02:01

然后打开我们看到这个超链接

02:01 - 02:02

进入以后

02:02 - 02:04

然后在这里填写你自己的邮箱

02:04 - 02:05

来接收下载链接

02:05 - 02:07

接着点击下方同意它的条款协议

02:07 - 02:09

最后我们点击确认一下

02:09 - 02:10

这样的话就可以了

02:10 - 02:13

它就会把这个下载链接发到你的邮箱里

02:13 - 02:14

打开邮件以后就看到

02:14 - 02:17

在上方这里它就会提供下载链接了

02:17 - 02:18

到时候自行下载安装就可以了

02:18 - 02:20

它下方有这个Windows版本

02:20 - 02:21

还有Mac

02:21 - 02:22

Linux版本都可以

02:22 - 02:24

当你安装好这两个环境以后

02:24 - 02:25

然后现在来执行第二步

02:25 - 02:27

就创建虚拟环境

02:27 - 02:28

到时候跟我一样

02:28 - 02:29

把这行命令给copy出来

02:29 - 02:32

点击下方有copy按钮

02:32 - 02:33

复制代码以后

02:33 - 02:34

重新回到终端下

02:34 - 02:36

接下来鼠标右键粘贴下

02:36 - 02:37

接着我们确认一下

02:37 - 02:40

它就会自动开始创建虚拟环境

02:40 - 02:41

我们等一会

02:41 - 02:46

好 创建好虚拟环境以后

02:46 - 02:48

然后现在我们需要进行激活下

02:48 - 02:49

就把这行命令给copy出来

02:49 - 02:53

粘贴进来

02:53 - 02:55

确认一下

02:55 - 02:56

激活虚拟环境以后

02:56 - 02:57

然后现在执行第四步

02:57 - 03:00

就拉取这开源的Janus Pro这个项目

03:00 - 03:02

这个项目它是托管在GitHub开源平台上的

03:02 - 03:04

现在我们同样把这行命令给copy出来

03:04 - 03:07

好 copy好以后

03:07 - 03:08

回到终端下

03:08 - 03:09

鼠标右键粘贴

03:09 - 03:11

把这个项目给它拉取到本地

03:11 - 03:13

如果你跟我一样在上方显示

03:13 - 03:15

这个Git不是内部或者外部的命令

03:15 - 03:17

也不是可运行的程序

03:17 - 03:20

那么很可能是因为你之前没有正确安装Git环境

03:20 - 03:22

或者是没有把这个Git添加到环境变量

03:22 - 03:24

然后现在我们重新安装一下这个Git

03:24 - 03:26

这可能是因为刚才我重新运行以后

03:26 - 03:28

它可能把之前的环境变量给删除掉了

03:28 - 03:29

我重新运行一下

03:29 - 03:30

来进行安装一下

03:30 - 03:35

这里我们默认安装就可以了

03:35 - 03:35

点下一步

03:35 - 03:39

接着下一步就可以了

03:39 - 03:44

好 重新安装好以后

03:44 - 03:45

然后就给它删除掉

03:45 - 03:46

进入重新再运行一下这个命令

03:46 - 03:49

看行不行

03:49 - 03:50

好 这样的话就可以了

03:50 - 03:53

但这里需要注意一下的事

03:53 - 03:54

如果你不在海外的话

03:54 - 03:56

在你拉取这个GitHub开源项目的时候

03:56 - 03:58

一定要提前做好科学上网

03:58 - 04:00

否则的话你是没法下载的

04:00 - 04:01

好 下载好以后

04:01 - 04:02

然后先把进入到Janus根目录

04:02 - 04:03

输入cd

04:03 - 04:05

然后后面跟上Janus

04:05 - 04:08

进入到根目录以后

04:08 - 04:10

然后先安装下Janus的依赖环境

04:10 - 04:12

到时候跟我一样来执行第六步

04:12 - 04:14

把这行命令给快copy出来

04:14 - 04:15

点击复制一下

04:15 - 04:17

然后粘贴进来

04:17 - 04:18

然后确认一下

04:18 - 04:19

确认以后需要稍微等待一下

04:21 - 04:23

好 当我们安装好这个依赖环境以后

04:23 - 04:25

然后现在需要安装一个UI界面

04:25 - 04:27

到时候重新回到刚才帖子下

04:27 - 04:28

来执行第七步

04:28 - 04:31

就是通过这个Gradio来安装这个UI界面

04:31 - 04:33

现在我们只要把下方这行命令给copy出来

04:33 - 04:34

然后现在执行一下这个命令

04:34 - 04:36

输入以后确认一下

04:36 - 04:39

好 这样的话它就开始自行安装了

04:39 - 04:40

我们稍等一会

04:40 - 04:42

这个过程可能需要点时间

04:42 - 04:44

好 当上方显示已成功安装以后

04:44 - 04:46

然后现在我们执行最后一步

04:46 - 04:47

就运行启动命令

04:47 - 04:49

把下方这行命令给copy出来

04:50 - 04:51

然后最后执行一下这个命令

04:51 - 04:54

粘贴以后接着我们确认一下

04:54 - 04:55

然后现在稍等一会

04:55 - 04:57

这大家别以为卡住了

04:57 - 04:59

它是在后台运行的

04:59 - 05:00

我们稍微等待一下

05:00 - 05:01

好 这时候我们可以看到

05:01 - 05:04

它现在已经开始拉取这个模型文件了

05:04 - 05:06

第一个模型分卷的话大概是10个G左右

05:06 - 05:08

这个模型文件还是非常大的

05:08 - 05:09

所以到时候你要确保你的电脑硬盘

05:09 - 05:11

有足够的空间才可以

05:11 - 05:12

这个多模态视觉模型

05:12 - 05:14

整个下载过程可能需要点时间

05:14 - 05:16

到时候大家自己耐心等待一下

05:16 - 05:17

好 过了几分钟以后

05:17 - 05:19

它现在已经下载安装好了

05:19 - 05:20

当你看到上方有两个链接的话

05:20 - 05:22

那说明它已经成功安装了

05:22 - 05:23

第一个就是本地链接

05:23 - 05:24

到时候你通过这个地址

05:24 - 05:26

就127.0.0.1

05:26 - 05:28

然后后面跟上端口7860

05:28 - 05:30

在我们浏览器上就可以打开

05:30 - 05:31

我们来试一下

05:31 - 05:32

打开我们浏览器

05:32 - 05:33

然后在上方打个这个地址

05:33 - 05:37

好 这样的话就可以了

05:37 - 05:39

当你看到界面的话

05:39 - 05:40

那说明它已经成功安装好了

05:40 - 05:42

然后第二个链接的话就是外网链接

05:42 - 05:44

我们也可以通过这个链接打开进行使用

05:44 - 05:46

Copy 出来

05:46 - 05:47

然后现在打开试一下

05:47 - 05:48

也是可以的

05:48 - 05:50

当然如果你是在内网中的话

05:50 - 05:52

那么到时候你需要进端口映射

05:52 - 05:54

就把这个7860端口映射出去

05:54 - 05:55

才可以在外网进行访问

05:55 - 05:57

然后接下来说一下

05:57 - 05:58

如何进行使用

05:58 - 06:00

像上方第一个的话就是多模态视觉功能

06:00 - 06:02

就通过这个功能的话

06:02 - 06:03

它可以对图片进行识别

06:03 - 06:05

像第一个多模态视觉功能的话

06:05 - 06:06

我们可以测试一下效果

06:06 - 06:08

比如现在我上传这张图片

06:08 - 06:08

然后现在我问它一下

06:08 - 06:10

看它知不知道这个图片是哪里的

06:10 - 06:11

输入好问题以后

06:11 - 06:14

然后最后我们点击下方这个对话就可以了

06:14 - 06:15

好 它立马就出来了

06:15 - 06:16

它下方说

06:16 - 06:19

是的 这个图片是来自于这个十二门徒

06:19 - 06:21

就是澳大利亚维州的这个十二门徒景点

06:21 - 06:23

那说明它是没错的

06:23 - 06:24

我们现在是本地使用的

06:24 - 06:25

这还是挺厉害的

06:25 - 06:28

当然你可以上传文档或者图片都可以

06:28 - 06:30

这个根据情况去选择就可以了

06:30 - 06:31

同时我们可以用它来辨别图片

06:31 - 06:32

比如问它一下

06:32 - 06:35

这张图片是真人拍摄还是AI生成的

06:35 - 06:36

问它一下

06:36 - 06:37

我们可以把这个网断开

06:37 - 06:40

来测一下它断网以后到底行不行

06:40 - 06:42

看它是不是真的是离线使用的

06:42 - 06:45

好 断开以后我们点击对话一下

06:45 - 06:46

来看它行不行

06:46 - 06:47

它总共需要8秒钟就可以了

06:47 - 06:48

速度非常快

06:48 - 06:49

它立马出来了

06:49 - 06:51

它说这张图片是通过AI生成的

06:51 - 06:52

大家看一下

06:52 - 06:55

它知道这个这张图片生成的参数

06:55 - 06:56

这个速度非常快

06:56 - 06:59

我们可以让它提供一下这张图片生成的提示词

06:59 - 07:00

我们来试一下

07:00 - 07:02

最后我们点击对话

07:02 - 07:04

只需要7秒钟就可以完成了

07:04 - 07:06

这个速度相当给力

07:06 - 07:07

大家看一下

07:07 - 07:09

它立马就可以完成了

07:09 - 07:11

这是它生成图片的提示词

07:11 - 07:13

然后下方这里的话就是文生图功能

07:13 - 07:14

我们现在来测试一下

07:14 - 07:16

使用的话就非常简单

07:16 - 07:18

我们只需要在上方这里输入提示词

07:18 - 07:20

当然这个提示词的话最好是输英文的

07:20 - 07:21

它对英文识别比较好

07:21 - 07:23

最后我们点击生成

07:23 - 07:24

来看看生成结果怎么样

07:24 - 07:25

好 只要稍等一会

07:25 - 07:27

它立马就可以生成完成

07:27 - 07:29

目前它总共会生成5张图片

07:29 - 07:30

供我们选择

07:30 - 07:32

大家看一下这个效果

07:32 - 07:34

因为我的提示词用的非常简单

07:34 - 07:35

总共就4个单词

07:35 - 07:36

这个小猫在鱼缸里

07:36 - 07:38

当它生成完成以后

07:38 - 07:39

最后我们点击上方下载

07:39 - 07:40

download 下来就可以了

07:40 - 07:42

当然如果你需要自定义这个图片质量

07:42 - 07:44

或者是这个其它的参数的话

07:44 - 07:46

那么在下方这里应该自行填写

07:46 - 07:49

最后点击生成就可以了

07:49 - 07:51

大家看一下生成5张图片的话

07:51 - 07:54

它大概需要198秒左右才可以完成

07:54 - 07:55

好 现在我们来看一下

07:55 - 07:56

它现在生成完成了

07:56 - 07:58

总共是5张图片

07:58 - 08:01

大家看这效果还是可以的

08:01 - 08:03

用它来识别图片中的计算公式

08:03 - 08:04

也不在话下

08:04 - 08:06

只需要几秒钟就可以快速搞定

08:06 - 08:08

而且它还有一个非常实用的对接功能

08:08 - 08:12

就是它可以直接调用摄像头来获取实况

08:12 - 08:14

因为这个项目它是开源的

08:14 - 08:15

所以它如果落实到本地应用

08:15 - 08:18

那么它的实用性确实是非常强的

08:18 - 08:19

比如现在目前已经推出的

08:19 - 08:21

或者未来即将发布的一些AI眼镜

08:21 - 08:24

那么它未来可利用的范围就非常广

08:24 - 08:27

最关键的是它是完全免费开源的

08:27 - 08:28

人人都可以拿来用

08:28 - 08:29

最后需要说明下的是

08:29 - 08:32

如果你退出以后又该如何重新启动呢

08:32 - 08:33

方法我已经提供了

08:33 - 08:35

到时你只需要重新进入到CMD终端下

08:35 - 08:37

然后输入这个激活命令

08:37 - 08:38

就激活虚拟环境

08:38 - 08:40

然后通过第二个命令进入到安装目录下

08:40 - 08:42

最后来执行启动就可以了

08:42 - 08:43

第一个启动的话

08:43 - 08:45

它可能是没有调用GPU的

08:45 - 08:46

下方这个启动命令的话

08:46 - 08:49

它是可以强行调用这个GPU的

08:49 - 08:50

速度会更快一点

08:50 - 08:52

当然如果你电脑硬件过低

08:52 - 08:53

或者你的显卡不支持的话

08:53 - 08:55

那么我们可以通过在线平台进行使用

08:55 - 08:56

也是可以的

08:56 - 08:58

到时重新回到刚才帖子下

08:58 - 09:00

在下方这里我提供了这个免费链接

09:00 - 09:01

我们点击前往

09:01 - 09:02

打开以后可以看到

09:02 - 09:04

它是托管到Hugging Face上的

09:04 - 09:05

用的是共享GPU

09:05 - 09:07

功能也是完全一样的

09:07 - 09:09

只不过当在线人多的时候

09:09 - 09:10

它可能会比较卡

09:10 - 09:11

上方这个是多模态

09:11 - 09:13

下方这个是文生图功能

09:13 - 09:16

功能跟我们本地部署以后是一模一样的

09:16 - 09:17

好 今天视频所用的全部资料

09:17 - 09:19

它们的下载链接

09:19 - 09:21

我都会放在视频下方还有零度博客上

09:21 - 09:22

最后祝大家新年快乐!

Deploying DeepSeek Janus Pro 7B AI Multimodal Model: A Step-by-Step Guide

In the realm of open-source AI models, DeepSeek Janus Pro 7B has emerged as a powerhouse, outperforming the likes of OpenAI's DALL-E3 and StableDiffusion text-to-image models. If you're keen on exploring this cutting-edge technology, follow the detailed guide below to locally deploy and run DeepSeek Janus Pro 7B.

Checking and Installing Prerequisites: Git and Conda Environment

First things first, ensure that you have Git and Conda environments set up on your computer. You can verify this by opening the command prompt and checking the Git version using the command Git -v. If Git is not installed, download it from the official website. Similarly, check the Conda version by running conda -version command.

Creating Virtual Environment and Cloning the Janus Pro Project

Next, create a virtual environment by running the appropriate command. Once done, activate the virtual environment. Now, proceed to pull the Janus Pro project from the GitHub repository. If you encounter any issues, reinstall Git, ensuring it's added to the environment variables.

Installing Dependencies and User Interface

After cloning the project, navigate to the Janus root directory, install the necessary dependencies, and set up the UI interface using Gradio. This step will enable you to interact with the AI model through a user-friendly interface.

Running the Janus Pro Model Locally

Once the setup is complete, run the Janus Pro model by executing the provided command. This process includes downloading the model files, which may take some time due to the large size. Ensure your computer has sufficient disk space for the model files.

Testing Multimodal Visual and Text-to-Image Features

With the Janus Pro model up and running, you can now explore its capabilities. Utilize the multimodal visual feature to recognize images and the text-to-image function to generate images based on provided prompts. Additionally, test its ability to differentiate between real and AI-generated images.

Leveraging the Power of DeepSeek Janus Pro 7B

DeepSeek Janus Pro 7B offers a myriad of applications, from image recognition to real-time camera integration. Its seamless integration with various devices, including upcoming AI glasses, showcases its versatility. Moreover, being open-source and free for all users, it democratizes access to advanced AI technology.

In conclusion, deploying DeepSeek Janus Pro 7B locally opens up a world of possibilities. Whether generating images, recognizing complex patterns, or interfacing with live feeds, the model's potential is limitless. Happy exploring and embracing the future of AI technology!

Remember: For future use, follow the provided steps to restart the model in case of shutdown. Feel free to access the model online if hardware limitations hinder local deployment. Wishing you a Happy New Year filled with endless AI innovations!

References and Download Links can be found below the video.