Porn Data Anaylize — Spark安装

spark默认使用的Python版本为2,可以修改.bashrc文件让spark默认使用python3。修改.bashrc增加如下行:

# anaconda
export ANACONDA_HOME=/home/dbuser/anaconda3/
export PATH=$ANACONDA_HOME:$PATH
# spark
export PYSPARK_PYTHON=/home/dbuser/anaconda3/bin/python3

然后重新启动pyspark就是3了,anaconda下的python文件版本也是2。

如果要用jupyter的方式运行spark,可以通过anaconda来完成,安装完成后使用本地端口没有问题,但是如果要配置允许远程访问以及设置访问密码,需要运行:

jupyter notebook --generate-config

不过如果直接运行和可能会提示:

/bin/bash: jupyter: command not found

这是因为anaconda的bin目录没有加入path,可以通过将/home/dbuser/.local/bin目录加入.bashrc 或者直接通过全路径运行。

!/home/dbuser/.local/bin/jupyter notebook --generate-config

在生成的配置文件中加入如下几行:

c.NotebookApp.ip="*"
c.NotebookApp.allow_remote_access=True
c.NotebookApp.open_browser=False
# passwor=whoami
c.NotebookApp.password="argon2:$argon2id$v=19$m=10240,t=10,p=8$2fROaofTc+MXONw9BE6PxA$6P3Hf4PWBnAWC0dYDn10Cg"

然后执行如下命令即可远程访问jupyter notebook:

export PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark

☆版权☆

* 网站名称:obaby@mars
* 网址:https://lang.ma/
* 个性:https://oba.by/
* 本文标题: 《Porn Data Anaylize — Spark安装》
* 本文链接:https://www.danteng.me/2020/08/7366
* 短链接:https://oba.by/?p=7366
* 转载文章请标明文章来源,原文标题以及原文链接。请遵从 《署名-非商业性使用-相同方式共享 2.5 中国大陆 (CC BY-NC-SA 2.5 CN) 》许可协议。


You may also like

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注