Python连接presto

黎东
L、先森
2019-01-18 0 6800

如果要使用Python来连接Presto,就需要相关的驱动包。
目前发现有两个驱动包,分别是:
pyhive : https://github.com/dropbox/PyHive
presto-python-client : https://github.com/prestodb/presto-python-client

下面就简单介绍一下怎么用pyhive来连接presto

安装pyhive

pip3 install sasl
pip3 install thrift
pip3 install thrift-sasl
pip3 install PyHive

安装pyhive后,就可以执行下面的代码

from sqlalchemy import *
from sqlalchemy.engine import create_engine
from sqlalchemy.schema import *
import pandas as pd
# Presto
engine = create_engine('presto://192.168.104.120:9111/hive/myhive')  # host是服务器ip,port是端口,hive指的是Presto的catalog,my_schema是hive的schema。
df = pd.read_sql("select * from employee",engine) # 和一般pandas从数据库中读取数据无任何区别,分析师们应该非常熟悉了。
print(df)


大数据