我在HDFS中有大约1500个XML文件,每个文件大约2-3 3Gb。我需要编写一个python脚本来解析XML文件来执行MapReduce。然而,我在使用python访问HDFS中的文件时遇到了问题。
我尝试了以下脚本,但收到一个错误。
from snakebite.client import Client
def connection():
hadoop_client = Client('HDFS_hostname', 'HDFS_port', use_trash=False)
for x in hadoop_client.ls(['/']):
print(x)以下是错误:
Traceback (most recent call last):
File "/home/ubuntu/PycharmProjects/textmining/read_data_from_HDFS.py", line 5, in <module>
from snakebite.client import Client
File "/usr/local/lib/python3.6/dist-packages/snakebite/client.py", line 1473
baseTime = min(time * (1L << retries), cap);
^
SyntaxError: invalid syntax使用python从HDFS访问文件的最佳推荐方式是什么?
发布于 2020-04-07 20:42:09
pip install snakebite-py3 这将帮助你解决这个问题...
发布于 2019-01-22 21:30:10
我遇到了同样的问题。蛇咬伤不能与python 3.x兼容,你可以在python 2中使用它。
https://stackoverflow.com/questions/53600582
复制相似问题